您的位置 首页 > 数码极客

java如何处理大文件上传、JAVA实现文件上传


最近在做web网盘的系统,网盘最基本的功能便是文件上传,但是文件上传当遇到大文件的时候,在web端按传统方式上传简直是灾难,所以大文件上传可以采用分片上传的办法。其主要思路是:1.大文件上传时进行分片;2.分片上传;3.对分片文件进行合并。

思路比较清晰简单,但一些问题在于:1.大文件如何进行分片?2.分片如何进行记录和存储?3.如何校验每个分片文件的唯一性和顺序性?4.如何合并文件?

对于大文件如何分片,这个主要是在前端进行解决,在这里推荐大家用百度的WebUploader来实现前端所需。

对于对分片之后的文件进行存储的问题,我采用了临时文件存储的办法,临时文件存储着每个分块对应字节位的状态。

对于分片文件的区分,这里可以采用MD5码的方式(不清楚MD5码的可以先查一下),MD5码简单理解就像每个文件的身份证一样,每个不同的文件都有自己唯一的MD5码。

对于合并文件的时候,前端在对文件分片之后,在请求服务端合并的时候,请求中要带上分片序号和大小,服务器按照请求数据中给的分片序号和每片分块大小算出开始位置,与读取到的文件片段数据,写入文件即可。这里合并后的文件会存储俩个路径,一个是当前网盘目录下的路径,一个是真实的永久路径(目的是为了实现秒传的功能)。

前端分片的代码就不贴了,主要用的百度的WebUploader。

这里主要贴一些服务端的主要的代码

文件上传

/**

* 上传文件

*

* @param file 文件

* @param wholeMd5 文件整体md5码

* @param name 文件名

* @param type 文件类型

* @param lastModifiedDate 上传时间

* @param size 文件大小

* @param chunks 文件分块数

* @param chunk 正在执行的块

*/

@ApiOperation(value = "文件上传", hidden = true)

@IgnoreUserToken

@ApiResponses({

@ApiResponse(code = 500, response = Re, message = "错误")

})

@PostMapping(value = "upload")

public ResponseEntity<Integer> fileUpload(@ApiParam(name = "文件") @RequestPart MultipartFile file,

@ApiParam(name = "md5") @RequestParam String wholeMd5,

@ApiParam(name = "名称") @RequestParam String name,

@ApiParam(name = "类型") @RequestParam String type,

@ApiParam(name = "日期") @RequestParam Date lastModifiedDate,

@ApiParam(name = "大小") @RequestParam long size,

@ApiParam(name = "开始位置") @RequestParam long start,

@ApiParam(name = "结束位置") @RequestParam long end,

@ApiParam(name = "总分块数") @RequestParam(name = "chunks", defaultValue = "1") int chunks,

@ApiParam(name = "第几个分块,从0开始") @RequestParam(name = "chunk", defaultValue = "0") int chunk) {

try {

log.info("文件开始上传");

(), wholeMd5, name, type, lastModifiedDate, size, chunks, chunk, start, end);

return Re(1);

} catch (Exception e) {

return new ResponseEntity()).toString(), H);

}

}


@Override

public boolean fileUpload(InputStream fileIS,

String wholeMd5,

String name, String type,

Date lastModifiedDate, long size,

int chunks,

int chunk,

long start,

long end) throws Exception {

boolean result = false;

try {

File tempDirFile = new File(fileDir, TEMP_DIR);

if (!()) {

();

}

// 块目录文件夹

File wholeMd5FileDirectory = new File(), wholeMd5);

if (!w()) {

w();

}

// 块文件

File chunkFile = new File(), chunk + FILE_SEPARATOR + chunks + FILE_EXT);

long chunkSize = end - start;

if (!c() || c() != chunkSize) {

// 创建新的块文件

long startTime = Sy();

log.info("创建建分片{} - {} ", start, end);

int length = S(fileIS, new FileOutputStream(chunkFile));

long endTime = Sy();

log.info("分片上传耗时{}毫秒", (endTime - startTime));

if (length == (end - start)) {

result = true;

}

}

} catch (Exception e) {

log.error("文件上传出错{}", e.getCause());

e.printStackTrace();

throw e;

}

return result;

}


检查文件的MD5

/**

* 检查文件的md5

*

* @param md5 文件md5

* @param fileSize 文件大小

* @return

*/

@ApiOperation(value = "检查文件的md5")

@GetMapping(value = "checkFileMd5/{md5}/{fileSize}/{md5CheckLength}")

@ApiResponses({

@ApiResponse(code = 500, response = Re, message = "错误")

})

public ResponseEntity<Integer> checkFileMd5(@ApiParam("文件md5码") @PathVariable String md5,

@ApiParam("文件大小") @PathVariable long fileSize,

@ApiParam("文件用来检查md5的长度") @PathVariable long md5CheckLength) {

try {

log.info("开始检验md5[{}],是否存在", md5);

return Re(md5, fileSize, md5CheckLength) ? 1 : 0);

} catch (Exception e) {

return new ResponseEntity()).toString(), H);

}

}


@Override

public boolean checkFileMd5(String md5, long fileSize, long md5CheckLength) {

Optional<UploadFileInfo> uploadFileInfo = (md5, fileSize);

boolean isExist = false;

if ()) {

File wholeFile = new File, u().getDfsPath());

if () && w() == fileSize && md5.equal(wholeFile, 0, md5CheckLength))) {

isExist = true;

}

}

log.info("{}的文件{}存在", md5, isExist ? "" : "不");

return isExist;

}

检查分片是否存在

/**

* 检查分片是否存在

*

* @param md5

* @param chunk

* @param chunks

* @param chunkStart

* @param chunkEnd

* @return

*/

@ApiOperation(value = "检查分片是否存在")

@ApiResponses({

@ApiResponse(code = 500, response = Re, message = "错误")

})

@GetMapping(value = "checkChunk/{md5}/{blockMd5}/{md5CheckLength}/{chunk}/{chunks}/{chunkStart}/{chunkEnd}")

public ResponseEntity<Integer> checkChunk(@ApiParam("文件md5码") @PathVariable String md5,

@ApiParam("分块文件md5码") @PathVariable String blockMd5,

@ApiParam("用来检测分块文件md5码的长度") @PathVariable long md5CheckLength,

@ApiParam("第几个分块,从0开始") @PathVariable int chunk,

@ApiParam("总分块数") @PathVariable int chunks,

@ApiParam("分块开始位于的文件位置") @PathVariable long chunkStart,

@ApiParam("分块结束位于的文件位置") @PathVariable long chunkEnd) {

try {

log.info("开始检验分片[{}]-[{}]的md5[{}],是否存在", chunk, chunks, blockMd5);

return Re(md5, blockMd5, md5CheckLength, chunk, chunks, chunkStart, chunkEnd) ? 1 : 0);

} catch (Exception e) {

return new ResponseEntity()).toString(), H);

}

}


@Override

public boolean checkChunk(String md5, String blockMd5, long md5CheckLength, int chunk, int chunks, long chunkStart, long chunkEnd) {

boolean isExist = false;

File chunkFile = new File(fileDir, TEMP_DIR + File.separator + md5 + File.separator + chunk + FILE_SEPARATOR + chunks + FILE_EXT);

if (c() && c() == (chunkEnd - chunkStart)) {

String calBlockMd5 = FileU(chunkFile, 0, md5CheckLength);

if (calBlockMd5)) {

isExist = true;

}

}

log.info("{}的{}-{}分块{}存在", md5, chunk, chunks, isExist ? "" : "不");

return isExist;

}

合并文件

/**

* 合并文件

*

* @param fileInfo

* @return

*/

@ApiOperation(value = "合并文件", notes = "把分片上传的数据合并到一个文件")

@ApiResponses({

@ApiResponse(code = 500, response = Re, message = "错误")

})

@PostMapping(value = "mergeChunks")

public ResponseEntity<Integer> mergeChunks(@Validated @RequestBody FileInfo fileInfo, BindingResult bindingResult) {

log.info("开始合并文件");

if ()) {

log.error("错误的参数请求");

return new ResponseEntity("错误的参数请求", H);

} else {

try {

DataEntity dataEntity = (fileInfo);

log.info("合并文件完成, 保存的dataEntityId为:{}", dataEntity != null ? da() : null);

return Re(dataEntity != null ? 1 : 0);

} catch (FileMargeException e) {

log.error(), e);

return new ResponseEntity()).toString(), H);

} catch (FileNotAllException e) {

log.error(), e);

return new ResponseEntity()).toString(), H);

} catch (IOException e) {

log.error(), e);

return new ResponseEntity()).toString(), H);

}

}

}


/**

* 合并文件

*

* @param fileInfo

* @return {DataEntity}

* @throws FileNotAllException

* @throws IOException

*/

@Override

public DataEntity mergeChunks(FileInfo fileInfo) throws IOException, FileNotAllException, FileMargeException {

// 先检查库里是否有文件的存记录

Optional<UploadFileInfo> uploadFileInfoOptional = (), ());

log.info("检查文件信息是否在数据库中存在");

UploadFileInfo uploadFileInfo = null;

if ()) {

log.info("文件信息:{}", fileInfo);

uploadFileInfo = u();

}

if (uploadFileInfo == null) {

uploadFileInfo = new UploadFileInfo();

}

//再检查文件是否存在

log.info("检查真实文件");

File wholeFile = new File(getRealFileRoot(), () + FILE_SEPARATOR + ());

if (!w() || w() != ()) {

log.info("文件不存在或者文件长度不符合! }");

if ()) {

log.info("长度为{}!={},", w(), ());

}

File tempDirFile = new File(fileDir, TEMP_DIR + File.separator + ());

try {

if (()) {

log.info("文件分片目录存在");

// 获取该目录下所有的碎片文件

File[] partFiles = ((f, name) -> name.endsWith(FILE_EXT));

log.info("文件分片个数为:", );

if ( > 0) {

Arrays.sort(partFiles, (File f1, File f2) -> {

String name1 = ();

String name2 = ();

if () < name2.length()) {

return -1;

} else if () > name2.length()) {

return 1;

} else {

return name1.compareTo(name2);

}

});

long size = 0;

FileChannel resultFileChannel = new FileOutputStream(wholeFile, true).getChannel();

for (int i = 0; i < ; i++) {

size += partFiles[i].length();

if (size > w()) {

log.info("合并第{}块的文件{}", i, partFiles[i].getName());

// FileU(partFiles[i], wholeFile, size);

FileChannel inChannel = new FileInputStream(partFiles[i]).getChannel();

re(inChannel, re(), inC());

inC();

}

}

if (size < w()) {

log.info("分片文件不完整");

throw new FileNotAllException();

}

}

log.info("删除分片数据信息");

().execute(() -> {

(child -> c());

();

});

}

} catch (Exception e) {

throw new FileMargeException();

}

}

if (uId() == null) {

log.info("保存上传的文件信息");

u());

u());

u());

u(w());

u().substring.length()+1));

(uploadFileInfo);

}

// 文件大小, 应该在合并完成的时候更新

log.info("获取父目录信息");

DataEntity parent = ());

// 如果文件信息里包含文件的相对路径, 就应该创建文件上传的真实目录

String path = ();

if (path)) {

log.info("包含相对目录,进行相对目录的创建");

path = FilenameU(path);

String[] paths = ("/");

for (String tempPath : paths) {

if (tempPath)) {

DataEntity dataEntity = (tempPath, parent, U());

if (dataEntity == null) {

dataEntity = new DataEntity();

da(tempPath);

da(true);

da(parent);

parent = (dataEntity);

} else {

parent = dataEntity;

}

}

}

}

log.info("创建目录信息");

DataEntity dataEntity = new DataEntity();

da(());

da());

da());

da(uploadFileInfo);

da(parent);

da(uSize());

dataEntity = (dataEntity);

(dataEntity);

//判断上传文件的类型,选择调用解析接口

String fileType = ();

if ("images".equals(fileType)||"vector".equals(fileType)||"terrain".equals(fileType)||"original".equals(fileType)) {

String resultInfo = analysis(dataEntity,fileInfo);

log.info("解析结果:"+resultInfo);

}

return dataEntity;

}

关于秒传功能,其实原理就是检验文件MD5,在一个文件上传前先获取文件内容MD5值或者部分取值MD5,然后在查找自己的记录是否已存在相同的MD5,如果存在就直接从服务器真实路径取,而不需要重新进行分片上传了,从而达到秒传的效果。

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“java如何处理大文件上传,JAVA实现文件上传,JAVA文件上传,JAVA,文件上传,JAVA文件上传进度条,JAVA文件上传下载”边界阅读