ToB企服应用市场:ToB评测及商务社交产业平台
标题:
Excel文件校验
[打印本页]
作者:
曂沅仴駦
时间:
2022-8-20 16:36
标题:
Excel文件校验
excel文件校验
工作中,经常存在excel文件的导入导出的相关工作,因此正确的文件格式校验成为必须。
不合适的文件校验方式会导致非法文件跳过校验,从而产生不必要的麻烦。
比如,通过文件后缀名的方式进行校验,这种方式其实是存在问题的,因为后缀名可自定义。
正确的校验方式,则应该根据文件流相关属性进行判断。
下面,根据个人工作和参考其他人的经验,逐一进行说明。
一、excel文件两种格式
正常excel存在两种常见的格式,分别是 2003 和 2007格式,
其文件后缀名分别是.xls 和 .xlsx。2007版相对与2003版最大的变动是它的文件格式,使用xml语言的压缩方式,更规范也更适合新的需求。
两种格式,都仍有人在同时使用,我个人推荐 2007 格式。
序号名称后缀名文件格式兼容性12003.xlsbin不向上兼容22007.xlsxxml向下兼容
二、 excel文件校验
2.1 文件后缀名校验
这种方式其实也可以用来校验,但只属于初验。用户通过修改文件后缀名,可以绕过这种校验方式。
比如,demo.txt文件,我们可以强制修改文件后缀名,让它变成demo.xls文件。
通常校验的方式是文件名后缀截取,只截取最后一个. 字符后的内容, 或者使用正则表达式。
2.2 apache poi 3.xx 版本校验excel
处理excel的开源jar包有两个,一个是jxl, 一个是 apache poi,现在主流的是后者。
apache poi 3.xx 版本校验excel跟 4.xx版本存在不同,这里仅就本人遇到的情况进行说明。
这里3.xx版本使用的是3.10.1版本。
引入相关依赖
这里引入了httpcomponentsjar包,为了进行文件类型File -> MultipartFile的转换,毕竟web项目经常使用的是MultipartFile格式的入参文件。
dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>3.10.1</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>3.10.1</version>
</dependency>
<dependency>
<groupId>org.apache.httpcomponents</groupId>
<artifactId>httpclient</artifactId>
<version>4.5.9</version>
</dependency>
<dependency>
<groupId>org.springframework</groupId>
<artifactId>spring-test</artifactId>
<version>5.3.19</version>
<scope>compile</scope>
</dependency>
复制代码
校验方法
package com.lunyu.tools.poi.excel;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.PushbackInputStream;
import org.apache.http.entity.ContentType;
import org.apache.poi.POIXMLDocument;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.springframework.mock.web.MockMultipartFile;
import org.springframework.web.multipart.MultipartFile;
/**
* Excel 校验
* @author lunyu
* @since 2022/6/25
*/
public class ExcelPoi3Main {
public static void main(String[] args) throws IOException {
File file = new File("poi/excel/demo.xls");
FileInputStream fileInputStream = new FileInputStream(file);
//转成MultipartFile
MultipartFile mf = new MockMultipartFile(file.getName(), file.getName(),
ContentType.APPLICATION_OCTET_STREAM.toString(), fileInputStream);
// 执行校验
boolean checkResult = checkExcelValid(mf);
System.out.println("excel = " + file.getName() + "校验结果: " + checkResult);
// TODO: 进一步要做的操作
}
/**
* 检验excel合法性
* @param mf
* @return
* @throws IOException
*/
private static boolean checkExcelValid(MultipartFile mf) throws IOException {
InputStream is = mf.getInputStream();
if(! is.markSupported()) {
is = new PushbackInputStream(is, 8);
}
// 校验excel格式
return POIFSFileSystem.hasPOIFSHeader(is) || POIXMLDocument.hasOOXMLHeader(is);
}
}
复制代码
需要进行说明的是,在3.xx 版本中,POIFSFileSystem.hasPOIFSHeader(InputStream is)方法用于校验excel文件是否符合xls格式,而POIXMLDocument.hasOOXMLHeader(InputStream is)方法则用于校验excel文件是否符合xlsx格式。
2.3 apache poi 4.xx 版本校验excel
同上,我们先引入需要的jar包。
引入相关依赖
dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>4.1.2</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>4.1.2</version>
</dependency>
<dependency>
<groupId>org.apache.httpcomponents</groupId>
<artifactId>httpclient</artifactId>
<version>4.5.9</version>
</dependency>
<dependency>
<groupId>org.springframework</groupId>
<artifactId>spring-test</artifactId>
<version>5.3.19</version>
<scope>compile</scope>
</dependency>
复制代码
编写校验方法
package com.lunyu.tools.poi.excel;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import org.apache.http.entity.ContentType;
import org.apache.poi.EmptyFileException;
import org.apache.poi.poifs.filesystem.FileMagic;
import org.springframework.mock.web.MockMultipartFile;
import org.springframework.web.multipart.MultipartFile;
/**
* Excel 校验
* @author lunyu
* @since 2022/6/25
*/
public class ExcelPoi4Main {
public static void main(String[] args) throws IOException {
File file = new File("poi/excel/demo.txt");
FileInputStream fileInputStream = new FileInputStream(file);
//转成MultipartFile
MultipartFile mf = new MockMultipartFile(file.getName(), file.getName(),
ContentType.APPLICATION_OCTET_STREAM.toString(), fileInputStream);
// 执行校验
boolean checkResult = checkExcelValid(mf);
System.out.println("excel = " + file.getName() + "校验结果: " + checkResult);
// TODO: 进一步要做的操作
}
/**
* 检验excel合法性
* @param mf
* @return
* @throws IOException
*/
private static boolean checkExcelValid(MultipartFile mf) throws IOException {
InputStream is = mf.getInputStream();
is = FileMagic.prepareToCheckMagic(is);
FileMagic fm;
try {
fm = FileMagic.valueOf(is);
}catch (EmptyFileException e) {
System.out.println(e.getMessage());
return false;
}
return FileMagic.OLE2.equals(fm) || FileMagic.OOXML.equals(fm);
}
}
复制代码
4.xx 版本中,方法FileMagic.OLE2.equals(FileMagic fm)用于校验excel是否是xls格式,方法FileMagic.OOXML.equals(FileMagic fm) 用于校验excel是否是xlsx格式。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/)
Powered by Discuz! X3.4