java poi解析word的方法
时间:2021-03-13 09:49:39|栏目:JAVA代码|点击: 次
之前做过用java读取word文档,获取word文本内容。
但发现docx的支持,doc就异常了。
后来找了很多资料发现是解析方法不一样。
首先要导入poi相关的jar包
我用的是maven,pom.xml引入如下:
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>3.8</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>3.8</version>
</dependency>
java获取word文本内容如下:
public BaseResp getParsedTxt(MultipartFile file) throws Exception {
BaseResp br=new BaseResp("200","") ;
String textType = file.getContentType();
String txt = "";
if(textType.equals(TXT_TYPE)){
String code = getCharset(file);
txt = new String(file.getBytes(),code);
}else if(textType.equals(DOC_TYPE)){
HWPFDocument doc = new HWPFDocument(file.getInputStream());
Range rang = doc.getRange();
txt = rang.text();
System.out.println(txt);
}else if(textType.equals(DOCX_TYPE)){
File uFile = new File("tempFile.docx");
if(!uFile.exists()){
uFile.createNewFile();
}
FileCopyUtils.copy(file.getBytes(), uFile);
OPCPackage opcPackage = POIXMLDocument.openPackage("tempFile.docx");
POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);
txt= extractor.getText();
uFile.delete();
}else{
br = new BaseResp("300","上传文件格式错误,请上传.txt或者.docx");
return br;
}
br.setDatas(txt);
return br;
}
功能实现了。
上一篇:Java实现的按照顺时针或逆时针方向输出一个数字矩阵功能示例
栏 目:JAVA代码
下一篇:SpringCloud Feign参数问题及解决方法
本文标题:java poi解析word的方法
本文地址:http://www.codeinn.net/misctech/80002.html


阅读排行
- 1Java Swing组件BoxLayout布局用法示例
- 2java中-jar 与nohup的对比
- 3Java邮件发送程序(可以同时发给多个地址、可以带附件)
- 4Caused by: java.lang.ClassNotFoundException: org.objectweb.asm.Type异常
- 5Java中自定义异常详解及实例代码
- 6深入理解Java中的克隆
- 7java读取excel文件的两种方法
- 8解析SpringSecurity+JWT认证流程实现
- 9spring boot里增加表单验证hibernate-validator并在freemarker模板里显示错误信息(推荐)
- 10深入解析java虚拟机




