美文网首页
poi 读取word文档中内容

poi 读取word文档中内容

作者: 萍水相逢心愿一生 | 来源:发表于2017-11-27 14:03 被阅读0次

package com.test.document.util;

import java.io.File;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStream;

import org.apache.poi.POIXMLDocument;

import org.apache.poi.POIXMLTextExtractor;

import org.apache.poi.hwpf.extractor.WordExtractor;

import org.apache.poi.openxml4j.opc.OPCPackage;

import org.apache.poi.xwpf.extractor.XWPFWordExtractor;

public class ReadWordUtil {

public static void main(String[] args) throws Exception {

String path = "c:\\Oracle安装和配置.doc";

String context = readWord(path);

System.out.println(context);

}

/**

* 读取word 中文本数据,采用poi读取 poi 版本3.8

*

* @param path

*            word文档路径

* @return

*/

public static String readWord(String path) {

InputStream is = null;

String content = "";

String suffix = path.substring(path.lastIndexOf(".") + 1);

try {

if (suffix.equals("doc")) {

// word 2003: 图片不会被读取

is = new FileInputStream(new File(path));

WordExtractor ex = new WordExtractor(is);// is是WORD文件的InputStream

content = ex.getText().trim();

} else if (suffix.equals("docx")) {

// word 2007 图片不会被读取, 表格中的数据会被放在字符串的最后

OPCPackage opcPackage = POIXMLDocument.openPackage(path);

POIXMLTextExtractor extractor = new XWPFWordExtractor(

opcPackage);

content = extractor.getText().trim();

}

} catch (Exception e) {

e.printStackTrace();

} finally {

if (is != null) {

try {

is.close();

} catch (IOException e) {

e.printStackTrace();

}

}

}

return content;

}

}

相关文章

  • poi 读取word文档中内容

    package com.test.document.util; import java.io.File; impo...

  • POI读取word文档

    最近做了一个word文档导入的功能,但是因为项目紧急,所以做的很粗糙。好不容易周末了,就自己撸了一会代码,想把他做...

  • 读取Word中的表格

    首先在pom.xml中引入POI 编写如下代码即可读取Word中表格的内容,支持合并的单元格

  • 怎么用Java操作Word文档?

    Java操作word文档 Java 操作word,对word文档进行读写时,主要用 Apache写的POI这个工具...

  • iOS--通过webView读取word文档

    通常情况下我们需要读取word文档,在iOS中可以通过webView来读取word文档,相当简单:1.首先在vie...

  • word生成及word转pdf

    生成word文档 word模板转xml ,字符串替换。复杂不可维护。(不推荐) Poi-tl 。Word模板引擎,...

  • 用Qt输出操作Word文档

    利用QT生成Word文档从一个word文件中读取所有的表格和标题(2)

  • JSP 利用Apache POI 操作 Word

    利用Apache POI 操作word, 生成简单的报告文档 先上个效果图: 到Apache下载 POI 需要的相...

  • Linux下使用PHP实现word转html

    最近项目遇到一个需求,网页上传docx文档,将其内容导入到富文本编辑器中。 方案一:phpword读取word内容...

  • 读取word文档

    word文档内容,如下:"啊 我看见一座山 雄伟的大山 真高啊 啊 这座山是! 真的很高!

网友评论

      本文标题:poi 读取word文档中内容

      本文链接:https://www.haomeiwen.com/subject/iqfdbxtx.html