java实现读取word文件、读取表格--粉丝服务平台-粉丝头条-fensifuwu.com

java实现读取word文件、读取表格

科技 08-19 来源：从事java的小白

一、导入相关的依赖包

    org.apache.poi    poi-scratchpad    3.17

三、实现相应的工具类

import org.apache.poi.hwpf.extractor.WordExtractor;import org.springframework.util.StringUtils;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStream;public class Wordutil {    public static void main(String[] args) throws Exception {        Wordutil wordutil=new Wordutil();        wordutil.testReadByExtractor("/xxxx/xxxx/xxxxxxxxxx.doc);    }    public void testReadByExtractor(String absolutePath) throws Exception {        InputStream is = new FileInputStream(absolutePath);        WordExtractor extractor = new WordExtractor(is);        //获取各个段落的文本,这种适合简单的文本格式        String paraTexts[] = extractor.getParagraphText();        for (int i=0; i


三、如果是表格形式的需要根据是docx版本或者是doc版本使用XWPFDocument，以及HWPFDocument进行读取相应的文件，word文档中表格的读取，如果是用模板.ftl文件导出的word，无法进行相应的读取，需要重新将文件进行另存为，然后再一次读取。
其中需要的依赖包
org.apache.poipoi4.1.0org.apache.poipoi-ooxml4.1.0org.apache.poipoi-ooxml-schemas4.1.0
四、代码的实现
import org.apache.poi.hwpf.HWPFDocument;import org.apache.poi.hwpf.usermodel.*;import org.apache.poi.poifs.filesystem.POIFSFileSystem;import org.apache.poi.xwpf.usermodel.XWPFDocument;import org.apache.poi.xwpf.usermodel.XWPFTable;import org.apache.poi.xwpf.usermodel.XWPFTableCell;import org.apache.poi.xwpf.usermodel.XWPFTableRow;import org.springframework.util.StringUtils;import java.io.FileInputStream;import java.util.Iterator;import java.util.List;/** * word文档中表格的读取，如果是用模板.ftl文件导出的word，无法进行相应的读取， * 需要将word文档另存为 */public class DocTableReadUtil {/** * 读取文档中表格 */public static String getWord(String filePath) {    String wordContent = "";    String tmpWord = "";//报告录入人:    录入时间:    try {        FileInputStream in = new FileInputStream(filePath);//载入文档        // 处理docx格式 即office2007以后版本        if (filePath.toLowerCase().endsWith("docx")) {            //word 2007 图片不会被读取， 表格中的数据会被放在字符串的最后            XWPFDocument xwpf = new XWPFDocument(in);//得到word文档的信息            Iterator it = xwpf.getTablesIterator();//得到word中的表格            // 设置需要读取的表格 set是设置需要读取的第几个表格，total是文件中表格的总数            int set = 4;            // 过滤前面不需要的表格            for (int i = 0; i < set - 1; i++) {                it.hasNext();                it.next();            }            while (it.hasNext()) {                XWPFTable table = it.next();                List rows = table.getRows();                //读取每一行数据                String tableTxt = "";                for (int i = 0; i < rows.size(); i++) {                    XWPFTableRow row = rows.get(i);                    String rowTxt = "";                    //读取每一列数据                    List cells = row.getTableCells();                    for (int j = 0; j < cells.size(); j++) {                        XWPFTableCell cell = cells.get(j);                        //输出当前的单元格的数据                        //输出结果-------------                    }                }            }        } else {            // 处理doc格式 即office2003版本            POIFSFileSystem pfs = new POIFSFileSystem(in);            HWPFDocument hwpf = new HWPFDocument(pfs);            Range range = hwpf.getRange();//得到文档的读取范围            TableIterator it = new TableIterator(range);            // 迭代文档中的表格            // 如果有多个表格只读取需要的一个 set是设置需要读取的第几个表格，total是文件中表格的总数            int set = 4;            for (int i = 0; i < set - 1; i++) {                it.hasNext();                it.next();            }            while (it.hasNext()) {                Table tb = it.next();                //迭代行，默认从0开始,可以依据需要设置i的值,改变起始行数，也可设置读取到那行，只需修改循环的判断条件即可                String table = "";                for (int i = 0; i < tb.numRows(); i++) {                    TableRow tr = tb.getRow(i);                    //迭代列，默认从0开始                    String row = "";                    for (int j = 0; j < tr.numCells(); j++) {                        TableCell td = tr.getCell(j);//取得单元格                        //取得单元格的内容                        for (int k = 0; k < td.numParagraphs(); k++) {                            Paragraph para = td.getParagraph(k);                            String s = para.text();                            //输出结果-------------                        }                    }                }            }        }    } catch (Exception e) {        //初始化时，处理是否将word转化为html的标签，存入数据库中，如果出现异常抛出        e.printStackTrace();    }    return wordContent;}}
             
                 
               
                
                    
                  支付宝打赏 
                 
                 
                
                    
                  微信打赏 
                 
            
             表格   文件   java 
            
			


            
            发表评论
            
              


留言与评论（共有 0 条评论）
“”











   


验证码：


          
          
            相关文章
            
              
                   
                   java学习22天 
                
              

                   
                   Django 4.x File文件上传使用示例 
                
              

                   
                   java短信验证平台_JAVA实现利用第 
                
              

                   
                   用手机怎么直接打印微信文件 
                
              

                   
                   pikachu靶场文件包含通关记录 
                
              

                   
                   长春高新闪崩跌停 浙江省集采部门


         
      
        
          
          
                          
              网友投稿  普通会员 
                        我还没有学会写个人说明
            
              
                1976819 篇文章
                
                                74034056 次浏览
              
            
          
          
            最近文章
                        那天上课，我发现女同桌竟将手机调成震动夹在大腿根处 
                        男孩去观摩跳伞却遇飞机失控  父亲狂奔1英里从残骸中徒手挖出儿子 
                        街头刷卡就能领到步枪？“共享”时代只有想不到没有做不到 
                        6旬老人遭入室抢劫后死亡，歹徒唱着歌离去，因证据不足未被定罪 
                        梅根父亲因心脏手术无法参加女儿婚礼 懊恼抱怨：都怪儿子添堵 
                        外交部：望朝韩双方尊重彼此合理关切相向而行 
                        川航史诗级迫降引爆外媒 外国网友隔空打cal 
                        外交部回应“朝鲜中止北南高级别会谈” 
                        在印度未婚女性使用手机，后果有多严重？ 
                        每年导致50多万人死亡！ 世卫：拟五年内全球停用人造反式脂肪 
                      
        
        
          
            推荐文章
          
           
            
                          
          
          
        
        
        
        
        
          
            最热点击文章
          
           
            
                            
                    
                 
                  OPPO k1的低价高配真实么？网友：不看不知道                   
              
                            
                    
                 
                  《心跳文学部》是一款什么样的游戏，为什么在国内被禁？                   
              
                            
                    
                 
                  一招教你手机无限制成为一台新设备                   
              
                            
                    
                 
                  摧毁自尊、驯化成宠物，男子操控女友致其抑郁自杀，背后竟是……                   
              
                            
                    
                 
                  让马化腾无言以对：问倒微保客服，揭穿蒙蔽外行人的保险“骗局”                   
              
                            
                    
                 
                  有一款带显示屏的钢琴                   
              
                            
                    
                 
                  时至今日，骁龙660还够不够用？——A9Star性能篇                   
              
                            
                    
                 
                  为什么拼多多上面的手机要比官网便宜很多，这几个原因一针见血                   
              
                          
          
          
        
        
          
            热门标签
          
          
            
              
                                [db:关键字]
                                中国
                                自己的
                                美国
                                都是
                                的是
                                的人
                                三星
                                手机
                                华为
                                这款
                                车型
                                小米
                                日本
                                俄罗斯
                                亿元
                                万元
                                荣耀
                                疫情
                                游戏



 

  
    
      
        
          
            
            
                
               
             
             
            
            
             
            
            
            
          
        
      
      
        
           关于我们 联系我们 广告合作 
          Copyright © 2013-2022 粉丝服务平台-粉丝头条-fensifuwu.com