WordExtractor

使用POI读写word doc文件

拟墨画扇 提交于 2020-01-09 14:12:46
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> Apache poi的hwpf模块是专门用来对word doc文件进行读写操作的。在hwpf里面我们使用 HWPFDocument 来表示一个word doc文档。在HWPFDocument里面有这么几个概念: l Range :它表示一个范围,这个范围可以是整个文档,也可以是里面的某一小节(Section),也可以是某一个段落(Paragraph),还可以是拥有共同属性的一段文本(CharacterRun)。 l Section :word文档的一个小节,一个word文档可以由多个小节构成。 l Paragraph :word文档的一个段落,一个小节可以由多个段落构成。 l CharacterRun :具有相同属性的一段文本,一个段落可以由多个CharacterRun组成。 l Table :一个表格。 l TableRow :表格对应的行。 l TableCell :表格对应的单元格。 Section、Paragraph、CharacterRun和Table都继承自Range。 1 读word doc文件 在日常应用中,我们从word文件里面读取信息的情况非常少见,更多的还是把内容写入到word文件中。使用POI从word doc文件读取数据时主要有两种方式:通过 WordExtractor