此经验内容介绍如何来获取Word文本框中包含的表格。
工具/原料
Free Spire.Doc for Java(免费版)
工具获取及jar导入:
1、jar导入,可通过创建怡觎现喾Maven程序项目,并在pom.xml中配置Maven仓库路径,并指定Free Spire.Doc for Java的Maven依赖,盼内溲铫点击“Import Changes”即可导入JAR包。(如果使用的Eclipse, 点击保存按钮导入),配置如下:<repositories> <repository> <id>com.e-iceblue</id> <url>http://repo.e-iceblue.cn/repository/maven-public/</url> </repository></repositories><dependencies> <dependency> <groupId>e-iceblue</groupId> <artifactId>spire.doc.free</artifactId> <version>2.7.3</version></dependency></dependencies>导入效果:
2、Word测试文档如下,包含一个表格:
Java代码示例
1、import com.spire.doc.*; import com.spire.doc.documents.Paragraph; import com.spire.doc.fields.T髫潋啜缅extBox; import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; public class ExtractTable { public static void main(String[]args) throws IOException { //加载Word测试文档 Document doc = new Document(); doc.loadFromFile("test.docx"); //获取第一个文本框 TextBox textbox = doc.getTextBoxes().get(0); //获取文本框中第一个表格 Table table = textbox.getBody().getTables().get(0); //保存文本 String output = "EtractTableFromTextbox.txt"; File file = new File(output); if (!file.exists()) { file.delete(); } file.createNewFile(); FileWriter fw = new FileWriter(file, true); BufferedWriter bw = new BufferedWriter(fw); //遍历表格中的段落并提取文本 for (int i = 0; i < table.getRows().getCount(); i++) { TableRow row = table.getRows().get(i); for (int j = 0; j < row.getCells().getCount(); j++) { TableCell cell = row.getCells().get(j); for (int k = 0; k < cell.getParagraphs().getCount(); k++) { Paragraph paragraph = cell.getParagraphs().get(k); bw.write(paragraph.getText() + "\t"); } } bw.write("\r\n"); } bw.flush(); bw.close(); fw.close(); } }
2、表格读取结果: