【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>>
PDF到Excel的转换是当今的一种常见做法,特别是当你需要需要将表格数据从PDF文档导出到Excel电子表格时。在处理大量文档时,手动将数据从PDF复制/导出到Excel可能是一项耗时的工作。那么,为什么不自动化该过程并最大程度地减少时间和精力呢?
接下来,我们将学习如何使用Aspose.PDF在.NET中使用C#以编程方式将PDF转换为Excel常用格式。很高兴的是,Aspose.PDF已经迎来2020第一次更新,增强了多项功能,如果你还没有升级Aspose.PDF最新版测试,可以点击这里下载。
在本文中,我们将使用Aspose.PDF在C#中执行以下PDF到Excel的转换:
- 将PDF转换为XLS格式。
- 将PDF转换为XLSX格式。
- 在转换后的Excel工作表中插入空白的第一列。
- 最小化转换后的Excel电子表格中的工作表数量。
①在C#中将PDF转换为XLS
为了将PDF文档转换为XLS电子表格,可以简单地加载PDF文件并以“ .xls”扩展名保存。下面的代码示例演示如何使用C#将PDF转换为XLS格式的Excel。
// Load PDF document Document pdfDocument = new Document("sampletable.pdf"); ExcelSaveOptions options = new ExcelSaveOptions(); // Save output file pdfDocument.Save("Excel.xls", options);
PDF文件
转换后的Excel文档
![](https://www.eimg.top/images/2020/03/27/ba19917623e1ef2d1e8ab6610cae0dff.png)
②在C#中将PDF转换为XLSX
默认情况下,Aspose.PDF将PDF文档转换为XLS格式。如果要获取转换后的XLSX格式的Excel电子表格,则可以使用ExcelSaveOptions类进行指定。下面的代码示例演示如何使用C#将PDF文档转换为XLSX格式的Excel。
// Load PDF document Document pdfDocument = new Document("sampletable.pdf"); // Initialize ExcelSaveOptions ExcelSaveOptions options = new ExcelSaveOptions(); // Set output format options.Format = ExcelSaveOptions.ExcelFormat.XLSX; // Save output file pdfDocument.Save("Excel.xlsx", options);
③使用空白的第一列将PDF转换为Excel
我们也可以在转换后的Excel电子表格中插入空白的第一列。可以使用ExcelSaveOptions.InsertBlankColumnAtFirst选项完成此操作,如以下代码示例所示。
// Load PDF document Document pdfDocument = new Document("sampletable.pdf"); // Initialize ExcelSaveOptions ExcelSaveOptions options = new ExcelSaveOptions(); // Set output format options.Format = ExcelSaveOptions.ExcelFormat.XLSX; // To insert blank column as first column to the Worksheet options.InsertBlankColumnAtFirst = true; // Save output file pdfDocument.Save("Excel.xlsx", options);
④以最少的工作表数量将PDF转换为Excel
默认情况下,输入PDF文档中的每个页面都将转换为单独的工作表。对于具有许多页面的大型PDF文档,转换后的Excel电子表格还将包含许多工作表。在这种情况下,我们可以使用ExcelSaveOptions.MinimizeTheNumberOfWorksheets选项自定义PDF到Excel的转换,并最小化转换后的电子表格中的工作表数。
下面的代码示例演示如何使用C#将PDF到Excel转换中的工作表数量减少到最少:
// Load PDF document Document pdfDocument = new Document("sampletable.pdf"); // Initialize ExcelSaveOptions ExcelSaveOptions options = new ExcelSaveOptions(); // Set output format options.Format = ExcelSaveOptions.ExcelFormat.XLSX; // Minimize number of Worksheets options.MinimizeTheNumberOfWorksheets = true; // Save output file pdfDocument.Save("Excel.xlsx", options);
来源:oschina
链接:https://my.oschina.net/u/4087915/blog/3153984