PHP 读取PDF文件内容之PdfParser
PdfParser,一个独立的PHP库,提供了多种工具来从PDF文件提取数据,不支持加密的PDF文件 官方文档: https://www.pdfparser.org/documentation 使用composer安装依赖包: composer require smalot/pdfparser 安装成功后如下图: 创建index.php文件,引入autoload.php文件: include 'vendor/autoload.php'; 1.一次性读取文件中的所有内容: include 'vendor/autoload.php' ; $parser = new \Smalot\PdfParser\Parser(); $pdf = $parser ->parseFile('document.pdf' ); $text = $pdf ->getText(); // 将所有内容读取到一个字符串中 echo $text ; 2.分页读取: include 'vendor/autoload.php' ; $parser = new \Smalot\PdfParser\Parser(); $pdf = $parser ->parseFile('document.pdf' ); $pages = $pdf ->getPages(); // 分页信息 foreach ( $pages as