在日常信息化办公过程中,人们经常利用OCR文字识别软件,通过扫描仪或数码相机检查纸上打印的字符,并通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机数字化文档。但是,在实际应用过程中,绝大多数OCR软件只能识别单一语言,若遇到中文、英文或其他多语言混合时就无法正确 识别,甚至出现天书一样的乱码,此时只有反复变换语言再识别,或将其分割为单一语言再整合成文档,这样不但操作步骤繁琐,而且往往影响工作效率。针对中英文混合识别的问题,小编推荐一款OCR软件— ABBYY FineReader 12。
步骤一:打开ABBYY FineReader 12,点击扫描到Microsoft Word,在扫描仪参数设置对话框中,根据纸质文件内容的复杂程序来决定所需的分辨率、色彩模式、亮度和纸张大小,一般黑白普通文本的分辨率在300dpi以上、色彩模式为灰度;
步骤二:点击工具选项卡中的语言编辑器,在语言编辑器对话框中,从手动指定语言下拉列表中选择简体中文和英语;
步骤三:在工具栏中选择读取,软件将用中英文混合识别方式对左侧扫描后的图像进行分析、读取并进行有效识别,识别后的内容在右侧文本区域进行预览,同时将不确定的内容予以彩色显示,以便进一步检查拼写;
步骤四:在工具栏上,点击保存,将识别及检查后的内容保存为Word文档,以供数字化保存、处理和再修改。
以上就是关于中英文混合识别的问题解决方法了,通过上述内容的描述相信就能帮助大家对于ABBYY FineReader 12这款OCR文字识别软件有了更多的了解。
来源:oschina
链接:https://my.oschina.net/u/2459783/blog/540121