ABBYY

Incorrect coordinates retrieved from image using ABBYY OCR SDK

非 Y 不嫁゛ 提交于 2019-12-06 08:42:04
I'm trying to process an image using ABBYY OCR SDK using the sample code placed in this question but I'm not able get the co-ordinates right for a specific word say "OCR" on the screenshot below. I want to draw an overlay (yellow rectangle over the word "OCR") and sometimes the rectangle is placed very far away from the actual word. sharptooth The XML you get is synthesised according to this schema . For each recognized character it will contain an instance of charParams element as shown in the answer you linked to . The element will contain the coordinates in page pixels - the same XML also

ABBYY FineReader Engine API Resources [closed]

感情迁移 提交于 2019-12-05 10:02:56
It's difficult to tell what is being asked here. This question is ambiguous, vague, incomplete, overly broad, or rhetorical and cannot be reasonably answered in its current form. For help clarifying this question so that it can be reopened, visit the help center . Closed 7 years ago . Does any one worked with ABBYY FineReader Engine 9.0 API? There are almost no resources available on internet. The only thing is the developer reference help file installed along with it. But that is not sufficient enough. 来源: https://stackoverflow.com/questions/336822/abbyy-finereader-engine-api-resources

怎么实现ABBYY FineReader 中的图像及文字的设置

£可爱£侵袭症+ 提交于 2019-12-04 19:37:40
PDF 是广泛使用的文档格式,在ABBYY Finereader中PDF文档的显示不会因电脑不同而有差异,可加密保护,非常适合在电子存档中进行保存。下面给大家讲解如何在ABBYY Finereader这款 OCR文字识别软件 中设置图像和文字? 图像设置 如果您的文本包含大量图片,或如果您选择将页面图像与已识别文本一起保存,生成的文件可能相当大。如需调节所生成文件的大小和图片的质量,请从图像设置下拉列表中选择选项之一: ● 高(适用于打印) 选择该选项,以保留图片或页面图像的质量。将保留源图像的原始分辨率。 ● 平衡 选择该选项减小 PDF 文件的大小,同时将图片或页面图像的质量保持在合理的级别。 ● 压缩大小 选择该选项以获得小尺寸的 PDF 文件。图片和页面图像的分辨率将减至 150 dpi,这会影响它们的质量。 ● 自定义… 选择该选项,在自定义设置对话框中进行您自己的图片和页面图像设置。 提示:如果您不想在已识别文本中保留图片,请确定未选择保留图片选项。 字体设置 保存文本至 PDF 时,您可以使用机器上安装的 Adobe 字体或 Windows 字体。要指定要使用的字体集,请在下拉列表中选择以下选项之一: ● 使用预定义字体 PDF 文件将使用 Adobe 字体,如 Times New Roman、Arial 和 Courier New。 ● 使用窗口字体 PDF

怎样进行FineReader局域网中的分组工作

随声附和 提交于 2019-12-04 06:17:49
ABBYY FineReader是一款OCR文字识别软件,在进行文本识别时,提供通过网络与其他用户共同处理文档的工具和功能,多个用户可共享相同的用户语言和这些语言的词典,可以使用户词典和语言由多个用户使用,也可以指定文件夹,那么接下来就和大家说明下 ABBYY FineReader 局域网中的分组工作该怎么进行吧。 若有疑问可直接访问: http://www.abbyychina.com/FRshiyongjiqiao/abbyyfr-juyuwangfzgz.html 1、若要使用户词典和语言由多个用户使用: 步骤一:创建或打开ABBYY FineReader文档,然后对该文档选择所需的扫描和OCR选项; 步骤二:指定用来存储用户词典的文件夹,此文件夹应可由所有网络用户访问。 注:默认情况下,用户词典存储 在%Userprofile%\AppData\Roaming\ABBYY\FineReader\12.00 \UserDictionaries中,如果计算机运行的是Windows XP,则默认存储路径为%Userprofile%\Application Data\ABBYY\FineReader\12.00\UserDictionaries。 2、若要指定文件夹: 步骤一:在工具菜单中,点击选项,打开选项对话框,点击高级选项卡,然后点击用户词典按钮; 步骤二:在打开的对话框中

如何在 PDF Transformer+中进行FB2和EPUB转换设置

核能气质少年 提交于 2019-12-04 06:16:53
作为可创建、编辑及将PDF文件转换为其他可编辑格式的通用工具,ABBYY PDF Transformer+为受支持的输出格式提供多种转换设置,选定的转换设置影响生成文档的外观,本文具体为大家讲解ABBYY PDF Transformer+中的FB2和EPUB转换设置。 所谓FB2格式,指的是开放的基于XML的电子图书格式;EPUB指的是电子出版格式。 FB2和EPUB转换设置 选择文件 > 转换为,然后点击FB2/EPUB对话框中的转换设置选项卡,或者在工具栏上点击转换为 > 转换设置…。 以下设置可用: 保留布局 根据计划如何使用输出文档,选择合适的设置。 1、格式化文本 保留段落,但不保留对象的确切位置和行间距。所生成的文本将左对齐(从右向左顺序的文本将右对齐)。 2、纯文本 不包含格式。 使用第一页作为封面 将原始文档的第一页放在电子书籍的封面上。 保存字体和字号 保存原始文档中所用外观和字号。 嵌入字体 将字体嵌入电子书籍。 图片设置 如果文本包含的图片较多,生成的文件将相当大。可使用图片设置(P)下拉列表中的选项调整图片质量和所生成文件的大小。 注意:如果不想保留任何图片,请清除保留图片(E)选项。 更多关于ABBYY PDF Transformer+以及 ABBYY FineReader 12的内容,大家可前往ABBYY中文网以检索您需要的信息。 来源: oschina

如何使用好ABBYY FineReader中的图像压缩

此生再无相见时 提交于 2019-12-03 17:44:53
   ABBYY FineReader 12 是一款非常实用的OCR文字识别软件,在使用ABBYY FineReader保存文档时可以选择图像格式和压缩方法,通过图像压缩可以减小文件的大小,图像压缩方法视压缩率和数据损失而异,选择压缩方法的因素有两个:生成的图像质量和文件大小。   今天主要给大家讲讲ABBYY FineReader允许的压缩方法:   ABBYY FineReader允许使用以下压缩方法:   ?ZIP   避免损失数据,用于包含大量单色部分的图像。   例如:使用这种方法来压缩屏幕截图和黑白图像。   ?JPEG   用于灰色和彩色图像,如照片,这种方法提供高密度的压缩,但会导致数据损失,图像质量较低(轮廓模糊和颜色调色欠佳)。   ?CCITT Group 4   无数据损失,通常用于在图形程序中创建的黑白图像或扫描图像,CCITT Group 4压缩方法被广泛应用于所有图像。   ?Packbits   无数据损失,用于黑白扫描图像。   ?LZW   无数据损失,用于图形和灰色图像。   此外,ABBYY FineReader还可用来压缩PDF文档,打开读取识别扫描的PDF文档之后,再用精确副本的方式保存成PDF文件,保存选项中选中“使用混合式光栅 内容”复选框,可以使文件大小明显缩小,且文字清晰度不会降低,甚至会因为转换过程中去除掉原本PDF图像中的

用户语言该怎么在ABBYY FineReader中创建

女生的网名这么多〃 提交于 2019-12-03 03:34:28
ABBYY FineReader是一款OCR文字识别软件,在识别文本时使用文档语言相关的数据,对于包含很多非常用元素(如代码编号)的文本,程序可能无法识别某些字符,因为文档语言可能没有包含此类字符,要识别此类文档,可创建自定义语言,其中包括了所有需要的字符,也可分配多种语言给语言组,然后使用这些组进行识别,那么我们该如何在 ABBYY FineReader 中创建用户语言。 欲了解更多内容请前往: http://www.abbyychina.com/FRshiyongjiqiao/abbyyfr-cjyonghuyuyan.html 步骤一:在工具菜单中,点击语言编辑器; 步骤二:在语言编辑器对话框中,点击新建; 步骤三:在打开的对话框中,选择根据现有语言创建新语言选项,然后选择新语言所依据的语言并点击确定; 步骤四:将打开语言属性对话框,在此对话框中: 1、输入新语言的名称。 2、之前选择的基础语言将显示在源语言下拉列表中,可更改源语言。 3、字母包含了基础语言的字母。点击“…”按钮以编辑字母。 4、程序识别文本和检查结果时,将会用到几个与词典相关的选项: a、无 语言将不会有词典; b、内置式词典 将使用程序的内置词典; c、用户词典 点击编辑(E)...按钮以指定词典项目,或导入现有自定义词典或带有Windows–1252编码的文本文件

ABBYY FineReader 12该怎么运行才能更流畅

笑着哭i 提交于 2019-12-03 03:33:28
日常工作和学习中,凡是用到电脑的地方,我们都希望程序能够运行得更快一点,使用 ABBYY FineReader 12时也不例外,本文将着重教大家尽可能快地加速运行ABBYY FineReader 12,如果你有很多高质量打印的文档,或者拥有一款好的扫描仪,精确到最后一个逗号不是最重要的,你只需“踩油门”然后“享受旅程”。不过要记住,每一个识别错误都需要几秒钟时间进行纠正。 执行以下操作加速运行ABBYY FineReader 12: 步骤一:打开ABBYY FineReader 12,在主工具栏上点击工具选项卡,然后点击选项; 步骤二:在选项对话框中,点击读取,在读取模式中勾选快速读取,如果不需要查找条码,则不勾选“查找条码”复选框; 接下来开始读取,读取结果的等待时间实际上已经减少了25%。 步骤三:如果扫描文件够好,够清晰,不扭曲,无反转,那么可以禁用图像预处理选项: 此时FineReader运行速度又加快了15%:几乎可以立即打开文档页面。 步骤四:如果保留颜色不那么重要,可以启用黑白模式。黑白模式可以在启动FineReader时的首页上选择,也可以在选项的文档色彩模式中选择,如下; 步骤五:如果确定文档语言,可以清楚地选择语言,而不是自动选择: 此时我们又赢得了5%的时间。 结合上述所有操作,总的来说已经将转换时间减少了60%—超过了一半!当然,这个数字是大概的

ABBYY FineReader的识别正确率该怎样提高

六月ゝ 毕业季﹏ 提交于 2019-12-03 03:32:01
  在OCR文字识别软件当中, ABBYY FineReader 12 是比较好用的程序之一,但再好的识别软件也不能保证100%的识别正确率,用户都喜欢软件的正确率高一些,以减轻识别后修正的负担,很多用户也都提过这样的问题,今天就为大家讲讲如何提高ABBYY FineReader的识别正确率。   1、打开ABBYY FineReader 12主界面,找到“文档语言”,在满足条件的情况下选择尽可能少的语言,这样就可以降低识别产生的错误。   2、选定合适的识别区域。区域中保留有效数据就够了,不要包含过多的无效空白区域。   3、原图像出现歪斜等也会影响识别的准确率,可以通过“编辑图像”功能实现矫正。   4、还可以根据自己图片的问题选择更细分的功能:   完成以上设置之后,ABBYY FineReader 12的识别准确率将提高不少,一直以来由此困惑的用户不妨试试。   更多关于ABBYY OCR技术的信息,大家可前往ABBYY中文网查看相关信息。 来源: oschina 链接: https://my.oschina.net/u/2459783/blog/662782

怎样使用PDF Transformer+中数字化签署

倾然丶 夕夏残阳落幕 提交于 2019-12-03 03:31:49
如今的企业每天都要处理大量的文档文件,这些文件大多数是电子格式,然而,审批程序或者考虑到文档的合法有效,个人签名总是少不了的,签署电子文档(包括PDF)有很多方式,这取决于文档的目的。 摹本签名和电子签名其实是手写签名的电子衍生品(照片或扫描)。 如果你的手写签名有扫描件或照片,可以使用ABBYY PDF Transformer+将其添加到PDF文档的任何页面,摹本签名可以因其当前(在多数情况下)具有纸质文档上传统的、手写签名类似的状态而用于签署文档,但它也有局限性: 1、摹本签名不能防止电子文档在签署之后被修改; 2、摹本签名的文档不被法庭或政府机构接受。 数字签名或者证书签名是一种特殊工具,用于签署电子文档。 数字签名主要用来识别签署文档的人,也用来帮助验证文档的完整性,是基于包含有关签署者和签名之后对电子文档所做更改的数据的证书。 PDF软件工具,如ABBYY PDF Transformer+,可以创建基于证书的签名,这些签名可以使用所谓的“自签”证书,其可靠性只能由各自的作者保障,这种类型的证书常用于管理内部流程文档,或者保护文档的完整性。 很多官方协议涉及到签署电子文档时,都要求最高级别的可靠性,在这种情况下,普遍接受的方法是使用基于(由可信赖第三方发行的)数字ID的证书,也称为“认证机构”,在该情况下,如果国家立法允许,就有法律保障获取签名作者的可靠信息。