easyocr

GitHub Trending第一之后,PaddleOCR再发大招:百度自研顶会SOTA算法正式开源!

≯℡__Kan透↙ 提交于 2020-08-19 03:14:31
要说生活里最常见、最便民的AI应用技术,OCR(Optical Character Recognition,光学字符识别)当属其中之一。寻常到日常办理各种业务时的身份证识别,前沿到自动驾驶车辆的路牌识别,都少不了它的加持。作为一名开发者,各种OCR相关的需求自然也少不了:卡证识别、票据识别、汽车场景、教育场景文字识别…… OCR领域向来开源repo比较少,大部分核心算法用在了商业化产品。今年算是OCR开源领域的丰收年,chineseocr_lite,easyocr,以及百度 飞桨 推出的 Paddle OCR先后横空出世。 ​ 确实喜大普奔 对于OCR方向开发者而言,开源repo最吸引人的莫过于: ① 高质量的预训练模型 ② 简单易上手的训练代码 ③ 好用无坑的部署能力 简单对比一下目前主流OCR方向开源repo的核心能力 ​ 对于 语种方面 ,easyOCR的优势在于多语言支持,非常适合有小语种需求的开发者; 从 预训练模型 来看,easyOCR目前暂无超轻量模型,chineseocr_lite最新的模型是10M左右,而 Paddle OCR提供的8.6M是 目前业界已知最轻量的 ; 对于 部署方面 ,easyOCR模型较大不适合端侧部署,Chineseocr_lite和 Paddle OCR都具备端侧部署能力; 对于 自定义训练 ,实际业务场景中,预训练模型往往不能满足需求

Hacker News 简讯 2020-07-09

两盒软妹~` 提交于 2020-08-14 03:19:57
更新时间: 2020-07-09 23:02 Decentraleyes – Local CDN Emulation - (decentraleyes.org) 分散-本地CDN仿真 得分:91 | 评论:31 How to track and display profile views on GitHub - (rushter.com) 如何在GitHub上跟踪和显示纵断面图 得分:21 | 评论:5 A Tour of Acme (2012) - (swtch.com) 极致之旅(2012) 得分:31 | 评论:3 Launch HN: Yotta Savings (YC S20) – Behavioral psychology to help people save - (phys.org) 推出HN:Yotta Savings(YC S20)——帮助人们储蓄的行为心理学 得分:40 | 评论:39 Giant clams manipulate light to assist their symbiotic partner - (nicolodavis.com) 巨型蛤蜊操纵光来帮助它们的共生伙伴 得分:18 | 评论:5 Moving from TypeScript to Rust / WebAssembly - (discovermagazine.com)

OCR 从图片表格中提取数据

自作多情 提交于 2020-07-29 08:50:37
需求分析 一些图片格式的表格数据,需要从中提取完整数据。 解题思路 图片中数据位置规则,应该是 Excel 等软件直接导出的。 第一步想到的是互联网上是否直接有该文件提供?因为是中文数据,用 Baidu,Sogou 等几个搜索引擎尝试找了几个关键词,都没有找到。 然后试了一下互联网上几个可以试用的表格 OCR 工具,对于这种有一些些独特格式的表格,没有很好的识别能力,识别结果感人。 最终方案是自己处理图片,切割出独立的图片块数据,做 OCR 识别出内容,这样可以有很好的识别率。 OCR 工具调研 tesseract (github #OCR top ) easyocr (开源 OCR 新秀) baidu-aip tesseract 和 easyocr 都是开源的 OCR 项目,安装完成之后还需要下载模型文件,体积都很大,考验网络稳定性。 baidu-aip 是百度提供的 AI 相关的 api SDK,在百度ai平台上申请账号后提供一些免费额度使用,因为是在线识别,速度会比较快。腾讯也有相关的文字识别 api,免费额度小很多。 识别流程 去除水印 图像的水印深度比字体浅,通过将图像转换成灰度后可以过滤掉浅色的像素即可完全去除水印 img = cv2.imread('1.png') gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) gray =