GitHub Trending第一之后,PaddleOCR再发大招:百度自研顶会SOTA算法正式开源!
要说生活里最常见、最便民的AI应用技术,OCR(Optical Character Recognition,光学字符识别)当属其中之一。寻常到日常办理各种业务时的身份证识别,前沿到自动驾驶车辆的路牌识别,都少不了它的加持。作为一名开发者,各种OCR相关的需求自然也少不了:卡证识别、票据识别、汽车场景、教育场景文字识别…… OCR领域向来开源repo比较少,大部分核心算法用在了商业化产品。今年算是OCR开源领域的丰收年,chineseocr_lite,easyocr,以及百度 飞桨 推出的 Paddle OCR先后横空出世。 确实喜大普奔 对于OCR方向开发者而言,开源repo最吸引人的莫过于: ① 高质量的预训练模型 ② 简单易上手的训练代码 ③ 好用无坑的部署能力 简单对比一下目前主流OCR方向开源repo的核心能力 对于 语种方面 ,easyOCR的优势在于多语言支持,非常适合有小语种需求的开发者; 从 预训练模型 来看,easyOCR目前暂无超轻量模型,chineseocr_lite最新的模型是10M左右,而 Paddle OCR提供的8.6M是 目前业界已知最轻量的 ; 对于 部署方面 ,easyOCR模型较大不适合端侧部署,Chineseocr_lite和 Paddle OCR都具备端侧部署能力; 对于 自定义训练 ,实际业务场景中,预训练模型往往不能满足需求