RPA中房产证的 OCR 识别
客户需求,识别一些证件内容,包括身份证、户口本、营业执照、银行卡以及房产证,前四个比较容易实现,不管是艺赛旗的 RPA 还是百度的 OCR 都有接口,直接调用即可,但是都没有房产证的 OCR 识别,只能自己使用其他 OCR 接口来进行相关操作了。 房产证如下图所示: 如果使用通用文字识别所有的文字都可以识别出来,但是顺序是乱的,所以我选择了使用通用文字识别(高精度含位置版),这样的话,我不仅可以识别到文字,还能知道文字所在的位置,然后根据文字位置进行区域划分,划分后的效果如下: 代码如下: import base64 import copy import re import requests class OCR(object): # client_id 为官网获取的AK, client_secret 为官网获取的SK client_id = "" client_secret = "" def get_token(self): """获取 access_token""" host = 'https://aip.baidubce.com/oauth/2.0/token' # 请求头 headers = {'Content-Type': 'application/json; charset=UTF-8'}