chi

Chrome、Firefox、Edge、IE、Opera之间的恩怨纠葛

耗尽温柔 提交于 2020-04-07 12:24:17
测试环境:操作系统为Windows10-64位 目标:安装五大浏览器及其驱动 一、谷歌浏览器 1.Google Chrome的安装 建议从腾讯电脑管家的软件管理里面下载最新的64位版本。 2.chromedriver的下载 (1)打开谷歌浏览器,点击右上角的三个点,选择帮助-》关于Google Chrome,点击进去。 (2)可以看到,我的浏览器版本为Google Chrome 80.0.3987.163的64位版本 (3)从淘宝官网下载驱动,选择对应的版本。 https://npm.taobao.org/mirrors/chromedriver 80为大版本号,0.3987.163为小版本号; 驱动和浏览器的大版本号必须一致,驱动的小版本号必须大于或者等于浏览器的小版本号。 (4)接下来按需下载,解压得到 chromedriver.exe 文件即可。 (5)存放chromedriver 将 chromedriver.exe 复制到Python的安装目录下即可。 与python.exe的存放位置是一样的。 二、火狐浏览器 1.Firefox的安装 建议从腾讯电脑管家的软件管理里面下载最新的64位版本。 2.geckodriver的下载 (1)从github下载最新的驱动即可。 https://github.com/mozilla/geckodriver/releases

Chrome、Firefox、Edge、IE、Opera之间的恩怨纠葛

天涯浪子 提交于 2020-04-07 09:52:29
测试环境:操作系统为Windows10-64位 目标:安装五大浏览器及其驱动 一、谷歌浏览器 1.Google Chrome的安装 建议从腾讯电脑管家的软件管理里面下载最新的64位版本。 2.chromedriver的下载 (1)打开谷歌浏览器,点击右上角的三个点,选择帮助-》关于Google Chrome,点击进去。 (2)可以看到,我的浏览器版本为Google Chrome 80.0.3987.163的64位版本 (3)从淘宝官网下载驱动,选择对应的版本。 https://npm.taobao.org/mirrors/chromedriver 80为大版本号,0.3987.163为小版本号; 驱动和浏览器的大版本号必须一致,驱动的小版本号必须大于或者等于浏览器的小版本号。 (4)接下来按需下载,解压得到 chromedriver.exe 文件即可。 (5)存放chromedriver 将 chromedriver.exe 复制到Python的安装目录下即可。 与python.exe的存放位置是一样的。 二、火狐浏览器 1.Firefox的安装 建议从腾讯电脑管家的软件管理里面下载最新的64位版本。 2.geckodriver的下载 (1)从github下载最新的驱动即可。 https://github.com/mozilla/geckodriver/releases

Tesseract

点点圈 提交于 2020-02-26 17:16:15
最近将族谱数字化,需要用到OCR软件。选择了Tesseract,但是官网的指南不是很亲切,所以记录了一些要点和脚本。 要点 族谱通常是竖向编排的,所以psm(页面分割模式)选项要用5。 合并多图,要先将图单独转换成tif格式,再进行合并。 LSTM引擎生成的盒子都是一条条的,和Legacy引擎框住单个字符的不一样。 LSTM盒子文件每一列文字最后要有一行\t开头的座标以示分隔。 训练时最好使用阈值“ --target_error_rate 0.001 ”。 参考: https://blog.csdn.net/qq_19313495/article/details/102977915 https://blog.csdn.net/Hu_helloworld/article/details/100923215 脚本 #!/bin/sh export TESSDATA_PREFIX=/usr/share/tesseract/tessdata f_img=$1 nm=${f_img%.*} convert $f_img -density 300 $f_img convert $f_img $nm.tif #生成box tesseract $nm.tif $nm -l chi_sim_vert --psm 5 lstmbox #处理box ##把字符串拆成单独一行,每11行用?分隔 cat

java语言下利用tess4j开源库进行图片中的文本提取

大城市里の小女人 提交于 2020-02-26 05:06:15
后来发现了一个帖子:# Java OCR tesseract 图像智能字符识别技术 Java代码实现 一,tess4j 简单介绍 Tess4J是对tesseract -OCR API.的Java JNA 封装,使java能够通过调用Tess4J的API来使用tesseract -OCR 我有一篇博客也介绍了tesseract -OCR如何使用tesseract -OCR进行图片识别 java代码实现DOS命令使用tesseract -OCR开源引擎实现图片文字识别 二,tess4j环境准备 官网下载tess4j的jar包 https://sourceforge.net/projects/tess4j 解压之后目录结构如下,tess4j的iar包在dist目录里面 如果要进行中文字符识别,需要下载中文字库,可自行百度,我也提供了百度网盘链接 https://pan.baidu.com/s/1dmpqQ8Cm7Cd5zaLC0ZOZaw 三,Eclipse IDE下的代码实现 新建一个java项目 2.导入tess4j的dist文件夹下的tess4j jar包和lib文件夹下的全部jar包,注意,lib下有一个后缀为.properties的文件别导进去了,把那个删除掉就行,你或许会问会用到那么多jar包吗,因为jar包可能依赖于其他iar包,所以最好全导入进去,我遇到过一个错误

python 类之间的关系

匿名 (未验证) 提交于 2019-12-02 22:11:45
类与类之间的关系 1. 依赖关系 class Plant: def __init__(self,zhonglei,xue,gongjili): self.zhonglei = zhonglei self.xue = xue self.gongjili = gongjili def da(self,js): print("植物打僵尸") js.xue -= self.gongjili if js.xue <= 0: print("僵尸死亡") else: print(f"僵尸掉血{self.gongjili},僵尸还剩{js.xue}血") class Jiang: def __init__(self,zhonglei,xue,gongjili): self.zhonglei = zhonglei self.xue = xue self.gongjili = gongjili def chi(self,zw): print("僵尸咬植物") zw.xue -= self.gongjili if zw.xue <= 0: print("植物死亡") else: print(f"植物掉血{self.gongjili},植物还剩{zw.xue}血") p = Plant("豌豆",1000,300) j = Jiang("路障",1800,200) p.da(j) p.da(j) p.da