Tesseract-OCR是一条目关于中文的识别,而且是开源的,识别结果比力好的软件包。
接下来给大师介绍Python验证码识别tesseract-ocr安装,报错解决。
起首需要下载tesseract-ocr
以下是下载地址
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe
下载好后,双击tesseract-ocr-setup-4.00.00dev.exe安装,弹出接待界面,如下图所示
第二步,勾选【赞成和谈】,点击【next】即可
选择安装用户,选择勾选【全数用户】
选择安装功能,其他的默认即可,可是必然要选择这个说话包哦,这个说话包就是简体中文
选好安装目次后,点击【next】下一步
默认的点击下一步【next】,下一步【next】进行安装即可
安装完当作后,点击下一步【next】即可,点击【finish】完当作即可
最后一步,若是报错信息如下图所示,怎么办?
其实百度搜刮有良多的解决方案,小编想说的是,小编亲自实践解决的一种方式,但愿能有所帮忙。
text = pytesseract.image_to_string(Image.open('C:\\Users\\123.png'), lang='chi_sim', config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')
在利用的时辰,加上以下这段即可
config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!