图文识别是现阶段很常见的手艺之一,以前自学python写爬虫的时辰老是弹出需要输入验证码的环境。其实实现识别验证码并不是很难。就需要两个库PIL和pytesseract库就可以了。接下来给大师介绍如何一行代码实现图片文字识别。
起首需要安装pytesseract
直接打开windows dos号令行窗口执行以下号令即可
pip install pytesseract
安装完当作界面如下图所示,一般不会报错的
别的还需要安装PIL,若是安装掉败可以直接安装pillow取代pil哦
执行以下号令即可安装
pip install pillow
另还需要安装【tesseract-ocr】,可以参考以下经验
直接百度搜刮,下载进行安装,中心的选择都选择默认即可
可是安装完当作后,需要点窜pytesseract.py文件
新建一个graphicIdent.py文件,如下图所示
编写代码如下:
from PIL import Imageimport pytesseract
text = pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\test.png'), lang='chi_sim', config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')print(text)
有必定会问,你这并不是一行代码啊,其实否则真正的实现确实只有以下的哪一行代码的
text = pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\test.png'), , config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')
是也不是
执行成果如下图所示
固然不是100%识别精确,可是最起码实现了,若是想要识别精确,需要进行练习。
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!