python如何一行代码实现图片文字识别

图文识别是现阶段很常见的手艺之一,以前自学python写爬虫的时辰老是弹出需要输入验证码的环境。其实实现识别验证码并不是很难。就需要两个库PIL和pytesseract库就可以了。接下来给大师介绍如何一行代码实现图片文字识别。

东西/原料

  • python

方式/步调

  1. 1

    起首需要安装pytesseract

    直接打开windows dos号令行窗口执行以下号令即可

    pip install pytesseract

  2. 2

    安装完当作界面如下图所示,一般不会报错的

  3. 3

    别的还需要安装PIL,若是安装掉败可以直接安装pillow取代pil哦

    执行以下号令即可安装

    pip install pillow

  4. 4

    另还需要安装【tesseract-ocr】,可以参考以下经验

    直接百度搜刮,下载进行安装,中心的选择都选择默认即可

    可是安装完当作后,需要点窜pytesseract.py文件

    18Python验证码识别tesseract-ocr安装,报错解决

  5. 5

    新建一个graphicIdent.py文件,如下图所示

  6. 6

    编写代码如下:

    from PIL import Imageimport pytesseract

    text = pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\test.png'),                                   lang='chi_sim',                                   config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')print(text)

    有必定会问,你这并不是一行代码啊,其实否则真正的实现确实只有以下的哪一行代码的

    text = pytesseract.image_to_string(Image.open('C:\\Users\\Administrator\\Desktop\\test.png'),                                 ,                                  config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')

    是也不是

  7. 7

    执行成果如下图所示

    固然不是100%识别精确,可是最起码实现了,若是想要识别精确,需要进行练习。

注重事项

  • 分享投票点赞或存眷,是对小编最年夜的鼓动勉励。感谢~
  • 发表于 2018-04-27 00:00
  • 阅读 ( 232 )
  • 分类:其他类型

相关问题

0 条评论

请先 登录 后评论