您现在的位置是:首页 > 学无止境 > 其他网站首页其他 如何安装与使用pytesseract库来识别验证码

如何安装与使用pytesseract库来识别验证码

  • 莫愁
  • 其他
  • 2019-06-11
简介如何在爬虫的时候,解析图片上的信息呢?在Google上查了一下,需要安装pytesseract库和pillow(我用的python3.7.3)和Tesseract-OCR,下面就分享下。

字数 516.5

在写爬虫的时候总是遇到一些以图片的形式展示的信息,那么如何解析图片上的信息呢?在Google上查了一下,需要安装pytesseract和pillow和Tesseract-OCR,下面就具体分享步骤。

1. 安装pytesseract

cmd中输入pip install pytesseract

2. 安装pillow

cmd输入pip install pillow

3. 安装Tesseract-OCR

tesseract-ocr  文件提取密码:9mnw;解压密码:www.mochoublog.com
tesseract-ocr-w64-setup-v4.1.0.20190314 (28.1 MB)

4. 安装完后将Tesseract-OCR的安装路径添加到环境变量中PATH和Path中都要添加

例如:

添加环境变量

 

5. 在python的安装路径下的修改安装的pytesseract库里面的pytesseract.py,将默认的改成Tesseract-OCR的安装路径

pytesseract修改tesseract_cmd路径

 

6. 配置完了开始撸代码吧

识别效果图:

识别效果图


转载: 感谢您对莫愁个人博客网站平台的认可,非常欢迎各位朋友分享到个人站长或者朋友圈,但转载请说明文章出处“来源莫愁个人博客 https://www.mochoublog.com/study/252.html”。

文章评论

    • 评论
    人参与,条评论

技术在线

服务时间

周一至周日 12:00-22:00

关闭下雪
关闭背景特效