首页 > 编程语言 > 详细

python识别图片中的文字

时间:2021-04-30 15:03:00      阅读:15      评论:0      收藏:0      [点我收藏+]

提示:识别效果不是特别好

from PIL import Image
import pytesseract
import easygui
import os

# 选择文件对话框
path = easygui.fileopenbox()

print(path)


# 识别文字
text = pytesseract.image_to_string(Image.open(path), lang=‘chi_sim‘)

print(text)


具体安装步骤如下:

1.安装pytesseract、pillow库
pip install pytesseract
pip install pillow

2.安装Tesseract-OCR软件
安装完之后找到tessdata目录下,将下载的chi_sim.traineddata文件放到该目录下。这样它就能识别中文了。

3.在pytesseract模块中的pytesseract.py文件中去配置一下Tesseract-OCR的工作目录,可以通过刚刚pip安装的位置找到pytesseract.py文件。

 

python识别图片中的文字

原文:https://www.cnblogs.com/WebLinuxStudy/p/14721656.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!