首页 > 其他 > 详细

初步使用Tesseract

时间:2019-02-14 18:49:01      阅读:167      评论:0      收藏:0      [点我收藏+]

有个需求需要从图片中提取中文,就想到了谷歌的Tesseract

参考链接:https://www.howtoforge.com/tutorial/tesseract-ocr-installation-and-usage-on-ubuntu-16-04/
1.apt install tesseract-ocr
2.安装简体中文包
apt install -y tesseract-ocr-chi-sim
(安装所有语言包:apt install -y tesseract-ocr-chi-all)
查看已安装的语言包:

技术分享图片

3.使用

识别下面这张图片:

技术分享图片

识别出的内容为(没有全部截图):

技术分享图片

 4.使用pytesseract

https://pypi.org/project/pytesseract/

有具体使用案例,基本使用非常简单。

 

初步使用Tesseract

原文:https://www.cnblogs.com/liangping/p/10376338.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!