成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

沒看錯!一行Python代碼就可以幫您獲取圖片中的文字信息

開發 前端
目前在github上有50.5k個star!python可以調用,安裝也十分方便,pip install pytesseract 即可。如果沒有Pillow 包,還需要執行pip install Pillow。

最近工作中有需求需要用python對圖片中的文字進行識別,調研了一下,選擇了tesseract,

目前在github上有50.5k個star!python可以調用,安裝也十分方便,pip install pytesseract 即可。如果沒有Pillow 包,還需要執行pip install Pillow。

核心代碼

讀取圖片中文字信息的核心api如下:

from PIL import Image
import pytesseract
captcha_text = pytesseract.image_to_string(Image.open("d:/tmp/img4.png"), lang='chi_sim')
print(captcha_text)

上面這段代碼中需要解釋的是如果圖片中有中文字符則需要添加參數lang='chi_sim',并在安裝的過程中添加識別中文的字符庫,后面會講到!

運行代碼遇到的問題

直接運行上面的代碼,會遇到下面的問題

raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.

我們來分析一下這個錯誤!錯誤提示tesseract沒有安裝,但是我們明明已經執行了pip install pytesseract,那么問題會出在哪里呢?

我們需要先了解一下pytesseract,它是一款用于光學字符識別(OCR)的python工具,即從圖片中識別出和“讀取”其中嵌入的文字,底層使用的是Google的Tesseract-OCR 引擎,pytesseract只是對Tesseract-OCR的一層封裝!看到這里我們就能夠理解 ,運行python代碼

pytesseract.image_to_string() 報錯的原因了!因為我的PC上并沒有安裝Tesseract-OCR,pytesseract是無法調用Tesseract-OCR的api為我們干活的!

安裝Tesseract-OC

Tesseract-OCR windows 版本的下載鏈接如下:https://github.com/UB-Mannheim/tesseract/wiki

下載成功后,只需默認安裝,在安裝的過程中,如果想對其他國家語言文字識別可以選擇相對應的語言包,如下圖

安裝成功后配置路徑 C:\Program Files\Tesseract-OCR 到環境變量中即可。

再次運行,正常執行!大家可以自己做一張文字圖片的截圖查看效果。

復雜的登錄校驗碼無法識別

另外我測試了Tesseract-OCR對復雜校驗碼的識別情況,如下圖:

結論是:復雜的校驗碼仍然無法識別。

責任編輯:武曉燕 來源: 今日頭條
相關推薦

2014-06-19 14:49:37

iCloud認證令牌密碼

2015-12-21 13:11:02

開源A-FrameWebGL

2022-07-14 10:54:15

Python代碼Matplotlib

2022-07-06 08:32:35

Python代碼Matplotlib

2020-05-11 17:12:52

換臉Python圖像

2024-01-07 16:56:59

Python人工智能神經網絡

2023-03-27 23:45:39

ChatGPT人工智能Python

2020-10-06 19:02:11

代碼機器學習igel

2016-12-02 08:53:18

Python一行代碼

2020-08-05 11:53:41

數據代碼自動化

2021-02-23 07:01:24

js小游戲技術

2021-11-02 16:25:41

Python代碼技巧

2023-01-12 08:07:03

Python代碼版權

2022-08-14 16:15:52

Python機器學習大數據

2022-04-09 09:11:33

Python

2022-10-17 07:16:08

SQL機器學習AI

2020-08-12 14:54:00

Python代碼開發

2020-08-19 10:30:25

代碼Python多線程

2017-02-13 09:33:32

2018-07-19 06:07:22

物聯網安全物聯網IOT
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 午夜精品久久久久久久久久久久久 | 久久网站免费视频 | 亚洲精品乱码 | 亚洲成人三级 | 日韩av成人| 欧美日韩在线不卡 | 久久免费资源 | 亚洲综合无码一区二区 | 欧美黄色一区 | 亚洲精品丝袜日韩 | 亚洲高清视频在线观看 | 午夜黄色影院 | 久久丝袜| 欧美αv| 亚洲3p| 欧美日韩黄色一级片 | 国产jizz女人多喷水99 | 国产精品69毛片高清亚洲 | 欧美精品一区二区在线观看 | 精品久久久久久亚洲综合网 | 91久久精品国产91久久性色tv | 久久草在线视频 | 日韩a在线| 亚洲欧美国产精品久久 | 亚洲国产成人精品女人久久久 | 国产高清精品一区二区三区 | 一区二区在线免费观看视频 | 中文字幕精品一区久久久久 | 一级毛片色一级 | 成人午夜免费视频 | 91精品国产91久久综合桃花 | 在线一区视频 | 日本色高清 | 亚洲在线一区二区三区 | 国产精品久久99 | 欧美在线视频一区二区 | 亚洲第一区久久 | 成人网av | 日本亚洲欧美 | 国产一区 在线视频 | 久久99深爱久久99精品 |