成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

使用一行Python代碼從圖像讀取文本

開發 后端
處理圖像不是一項簡單的任務。對你來說,作為一個人,很容易看著某樣東西然后馬上知道你在看什么。但電腦不是這樣工作的。

 處理圖像不是一項簡單的任務。對你來說,作為一個人,很容易看著某樣東西然后馬上知道你在看什么。但電腦不是這樣工作的。

 

[[312562]]

 

對你來說太難的任務,比如復雜的算術,或者一般意義上的數學,是計算機毫不費力就能完成的。但在這里,情況正好相反——對你來說很瑣碎的任務,比如識別圖像中的貓或狗,對電腦來說真的很難。在某種程度上,我們是天造地設的一對。至少現在是這樣。

雖然圖像分類和涉及到一定程度計算機視覺的任務可能需要大量的代碼和扎實的理解,但是從格式良好的圖像中讀取文本在Python中卻是簡單的,并且可以應用于許多現實生活中的問題。

在今天的帖子中,我想證明這一點。雖然會安裝一些庫,但不會花很多時間。這些是你需要的庫:

  • OpenCV
  • PyTesseract

OpenCV

現在,這個庫將只用于加載圖像,實際上你不需要事先對它有太多了解(盡管它可能有幫助,你將看到為什么)。

根據官方文件:

OpenCV(開源計算機視覺庫)是一個開源的計算機視覺和機器學習軟件庫。OpenCV的目的是為計算機視覺應用提供一個通用的基礎結構,并加速機器感知在商業產品中的使用。OpenCV是bsd許可的產品,OpenCV使企業可以輕松地使用和修改代碼

簡而言之,你可以使用OpenCV來做任何類型的圖像轉換,這是一個相當簡單的庫。

如果你還沒有安裝它,那么它將只是終端中的一行:

 

  1. pip install opencv-python 

差不多就是這樣。在此之前,一切都很簡單,但這種情況即將改變。

PyTesseract

這個庫到底是什么東西?根據維基百科:

Tesseract是用于各種操作系統的光學字符識別引擎。它是免費軟件,根據Apache許可2.0版發布,自2006年以來由Google贊助開發。

我敢肯定,現在有更多復雜的庫可用,但是我發現這個庫運行良好。根據我自己的經驗,該庫應該能夠從任何圖像中讀取文本,但前提是該字體不會使你連連看都看不懂。

如果無法從你的圖像中讀取文字,花更多的時間使用OpenCV,應用各種過濾器使文本高亮。

現在安裝在底部有些麻煩。如果你使用的是Linux,則全部歸結為幾個sudo-apt get命令:

 

  1. sudo apt-get updatesudo apt-get install tesseract-ocrsudo apt-get install libtesseract-dev 

我用的是Windows系統,所以這個過程有點乏味。

首先,打開這個URL:https://github.com/UB-Mannheim/tesseract/wiki下載32位或64位的安裝程序:

 

使用一行Python代碼從圖像讀取文本

 

安裝本身很簡單,只需單擊幾次Next。是的,你還需要做一個pip安裝:

 

  1. pip install pytesseract 

接下來要需要告訴Python Tesseract安裝在何處。在Linux機器上,我不需要這樣做,但在Windows上是必需的。默認情況下,它安裝Program Files。

如果你做的一切正確,執行這些代碼應該不會產生任何錯誤:

 

使用一行Python代碼從圖像讀取文本

 

獲取文本

讓我們從一個簡單的開始。我找到了一些免版稅的圖片,里面有一些文字,第一個是這樣的:

 

[[312564]]

 

它應該是簡單的一個,有可能Tesseract會讀那些藍色的“對象”作為括號。讓我們看看會發生什么:

 

使用一行Python代碼從圖像讀取文本

 

我的猜測是正確的。不過,這不是一個問題,你可以使用一些Python技巧輕松地解決這些問題。

下一個可能更棘手:

 

使用一行Python代碼從圖像讀取文本

 

我希望它不會檢測到硬幣上的“B”:

 

使用一行Python代碼從圖像讀取文本

 

看起來效果很好。

現在輪到你把它應用到你自己的問題上了。如果文本與背景混合,OpenCV技能在這里可能是至關重要的。

在你離開之前

對計算機來說,從圖像中讀取文本是一項相當困難的任務。想想看,電腦不知道字母是什么,它只對數字有效。在引擎蓋后面發生的事情一開始可能看起來像一個黑盒子,但我鼓勵你進一步研究,如果這是你感興趣的領域。

我并不是說PyTesseract每次都能很好地工作,但是我發現即使在一些比較復雜的圖像上它也足夠好。但不是所有情況都很好,有時候需要一些圖像處理需要使文本高亮讓其相對于背景更加突出。

責任編輯:華軒 來源: 今日頭條
相關推薦

2016-12-02 08:53:18

Python一行代碼

2025-01-20 08:35:53

2022-04-09 09:11:33

Python

2020-08-19 10:30:25

代碼Python多線程

2021-11-02 16:25:41

Python代碼技巧

2017-04-13 19:20:18

Python代碼并行任務

2020-02-19 15:02:23

代碼開發工具

2020-09-28 12:34:38

Python代碼開發

2020-08-12 14:54:00

Python代碼開發

2014-02-12 13:43:50

代碼并行任務

2017-04-05 11:10:23

Javascript代碼前端

2022-09-28 10:12:50

Python代碼可視化

2024-05-31 13:14:05

2015-11-09 17:04:57

2015-11-09 17:59:57

2021-08-31 09:49:37

CPU執行語言

2020-09-09 16:00:22

Linux進程

2023-09-12 10:10:57

開發者工具開源

2021-04-19 10:38:06

代碼開發工具

2023-11-10 09:41:44

Python代碼
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一区二区福利视频 | 国产色99| 久久亚洲一区 | 91精品久久久久久久久久入口 | 玖玖综合网 | 91在线网 | 精品三区 | 久久毛片 | 日日夜夜狠狠操 | 一个色在线 | www.三级 | 亚洲成人免费视频在线 | 欧美二区在线 | 国产一区二区欧美 | 国产在线精品一区二区 | av影片在线 | 免费观看一级特黄欧美大片 | 日本成年免费网站 | 久久久久九九九女人毛片 | 中文字幕 欧美 日韩 | 美女视频一区二区三区 | 欧美日韩国产一区二区 | 精品国产一区二区三区久久久蜜月 | 四虎影院久久 | 99综合| 亚洲午夜视频在线观看 | 国产精品一卡二卡三卡 | 国产精品成人在线播放 | 在线亚洲一区 | 免费高清av | 成人a视频| 日韩免费1区二区电影 | 男女国产视频 | 日本黄色大片免费 | 日韩电影中文字幕在线观看 | 国产激情视频在线免费观看 | 操夜夜| 毛片一级片 | 亚洲国产视频一区二区 | 成人在线视频免费看 | 欧美色偷拍 |