圖像識別、文字識別,這些都是現在比較火的東西,現在大部分的AI都有在做這些東西,那我們就過來了解一下吧!
只需要四行代碼,完成從圖片中讀取圖片中的文字!
準備工作: ?
我們需要兩個安裝包,先來安裝一下:
pip install pillow
pip install pytesseract
安裝完之后,我們需要下載Tesseract-OCR這個軟件,這里我已經將東西都打包好了放在百度云中,大家可以直接下載:
鏈接 :
https://pan.baidu.com/s/1osNf95ScZJYhtzsGFLtxaA
密碼 :
npmn
打開安裝包,一路next
記錄好自己的安裝路徑
安裝完之后找到tessdata目錄下,將下載的chi_sim.traineddata文件放到該目錄下。這樣它就能識別中文了。
之后,我們只剩下一個東西要配一下了,在 pytesseract模塊中 的 pytesseract.py 文件中去配置一下 Tesseract-OCR 的工作目錄,這個時候我們可以通過剛剛pip安裝的位置找到 pytesseract.py 文件,如下圖:
進入目錄找到 pytesseract.py 文件并且打開它:
將tesseract_cmd這個變量的值改成Tesseract-OCR的安裝目錄即可。
現在,我們在準備一張圖片,用來識別,小編就用微信截圖好了,放置在桌面文件夾上:
開始代碼:
到這里,我們所有的預備環境以及全部搭建好了,下面我們就開始來敲代碼咯:
from PIL import Image
import pytesseract
pic_content=pytesseract.image_to_string(Image.open( 'C: \\ Users \\ yuqing.wu \\ Desktop \\ all \\ 3.png' ), lang = 'chi_sim' )
print (pic_content)
我們來看看運行結果:
結果還是比較準的。
大家也來試試吧!
像這樣的圖像識別還是挺重要、挺常用的,例如圖片驗證碼等等,都是可以去完成的,就看大家怎么去用了!
感興趣的掃個二維碼吧!
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
