用到了兩個重要的庫,以下以MacOS系統為例
?
1.?ImageMagick,用于對圖片進行預處理
安裝
brew install ImageMagick
?
再下載針對文本圖片清理的腳本? ?textcleaner
增加可執行權限
chmod +x textcleaner
?
測試一下效果,原始圖片
執行命令
./textcleaner -g -e normalize -f 50 -o 12 -s 2 id-test3.png user_id_cleaned.png
得到新圖片
?
2.?pytesseract,用于識別文字
pytesseract依賴于Google?tesseract-ocr
brew install tesseract
?
再安裝?pytesseract
pip3 install pytesseract
?
識別代碼
print(pytesseract.image_to_string(Image.open('user_id_cleaned.png')))
?
3. 完整代碼
?
# -*- coding: utf-8 -*- from PIL import Image import pytesseract import subprocess import shlex source_file = 'id-test3.png' cmd = f'./textcleaner -g -e normalize -f 50 -o 12 -s 2 {source_file} user_id_cleaned.png' print('cleaning image for text') subprocess.run(shlex.split(cmd)) print('recognizing text from image') print(pytesseract.image_to_string(Image.open('user_id_cleaned.png')))
?
?
?
?
?
?
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
