新聞中心
今天給大家分享的主題是用百度的接口實現圖片的文字識別。

創(chuàng)新互聯公司是網站建設專家,致力于互聯網品牌建設與網絡營銷,專業(yè)領域包括做網站、成都網站制作、電商網站制作開發(fā)、微信小程序定制開發(fā)、微信營銷、系統平臺開發(fā),與其他網站設計及系統開發(fā)公司不同,我們的整合解決方案結合了恒基網絡品牌建設經驗和互聯網整合營銷的理念,并將策略和執(zhí)行緊密結合,且不斷評估并優(yōu)化我們的方案,為客戶提供全方位的互聯網品牌整合方案!
環(huán)境和配置要求
整體是用Python實現,所需要使用的第三方庫包括aip、PIL、keyboard、pyinstaller,如未安裝,可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller指令安裝。
百度接口
打開https://cloud.baidu.com/,
如未注冊請先注冊,然后登錄點擊管理控制臺,點擊左側產品服務→人工智能→文字識別,點擊創(chuàng)建應用,輸入應用名稱如Baidu_OCR,選擇用途如學習辦公,最后進行簡單應用描述,即可點擊立即創(chuàng)建。
會出現應用列表,包括AppID、API Key、Secret Key等信息,這些稍后會用到。
打開步驟
具體實現步驟
整個程序的大致思路是,在用截圖軟件獲得截圖之后,交給百度接口識別,并返回結果,當然,也可以是本地圖片識別,我用的是QQ自帶截圖軟件,快捷鍵CTRL+ALT+A用來打開截圖,在選中所截區(qū)域后,按Enter鍵即可保存到粘貼板中,也可用其他截圖軟件。
①獲取截圖
keyboard類庫是用來監(jiān)聽鍵盤動作的,所以在有快捷鍵按下之后,便會有相應動作。并用PIL中的ImageGrab來獲取到剪切板中的圖片并生成本地圖片文件。
#1.截圖
keyboard.wait('ctrl+alt+a')
print('開始截圖')
keyboard.wait('enter')
print('保存截圖')
time.sleep(0.1)
#2.保存圖片
image = ImageGrab.grabclipboard()image.save('img.png')
②調用Baidu aip識別并打印文字
先用注冊時生成的應用的AppID、API Key、Secret Key初始化應用,再讀取保存到的圖片并打印識別的文字。
with open('img.png', 'rb') as fp:
image = fp.read() text_list = client.basicAccurate(image)['words_result']
for text in text_list:
print(text['words'])
運行結果如圖所示:
運行截圖
我們還可增加一個無限循環(huán)使得一直能截圖。
③調用打包程序生成專屬識別文字小程序
用pyinstaller庫實現小程序的打包,生成.exe文件,這樣就能隨時識別文字了。在命令行中用pyinstaller xxx.py來打包生成exe文件,最后在生成的dist文件夾即可找到xxx.exe文件如下:
專屬文字識別小程序
完整源代碼下載見文末!
附圖圖片識別案例
本文標題:幾行Python代碼實現文字識別,你敢信?
網頁路徑:http://www.dlmjj.cn/article/djcjoco.html


咨詢
建站咨詢
