百度AI开放平台:https://ai.baidu.com/
首先需要到百度AI开放平台注册一个账户
首先需要到百度AI开放平台注册一个账户
然后做实名认证。下载百度云app。刷脸识别。
完成认证以后。就找到我们需要的文字识别类目:
然后选择文字识别栏目

然后创建一个栏目


最后开通生成APP_ID,API_KEY,SECRET_KEY,下图红色标注处这几个参数我们程序中后面会用到(必须的)。


可以查看API列表:


可以看见百度api每天条用次数是有限制的(500次/天免费),只有调试程序的时候省点用了。
接下来我们开始安装图像文字识别 Python SDK
找到文字识别栏目API下载。下载python sdk包到我们项目目录中。
然后打开pycharm,调出Terminal终端使用以下命令开始安装。
安装使用Python SDK有如下方式:
如果已安装pip,执行pip install baidu-aip即可。
如果已安装setuptools,执行python setup.py install即可。(我这里使用setuptools安装)
安装图示如下:

安装完成后。重启pycharm。这个时候我们可以使用百度aip相应模块了。
我直接贴代码
#!/usr/bin/pythyon
# _*_ coding:utf-8 _*_
# author: Robinn
from aip import AipImageClassify
from aip import AipOcr
def get_img_content(img_filepath):
with open(img_filepath,"rb") as f:
return f.read()
APP_ID = '11204346'
API_KEY = 'M73AwH6kEjFXCD74rH'
SECRET_KEY = 'G4DlQ4BQCLybuLN6EE5evgNt1'
# 图像识别
# client = AipImageClassify(APP_ID, API_KEY, SECRET_KEY)
# img = get_img_content("test.jpg")
# res = client.objectDetect(img)
# print(res)
#文字识别
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
img = get_img_content("test.jpg")
res = client.basicGeneral(img)
# print rest
str = ""
for line in res:
if type(res[line]) == list:
words = res[line]
for x in words:
str = str+x["words"]+","
print x["words"]
print("===================================")
print(str)
print("===================================")
|
这里主要介绍两个模块
AipImageClassify (图像识别模块)
AipOcr (文字识别模块)
识别图片中的文字需要先以二进制方式读取图片数据。然后放入basicGeneral方法中。通过百度aipocr直接解析出来。
解析出来的文字是一个字典对象。我们便利解析这个对象可以获取里面的文字。
如下图红色标注处:


到这里一个小型的图片文字识别模块已经完成了。仅供参考学习。
注:本文内容均系原创。如需转载分享请标明出处。
注:本文内容均系原创。如需转载分享请标明出处。