雨橙_Robinn.top_#Python系列#--百度AI之Python图像文字识别库SDK的使用

百度AI开放平台：https://ai.baidu.com/
首先需要到百度AI开放平台注册一个账户

然后做实名认证。下载百度云app。刷脸识别。

完成认证以后。就找到我们需要的文字识别类目：

然后选择文字识别栏目

然后创建一个栏目

最后开通生成APP_ID，API_KEY，SECRET_KEY,下图红色标注处这几个参数我们程序中后面会用到(必须的)。

可以查看API列表：

可以看见百度api每天条用次数是有限制的(500次/天免费),只有调试程序的时候省点用了。

接下来我们开始安装图像文字识别 Python SDK

找到文字识别栏目API下载。下载python sdk包到我们项目目录中。

点击这里可以下载baidu-aip包

然后打开pycharm,调出Terminal终端使用以下命令开始安装。

安装使用Python SDK有如下方式：

如果已安装pip，执行pip install baidu-aip即可。

如果已安装setuptools，执行python setup.py install即可。(我这里使用setuptools安装)

安装图示如下：

安装完成后。重启pycharm。这个时候我们可以使用百度aip相应模块了。

我直接贴代码

#!/usr/bin/pythyon
# _*_ coding:utf-8 _*_
# author: Robinn

from aip import AipImageClassify
from aip import AipOcr


def get_img_content(img_filepath):
    with open(img_filepath,"rb") as f:
        return f.read()

APP_ID = '11204346'
API_KEY = 'M73AwH6kEjFXCD74rH'
SECRET_KEY = 'G4DlQ4BQCLybuLN6EE5evgNt1'

# 图像识别
# client = AipImageClassify(APP_ID, API_KEY, SECRET_KEY)
# img = get_img_content("test.jpg")
# res = client.objectDetect(img)
# print(res)


#文字识别
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
img = get_img_content("test.jpg")
res = client.basicGeneral(img)

# print rest
str = ""
for line in res:
    if type(res[line]) == list:
        words = res[line]
        for x in words:
            str = str+x["words"]+","
            print x["words"]
print("===================================")
print(str)
print("===================================")

这里主要介绍两个模块

AipImageClassify (图像识别模块)

AipOcr (文字识别模块)

识别图片中的文字需要先以二进制方式读取图片数据。然后放入basicGeneral方法中。通过百度aipocr直接解析出来。

解析出来的文字是一个字典对象。我们便利解析这个对象可以获取里面的文字。

如下图红色标注处：

到这里一个小型的图片文字识别模块已经完成了。仅供参考学习。

注：本文内容均系原创。如需转载分享请标明出处。

posted at 2018-01-17

雨橙

中国.四川.成都