通用文字识别:将自然场景下图片上的文字内容,通过定位和检测,智能识别为可编辑的文本信息。
本文档主要针对需要集成HTTP API的技术开发工程师,详细描述OCR识别能力相关的技术内容。
如果您有与我们商务合作的需求,可以通过以下方式联系我们:
商务邮箱: 709808807@qq.com
商务合作手机号:133-5688-3552 微信: ocr2025 联系人 叶老师
商务合作手机号:156-8998-1280 微信:yuemicloud 联系人 房老师
温馨提示:
API密钥
;如果您还没有,请到 积分充值页面 获取。云聪古籍OCR API接口提供OCR文字识别服务,目前支持简体、繁体、少数民族语言总共8万余字符的文字识别。您只需要通过调用云聪OCR API,传入经过Base64编码的图片,通过POST请求方式,就可以得到相应的文字识别结果。
云聪OCR API HTTPS地址:
https://ocrapi.yuncong-ai.com/v2/ocr
注:请求采用application/x-www-form-urlencoded,不用JSON。
调用方在集成通用文字识别 API时,请遵循以下规则。
规则 | 描述 |
---|---|
传输方式 | HTTPS |
请求方式 | POST |
字符编码 | 统一使用UTF-8编码 |
响应格式 | 统一采用application/x-www-form-urlencoded格式 |
调用API需要向接口发送以下字段来访问服务。
字段名 | 类型 | 含义 | 必填 | 备注 |
---|---|---|---|---|
image | text | 要识别的图片,需要Base64编码 | True | 必须是Base64编码 |
direction | text | 文字方向 | True | v: 竖向 h:横向 |
det_type | text | 识别类型,按行识别 | true | 1:行级 2:字符级 3:混合 。默认混合(3) |
accesstoken | text | API秘钥 | True | 请到 积分充值页面 获取。 |
format | text | 服务器响应类型,目前只支持json | True | json |
curtime | text | 当前UTC时间戳(秒) | true | TimeStamp |
lang | text | 语言设置 | False | cht 繁体、chs 简体、multi 多语言。默认繁体(cht) |
order | text | 排序设置 | False | 1 分栏排序、2 AI排序。默认分栏(1) |
返回的结果是json格式,具体说明如下:
字段 | 类型 | 字段说明 |
---|---|---|
code | text | 错误码,一定存在 |
data | text | 识别结果,查询成功一定存在 |
+lines | jsonarray | 行,查询正确一定存在 |
++text | text | 行识别结果 |
++position | jsonarray | 行的区域位置信息 |
++confidence | float | 置信度 最大为1 |
++type | text | 区域类型 1:正文 |
++words | jsonarray | 行,查询正确一定存在 |
+++text | text | 识别的字的结果 |
+++position | jsonarray | 字的区域位置信息 |
即识别结果主要在Result中,输出结构为:data->lines->words.一个文档可能有多行,一行有多个字。
每个段落、每行、每个字都有position,代表能够框住行、字的最大box的位置信息。
position共八个值:分别是左上角坐标(x,y),右上角坐标(x,y),右下角坐标(x,y),左下角(x,y)。
具体可参见下面的参考示例。
识别的返回结果:
{
"code": "0", //识别错误码
"msg": "识别成功", //提示信息
"data": {
"lines": [ //行
{
"position":[[479,383],[520,383],[506,1050],[466,1050]], //行区域位置信息
"text": "國朝藩邸藏書印", //行识别结果
"confidence": 0.8918083310127258, //置信度
"type": 1, //区块类型 1为正文
"words": [ //字
{
"position": [[476,376],[514,376],[514,420],[476,420]]", //字区域位置信息
"text": "國",//字识别结果
"confidence": 0.6442992091178894, //字置信度
}
]
}
],
"credit_use": 0, //积分消耗
"credit": 0, //剩余积分
"text_num": 108, //文字数量
"w": 1298,//图片宽度
"h": 1236//图片高度
}
}
支持图片格式 | 每小时最大请求次数 |
---|---|
jpg\png\bmp | 1800,如需增加次数,请联系商务 |