云聪OCR接口开发教程

云聪OCR识别 API 简介

概念解释

通用文字识别:将自然场景下图片上的文字内容,通过定位和检测,智能识别为可编辑的文本信息。

说明

本文档主要针对需要集成HTTP API的技术开发工程师,详细描述OCR识别能力相关的技术内容。

如果您有与我们商务合作的需求,可以通过以下方式联系我们:

商务邮箱: 709808807@qq.com

商务合作手机号:133-5688-3552 微信: ocr2025 联系人 叶老师

商务合作手机号:156-8998-1280 微信:yuemicloud 联系人 房老师

温馨提示:

  • 本文档主要针对开发人员,接入测试前需要先注册后到积分充值页面获取 获取API密钥;如果您还没有,请到 积分充值页面 获取。
  • 平台每个月都会向每个账户赠送一定额度的体验金,供用户集成前测试所用,具体资费规则详见 文字识别服务报价 。

接口能力

云聪古籍OCR API接口提供OCR文字识别服务,目前支持简体、繁体、日文韩文总共4.8万字符的文字识别,其中涵盖繁体异体汉字27,533个。您只需要通过调用云聪OCR API,传入经过Base64编码的图片,通过POST请求方式,就可以得到相应的文字识别结果。

云聪OCR API HTTPS地址:

https://ocrapi.yuncong-ai.com/v2/ocr

注:请求采用application/x-www-form-urlencoded,不用JSON。

协议须知

调用方在集成通用文字识别 API时,请遵循以下规则。

规则描述
传输方式HTTPS
请求方式POST
字符编码统一使用UTF-8编码
响应格式统一采用application/x-www-form-urlencoded格式

接口调用参数

调用API需要向接口发送以下字段来访问服务。

字段名类型含义必填备注

image

text要识别的图片,需要Base64编码True必须是Base64编码

direction

text文字方向Truev: 竖向 h:横向

det_type

text识别类型,按行识别true1:行级  2:字符级  3:混合 。默认混合(3)

accesstoken

textAPI秘钥True请到 积分充值页面 获取。
formattext服务器响应类型,目前只支持jsonTruejson
curtimetext当前UTC时间戳(秒)trueTimeStamp

输出结果

返回的结果是json格式,具体说明如下:

字段类型字段说明
codetext错误码,一定存在
datatext识别结果,查询成功一定存在
+linesjsonarray行,查询正确一定存在
++texttext行识别结果
++positionjsonarray

行的区域位置信息

++confidencefloat

置信度 最大为1

++typetext

区域类型 1:正文 

++wordsjsonarray行,查询正确一定存在
+++texttext

识别的字的结果

+++positionjsonarray
字的区域位置信息




即识别结果主要在Result中,输出结构为:data->lines->words.一个文档可能有多行,一行有多个字。

每个段落、每行、每个字都有position,代表能够框住行、字的最大box的位置信息。

position共八个值:分别是左上角坐标(x,y),右上角坐标(x,y),右下角坐标(x,y),左下角(x,y)。

具体可参见下面的参考示例。

参考示例

识别的返回结果:

{
"code": "0", //识别错误码
"msg": "识别成功", //提示信息
"data": {
"lines": [ //行
{
"position":[[479,383],[520,383],[506,1050],[466,1050]], //行区域位置信息
"text": "國朝藩邸藏書印", //行识别结果
"confidence": 0.8918083310127258, //置信度
"type": 1, //区块类型 1为正文
"words": [ //字
{
"position": [[476,376],[514,376],[514,420],[476,420]]", //字区域位置信息
"text": "國",//字识别结果
"confidence": 0.6442992091178894, //字置信度
}
]
}
],
"credit_use": 0, //积分消耗
"credit": 0, //剩余积分
"text_num": 108, //文字数量
"w": 1298,//图片宽度
"h": 1236//图片高度
}
}

服务配置

支持图片格式每小时最大请求次数
jpg\png\bmp1800,如需增加次数,请联系商务