云聪古籍数字化精校平台,本着公益性、低成本、合作共赢的三大原则,功能涵盖古籍OCR识别、民国报纸OCR识别、图文逐字校对、数据著录、智能标点分段、精编排版、智能白话译文等,是一站式线上整理全流程平台。平台集成了团队管理功能
一、平台介绍
云聪古籍数字化精校平台,本着公益性、低成本、合作共赢的三大原则,功能涵盖古籍OCR识别、族谱县志OCR识别、民国报纸OCR识别、图文逐字校对、数据著录、智能标点分段、精编排版、智能白话译文等,是一站式线上整理全流程平台。
平台拥有校编团队20余人,并集成了团队管理功能,可以组织大规模校编团队进行古籍、报纸校编任务的分派、审核等工作。平台依托人工智能,低成本降本增效,推动古籍整理工作进程。
本平台支持8.7w个繁简汉字的OCR识别,涵盖大部分异体字,并且对手写字体也有很好的识别精度。另外,对蒙古语、藏语、维吾尔语、朝鲜语、哈萨克语等少数民族语言也有较好的支持,识别率在95%以上。云聪智能依托哈工程博士团队在人工智能方面的积累和人才优势,深耕文化服务行业,用AI赋能文化创新,已经先后为国内30余家图书馆、文化馆、档案馆等文化机构提供人工智能服务,直接或间接客户遍布于17个省份。
本平台可按照《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》最新要求导出双层PDF、XML元数据、成果文件等等。
平台自研,支持本地私有化部署,可满足各图书馆、档案馆保密要求。
二、登录与试用
本平台以公益性为原则,在人工智能算力充足的基础上,欢迎个人用户(学生、教师)以学习中华传统文化为目的,有限免费使用。
企业会员请联系vx: ocr2025开通试用
浏览器推荐:谷歌浏览器。
三、加工流程
云聪古籍数字化平台加工流程包括 批量上传、任务分派、逐字校对、数据著录、精编排版、数据导出 6大流程,针对不通的常见场景可以灵活处理整理流程。
【智慧图书馆古籍数字化标准加工流程&出版单位标准加工流程】
三、流程摘要:
1、批量上传
2、任务分派
3、逐字&集字校对
4、数据著录
四、加工成本
受图像质量、版面布局、文字类型、字体风格等因素影响,不同古籍、报纸的加工成本并不相同,均可依据实际情况商榷,能达到双赢才是最好的结果。比如图像质量差、人工校对的成本就高。
受益于本平台人工智能算法优先性,其成本远低于同行费用。
排除人工校对费用,本平台古籍半筒子页(A或B单面)在0.7元左右,繁体中文报纸单页40元左右,简体中文报纸单页20元左右。
另外:平台支持全链路OEM以及私有化部署。
类型 | OCR
/半筒子页 | 校对
/
半筒子页
| 自动标点、繁简处理 | 精编(排版、白话译文) |
---|
古籍(稿本、刻本、抄本等) | 0.3~1.2元
| 平台免费 | 10000字/5元
|
10000字/50元 |
繁体中文报纸(民国近代) | 20~50元 | 平台免费
| 10000字/5元
|
10000字/50元 |
简体中文报纸(70年代以后) | 10~30元 | 平台免费
| 10000字/5元
|
10000字/50元 |
五、 联系我们
如您在功能使用中有任何意见或建议,欢迎您通过以下方式给予我们反馈,您的提议将有助于我们不断完善。
1)商务合作 手机号 156-8998-1280(微信号yumicloud)
2)技术类咨询 手机号 133-5688-3552(微信号ocr2025)
3)校编团队咨询 手机号 17669729155(微信同号)
4)扫码添加云聪微信号,直接反馈。