一、平台介绍
云聪古籍数字化精校平台,本着公益性、低成本、合作共赢的三大原则,功能涵盖古籍OCR识别、族谱县志OCR识别、民国报纸OCR识别、图文逐字校对、数据著录、智能标点分段、精编排版、智能白话译文等,是一站式线上整理全流程平台。
我们的价格合理,充分考虑到用户的需求,可提供正规发票,特别是为上海中医药大学、南京中医药大学、成都中医药大学、广西中医药大学、河南中医药大学、华南师范大学、上海师范大学、南京师范大学、西南民族大学、内蒙古大学、广西科技大学、贵州师范大学、江西科技师范大学等50多所中医药、历史和文学专业的师生提供服务,确保每位用户都能以低成本享受到高质量的数字化服务。
平台功能一览
- | 说明 | 核算 |
OCR识别 | 支持繁体中文、蒙古语、藏语、维吾尔语、朝鲜语、哈萨克语 等 | 10元 |
整页OCR识别 | 千字两元,支持单栏、多栏、族谱、民国刊物等多种版式 | 1000字/2.00元(每半筒子页约3~7毛) |
单行OCR识别 | 免费 | 0元 |
繁简体转换 | 免费 | 0元 |
智能加标点(低精度) | 免费 | 0元 |
智能加标点(高精) | 免费 | 0元 |
智能翻译为白话文 | 免费 | 0元 |
导出为TXT | 免费 | 0元 |
导出为TXT(带) | 免费 | 0元 |
导出为双层PDF
(低清晰度) | 免费 | 0元 |
导出为双层PDF (高清晰度) | 100积分/页面 | 1页
/ 1.00元 |
平台拥有校编团队20余人,并集成了团队管理功能,可以组织大规模校编团队进行古籍、报纸校编任务的分派、审核等工作。平台依托人工智能,低成本降本增效,推动古籍整理工作进程。
本平台支持8.7w个繁简汉字的OCR识别,涵盖大部分异体字,并且对手写字体也有很好的识别精度。另外,对蒙古语、藏语、维吾尔语、朝鲜语、哈萨克语等少数民族语言也有较好的支持,识别率在95%以上。云聪智能依托哈工程博士团队在人工智能方面的积累和人才优势,深耕文化服务行业,用AI赋能文化创新,已经先后为国内30余家图书馆、文化馆、档案馆等文化机构提供人工智能服务,直接或间接客户遍布于17个省份。
本平台可按照《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》最新要求导出双层PDF、XML元数据、成果文件等等。
平台自研,支持本地私有化部署,可满足各图书馆、档案馆保密要求。
本平台以公益性为原则,在人工智能算力充足的基础上,欢迎个人用户(学生、教师)以学习中华传统文化为目的,有限免费使用。
企业会员请联系vx: ocr2025开通试用
浏览器推荐:谷歌浏览器。
三、加工流程
云聪古籍数字化平台加工流程包括 批量上传、任务分派、逐字校对、数据著录、精编排版、数据导出 6大流程,针对不通的常见场景可以灵活处理整理流程。
【智慧图书馆古籍数字化标准加工流程&出版单位标准加工流程】
1、批量上传
2、任务分派
3、逐字&集字校对
4、数据著录
受图像质量、版面布局、文字类型、字体风格等因素影响,不同古籍、报纸的加工成本并不相同,均可依据实际情况商榷,能达到双赢才是最好的结果。比如图像质量差、人工校对的成本就高。
受益于本平台人工智能算法优先性,其成本远低于同行费用。
排除人工校对费用,本平台古籍半筒子页(A或B单面)在0.4~0.7元左右,繁体中文报纸单页40元左右,简体中文报纸单页20元左右。
另外:平台支持全链路OEM以及私有化部署。
类型 | OCR /半筒子页 | 校对
/
半筒子页 | 自动标点、繁简处理 | 精编(排版、白话译文) |
---|---|---|---|---|
古籍(稿本、刻本、抄本等) | 0.3~1.2元 | 平台免费 | 10000字/5元 | 10000字/50元 |
繁体中文报纸(民国近代) | 20~50元 | 平台免费 | 10000字/5元 | 10000字/50元 |
简体中文报纸(70年代以后) | 10~30元 | 平台免费 | 10000字/5元 | 10000字/50元 |
五、 联系我们
如您在功能使用中有任何意见或建议,欢迎您通过以下方式给予我们反馈,您的提议将有助于我们不断完善。
1)商务合作 手机号 156-8998-1280(微信号yumicloud)
2)技术类咨询 手机号 133-5688-3552(微信号ocr2025)
3)校编团队咨询 手机号 17669729155(微信同号)
4)扫码添加云聪微信号,直接反馈。