当前位置:首页 > 社会文化 > 正文内容

识典古籍

识典古籍

https://www.shidianguji.com/

识典古籍是抖音公益与北大合作共建的古籍阅读平台。致力于为用户提供免费公开、稳定、快速、方便的检索和阅读古籍的服务。

目前,平台已上线390部经典古籍,共计3000多万字,向公众免费开放。未来三年,“识典古籍”将陆续完成一万种古籍的智能化整理工作,基本覆盖儒家、道家和佛家的核心书目。

为了方便大家在古籍“图书馆”里检索、阅读,“识典古籍”平台主要采用了三项人工智能技术:

一、文字识别,也就是用OCR(光学字符识别)技术将古籍影印版图像识别成文字。目前行业内OCR的识别准确率平均为93%至94%,而“识典古籍”将这个数字提高到96%至97%。

二、自动标点,指通过算法,给原本缺少断句的古籍自动打上标点符号。举个例子,《论语》开篇“学而时习之不亦说乎”,自动标点后的结果是“学而时习之,不亦说乎?”

三、命名实体识别,即识别古籍中的“专有名词”,包括人名、地名、书籍、时间、官职五大类型。




分享给朋友:

相关文章

墨墨言情网1年前 (2022-11-27)
语文网3年前 (2021-09-17)
天方听书网1年前 (2022-11-26)
采薇书院1年前 (2022-11-27)