文明探源走进甲骨文信息处理实验室 人机协同助力甲骨文破译和传承活化
“甲骨字和其拓片图”
“拓片及释文(甲骨文对应的现代汉字)。图片来自国家地理报道
大河报·豫视频记者 宋光华 邓飞 文图
(相关资料图)
“中国的文化基因来自于甲骨文,因为它是中国最早的,也是最成熟的文字。它能增强我们的民族自信、文化自信。”来自于从事甲骨文研究一线的安阳师范学院甲骨文信息处理实验室副主任焦清局由衷感叹道。全世界最重要的甲骨文信息处理实验室在殷墟安阳,全世界最完善的甲骨文数据平台也在这里。
全世界最重要的甲骨文信息处理实验室
甲骨文是中国的一种古老文字,又称“契文”“甲骨卜辞”,也是中国最早、最成熟的文字,对探寻中华文明有着至关重要的作用。但长久以来,甲骨文等古文字研究的研究资料和研究力量分散。如何才能把三千年前契刻在骨头上的象形字输入电脑,建立甲骨文数据库显得尤为重要。近日,记者走进甲骨文信息处理实验室,安阳师范学院甲骨文信息处理实验室副主任焦清局讲述了安阳甲骨文信息化研究全球遥遥领先背后的故事。
在现场,焦清局指着一组甲骨文字说:“甲骨片材质特殊,片多易碎,并且分布全球各地,语言信息多不完整。以前甲骨碎片都是靠记忆和手工一片一片地拼合。数据数字化以后,可利用人工智能图像技术进行自动缀合。”焦清局表示,“人工缀合一片甲骨碎片,大概一个月都有可能。但是用计算机缀合,可能使用不到一天的时间,甚至一个小时之内。这是一个很快速的过程。然后我们下一步再去筛选,目的性就强,花费的时间精力就很少。”
实验室建设的甲骨文大数据平台“殷契文渊”是国内外最全面的甲骨文信息库。甲骨文大数据平台“殷契文渊”,“搜集”了甲骨著录152种,甲骨图像234762幅,甲骨论著33389种,而且这些都对外免费开放。
据记者现场了解,实验室利用深度学习技术对甲骨碎片进行自动缀合,目前为止共缀合甲骨碎片41组,同时还发布了甲骨文的检测、识别、手写数据集,为计算机学者提供了检测、识别甲骨文标准的数据集。
甲骨文信息处理实验室是把现代信息技术应用于甲骨文研究的河南省、教育部重点实验室,2016年获批以来凝练形成了“甲骨文大数据平台、甲骨文识别与字形分析、甲骨文语言计算、甲骨文与殷墟科技考古”四个研究方向。其中,实验室建设了甲骨文大数据平台“殷契文渊”,目前已成为全球甲骨学家研究甲骨文最重要的数字资源平台。
甲骨文信息处理研究彰显文化自信
在实验室里,焦清局登录“殷契文渊”网站,在字形库中选择甲骨文“人”字形,瞬间,所有包含该字形的甲骨片信息就全部显示出来。
焦清局介绍,“殷契文渊”是由安阳师院和中国社科院甲骨学殷商史研究中心合作建设的非营利性网站,为甲骨学研究提供大数据支持,是了解、学习、研究甲骨文的互联网窗口,破解了过去获取甲骨文研究资料难的瓶颈,是目前最权威的甲骨文数据平台。
如果你是学生,在这里点击部首可以知道甲骨文的读音释义;如果你要写论文,在这里能检索关于甲骨文的专业论著;如果你是考古工作者,在这里甲骨碎片能够智能缀合。
它不仅服务全球的甲骨文、考古等的研究专家,还吸引了古文字爱好者、中小学语文教师、书法爱好者等使用。
“神秘莫测”的甲骨文不断走进“寻常百姓家”。
焦清局说,2023年发布面向大众的微信小程序“了不起的甲骨文”,服务甲骨文的传播,实验室引领甲骨文研究进入智能化时代,彰显我国民族自信、文化自信。
这个全世界最完善的甲骨文数据免费平台,以人机协同助力甲骨文破译和传承活化,让越来越多的公众触达甲骨文化,更加清晰地了解到汉字的源头和中华优秀传统文化的根脉。
标签: