在遥远的三千年前,那时候的人们用他们粗糙的笔触在龟甲和兽骨上记录下了一笔古老的文字。这便是被誉为华夏文明瑰宝的。如今,随着科技的进步,华中科技大学未来技术学院的团队正运用人工智能技术,试图揭开这些神秘文字背后的奥秘。
这个团队致力于探索如何将现代科技与古代文化相结合,利用大数据、机器学习等先进手段来辅助甲骨文的解读。甲骨文,作为我国已知最古老的成熟文字系统,不仅是构成汉字的基础,更是承载着中华民族丰富历史记忆和深厚文化的源泉。自1899年甲骨文被首次发现以来,已有超过125年的历史。至今,我们已经辨识出大约4500个没有重复的单字,其中约1600个字已经得到破译。然而,还有约三分之二的甲骨文仍深藏不露,等待着学者们去挖掘其背后的历史故事和文化内涵。
为什么这么难?中国国家图书馆馆藏研究中心副主任刘浩曾说,甲骨文中含有大量的表意成份,而且是随机性的,要按照特定的规律进行对应,这是一项非常困难的工作。就算是人工智能,也不可能破解。
今年,华中理工大学未来研究院的科研人员深入“无人区”,进行了一年多的实地考察,并通过一年多的努力,建立起了甲骨文开放数据库,其中包括1600多个甲骨文种类,以及大量尚未破译的甲骨文单字,以及13000多个甲骨文演化过程中出现的其它文字。更重要的是,团队还训练模型OBSD,并且发展了一个基于人工智能的多路径辅助解码系统——Open-Oracle。在此基础上,我们将逐步掌握甲骨文的演化模式,并对其未来可能出现的形态进行预测。
本项目拟以甲骨文为研究对象,首先对甲骨文图像进行建模,使之经过多个时期的演化,使之逐渐转化为与当代汉字相似的图形;然后,采用弥散模型对其进行校正,使之更接近于当代汉字的书写规则。
在此期间,管海粟与团队其它成员开展了4项申请,其中包括:基于条件扩散模型的甲骨卜辞识别方法;基于分类模型的甲骨卜辞分类方法与体系。与此同时,两人还共同开发了一套基于人工智能技术的多路径翻译软件——Open-Oracle,以满足古代汉字爱好者及研究人员的需求。
目前,这个站点主要有部首拆分、文本演化和自然语言处理五个方面的内容。接下来,还将以甲骨文普及为重点,力争推出甲骨文数字动画制作、甲骨文表情包、甲骨文 Chat以及甲骨文元宇宙等一系列甲骨文周边产品。
新技术的出现,为我们解读,让我们对历史有了更多的认识。中国社会科学院学部委员、古代史研究所研究员宋镇豪曾表示,作为世界上最古老的自源文字之一,汉字是唯一沿用至今的,对破解其他古文字也能起到重要借鉴意义。