7月12日,記者獲悉,前不久在上海舉辦的世界人工智能大會上,“數字甲骨共創(chuàng)中心”宣布將全球最大的甲骨文多模態(tài)數據集正式開源。
該數據集包含10000片甲骨拓片、摹本,以及甲骨單字對應的位置、字頭、隸定字以及辭例分組、釋讀順序等數據。研究人員可根據該數據集開發(fā)甲骨文檢測、識別、摹本生成、字形匹配以及釋讀等方向的智能算法,助推甲骨文研究加速數字化和智能化。
據介紹,數字甲骨共創(chuàng)中心成立于5月28日,由安陽師范學院甲骨文信息處理教育部重點實驗室、騰訊SSV數字文化實驗室、中國社會科學院考古研究所安陽工作站、鄭州大學漢字文明研究中心等單位共同發(fā)起建立,吸納了國內外眾多高校和研究機構的專業(yè)科研力量支持。
在安陽師范學院甲骨文信息處理教育部重點實驗室,博士張展正在給學生們展示甲骨綴合。
會上,數字甲骨共創(chuàng)中心發(fā)布甲骨文AI破譯需求,期待與有技術儲備、有意愿共創(chuàng)、致力于AI助力甲骨文破譯的科研機構共同形成解決數字文化演示方案,助力甲骨文破譯。經過最終遴選評審的合作伙伴將獲得20萬元資助,一起共創(chuàng)甲骨文AI考釋破譯的新算法、新工具、新方法。
甲骨文是迄今為止中國發(fā)現(xiàn)的年代最早的成熟文字系統(tǒng),但其研究存在諸多難點。近年來,隨著AI技術的快速發(fā)展,探索AI與甲骨文研究相結合,成為研究人員的解題思路。“高質量的AI算法非常依賴高質量的甲骨文數據集。”安陽師范學院甲骨文信息處理教育部重點實驗室負責人劉永革說。
此次開源的甲骨文多模態(tài)數據集集合了甲骨文數字化研究的最新成果,吸收了當前業(yè)界最先進的甲骨文研究資料,AI相關技術的應用也為數據集的信息豐富提供了支撐。
“甲骨文研究不僅有助于揭示中國上古信史,還能為現(xiàn)代漢字由來和漢語研究提供標志性依據。AI技術應用有望加快甲骨文探析進程,解決長期困擾學界的疑難問題。”中國社會科學院學部委員宋鎮(zhèn)豪表示,希望更多的科研機構和專家學者加入這一偉大事業(yè),共同拓展甲骨文研究工作新天地。