AI驱动的甲骨缀合 ——附新缀十则 [张更生]

颁发于2020年-9月-20日  14条批评 

AI驱动的甲骨缀合

——附新缀十则

河南大学黄河文明与可延续成长学习中间、河南大学计较机与信息工程学院  张更生

河南大学甲骨文学习有着很是悠长的汗青,董作宾、孙海波、朱芳圃、石璋如、尹达、郑慧生等闻名甲骨学者,都曾执教或就读于河南大学。此刻,王蕴智传授率领下的河南大学古汉字学习所延续孳孳矻矻地苦守在这一范畴,承续着这一名誉传统。

将计较机与甲骨文学习相连系,是河南大学的良好传统。1987年河南大学计较机系郑逢斌到场研发了第一个甲骨文信息处置体系,尔后郑慧生与郑逢斌等人又合作设计了第一套形意连系的甲骨文输出法,这在那时的甲骨学界长短常抢先的水平。

最近几年来,河南大学对甲骨文与计较机连系的使命赐与了大力撑持。2019年6月23日,门艺、张更生约请了多位甲骨学界的专家,在河南大学召开了野生智能与甲骨文辨认专题钻研会(图1)。颠末与专家们的征询参议,集会肯定了甲骨缀合与甲骨文辨认两项使命作为此后主要的成长标的目的。厥后,又约请了都城师范大学、东北大学和厦门大学的甲骨文专家和计较机专家召开了两次“甲机遇”,肯定了野生智能(AI)驱动和人机耦合的缀合思绪,并对相干技术线路停止了具体论证。

4f70244455ae4cb5b6fa593422b3c65

图 1 野生智能与甲骨文辨认专题钻研会(河南大学)

操纵计较机赞助甲骨缀合的理论由来已久,良多处置甲骨缀合的学者都曾操纵计较机来进步缀合效力。但计较机到场的甲骨缀合与野生智能(AI)驱动的甲骨缀合是很差别的,曩昔的计较机缀合模子都不起到实在的缀协感化,也不赞助甲骨学家加重缀合使命的休息强度。是以,体育赛事竞猜活动肯定的主要方针是研发一个实在可用的缀合模子。而最近几年来野生智能(AI)技术的突飞大进,让体育赛事竞猜活动无机遇更靠近这一方针。

本项学习后期,体育赛事竞猜活动实验让缀合模子摹拟专家的边缘密合辨别才能和甲骨形状辨识才能,起首对卜骨拓片图象停止特地的技术攻关,以期让模子在必然的规模内(前10项备选甲骨)到达较高的缀合召回率。2019年末体育赛事竞猜活动实现了两个版本的甲骨缀合模子,并停止了不时的优化。经由进程将学界已缀合的250组甲骨混入随机4000片甲骨中停止了现实测试,模子功效前10项的复缀率到达99%以上(图2)。

图 2 缀合法式中复缀甲骨的界面

基于此,2020年1月体育赛事竞猜活动将相干功效提交给了野生智能国际顶会IJCAI-2020(Proceedings of the Twenty-Ninth International Joint Conference on Artificial Intelligence,),并被大会任命颁发(图3)。

图 3 张更生等颁发在野生智能顶级集会IJCAI-2020上的论文页面

2020年8月,体育赛事竞猜活动约请了都城师范大学和河南大学的师生对局部甲骨资料停止了清算,睁开了现实(本色性)的甲骨缀合使命。经由进程半个月的合作,体育赛事竞猜活动的模子再次获得了优化,使得现实使用中的前10项复缀率仍然坚持在85%以上(未能复缀的局部主要是边缘不密合,而主要依托残字、残辞而缀合的范例)。并新缀了一些甲骨,此摘选十则,以请教于方家:

第一则:合集7615正反+旅藏769正反(边缘类似度0.91708)

第二则:凑合65+英藏1168(边缘类似度0.63356)

第三则:合集165+合集2873(边缘类似度0.625000)

第四则:合集2824+合补5175(边缘类似度0.61417)

第五则:合集7494+合补3222(边缘类似度0.54804)*

*注:本则缀合进程中,发明合集7494与合补3222、合集13242的密合水平很是相仿,故思疑为统一片甲骨。

第六则:合集14981+合集15543(边缘类似度0.56198)

第七则:北珍1453正+合集3007(边缘类似度0.55454)

第八则:合集17750+合集13132(边缘类似度0.66666)

第九则:合集7483+合集6541(边缘类似度0.73029)

第十则:合集12344+合补3636(边缘类似度0.88461)

下一步,体育赛事竞猜活动将尽快把缀合软件(命名为“缀多多”)公然,以便利学界配合操纵这一东西,产生更多的缀合功效。同时,体育赛事竞猜活动还会进一步成长相干技术,一方面实验摹拟专家对残辞残字的研判才能,进一步减少规模。另外一方面,学习龟甲局部的缀合方式,争夺在龟甲局部也能获得必然冲破。

体育赛事竞猜活动但愿在未几的未来,在“缀多多”等AI甲骨缀合技术的赞助下,野生智能的使用能够让甲骨学者的缀合形式产生一个底子性转变,并终究完整处理这一题目。

(感激都城师范大学莫伯峰教员的技术和学术两重指点;感激河南大学门艺、东北大学陈善雄、厦门大学张俊松三位教员的大力撑持;感激河南大学纵瑞星、郭娴静、张古林同等学的主要进献。)

作者单元: 张更生 河南大学黄河文明与可延续成长学习中间、河南大学计较机与信息工程学院

联系邮箱: cszhang@henu.edu.cn

共 14 条批评 | 此刻就去批评

请颁发批评