欢迎访问 计算机与信息技术学院(大数据学院)
当前位置: 首页 » 学院动态 » 新闻中心
我院中文信息处理团队斩获CMRC2022大赛冠亚军
时间:2022-11-30 作者:

近日,第二十一届中国计算语言学大会(CCL2022)落下帷幕,由其组织的“讯飞杯”中文机器阅读理解评测(CMRC2022)结果公布。我院学子在本届大赛脱颖而出,在两个赛道均取得佳绩,获选择型阅读理解赛道一等奖(第1名),获抽取型阅读理解赛道二等奖(第2名)。

中国计算语言学大会(CCL)是由中国中文信息学会负责组织的国内自然语言处理领域权威性最高、规模和影响最大的学术会议。作为中国中文信息学会的旗舰会议,CCL聚焦于中国境内各类语言的智能计算和信息处理,为研讨和传播计算语言学最新学术和技术成果提供了最广泛的高层次交流平台。由CCL大会组织的中⽂机器阅读理解评测(CMRC)是国内自然语言处理领域知名赛事,同时也是国际开展较早的中文机器阅读理解技术评测之一。

018c895f8c0940eaa84b017077767b10.png

CCL大会从2017年开始组织技术评测,至今已举办五届。CMRC2022以探索可解释性阅读理解方法为核心,分为抽取型阅读理解和选择型阅读理解两个赛道。本次评测的难点在于,组委会不提供带标注的训练数据,选手需要设计无监督或弱监督的机器阅读理解方法来完成答案和佐证依据的抽取。大赛两个赛道的赛程包含资格赛阶段(初赛)、资格审查阶段(复赛)与决赛阶段,决赛前三名分别获得各赛道的冠军、亚军和季军。

d0a6881910e44a2a8029714882bea43c.png    ac51f90d389644d8ac69bb0434aac11c.png

6b6a4d4893a24d0791d9edc986ec35fc.png    94fa61ca343f46008b5d29d4529bbe26.jpg

山西大学中文信息处理团队长期从事语义资源构建、文本语义表示、情感分析、阅读理解及问答系统等方面的研究和开发,已承担多项国家自然科学基金及863项目,在汉语框架语义资源构建、语言的深层理解与推理、情感深层分析等方面积累了丰富的经验和技术成果,近年来在多项重要评测取得优异成绩。针对本次评测任务,山西大学中文信息处理团队提出选项理解增强和问题内容感知的可解释阅读理解方法,最终在选择型阅读理解赛道决赛中以综合F1值61.196%获得冠军,在抽取型阅读理解赛道决赛中以综合F1值73.934%获得亚军。