北理工团队荣获CCKS2023大会优秀资源论文奖

59ed8b7107e845d9956409cedfcd162e.jpg

8月24日至27日,第十七届全国知识图谱与语义计算大会(CCKS 2023)在沈阳召开。语言工程与认知计算工信部重点实验室(下文简称“重点实验室”)“英文科技论文写作智能批改与评价”团队提交至大会的论文“Move Structure Recognition in Scientific Papers with Saliency Attribution”荣获优秀资源论文奖。论文第一作者是华体会hth·(体育)(中国)官方网站-华体会体育hth首页计算机学院硕士研究生林金坤,团队的其他作者分别来自华体会hth·(体育)(中国)官方网站-华体会体育hth首页外国语学院、华体会hth·(体育)(中国)官方网站-华体会体育hth首页计算机学院和北京工业大学信息学部。

全国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing,CCKS)由中国中文信息学会语言与知识计算专业委员会主办,目前已经成为国内知识图谱、语义技术等领域的核心学术会议,聚集了知识表示与推理、自然语言理解与知识获取、图数据管理与图计算、智能问答等相关技术领域的学者和研发人员。

语步(move)是学术论文文本内容的重要结构和单元,语步分析是计算语言学中与语用学相关的一个研究话题,对于分析文本的意图和连贯性等都具有关键作用。论文团队面向科技论文设计了科技论文语步结构识别的创新任务,同时人工标注了较大规模的高质量数据集Scientific Abstract Moves Dataset (SAMD)。为了解决语步结构内容中的隐性混合和反事实推断导致语步识别性能不佳等问题,团队提出了语步显著性归因的新概念,它可以阐明单词对特定语步结构的贡献。在此基础上,设计了一种新的语步识别训练机制,该机制充分考虑了上下文信息,并促使模型专注于与标签相关的最重要文本。所提方法在SAMD和NLP Contribution Graph共享任务数据集(NCG)上进行实验,均取得了突出表现。这是团队在语步识别可解释性上的首次尝试,为了解模型如何做出决策并识别模型中的潜在偏差或错误提供了可能。

此次荣获大会优秀资源论文奖表明团队的研究获得了学术同行的认可,这也是重点实验室成立以来,积极推动并开展文理交叉、文工交叉以及多学科创新合作的重要阶段成果之一,充分体现了“语言智能+外语教育”协同创新发展的可能性。未来,重点实验室将继续开展更加广泛的交流与合作,实现更高质量和多样化的成果产出。