且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《中国人工智能学会通讯》——7.18 篇章语义分析的应用

更新时间:2022-10-02 16:20:53

7.18 篇章语义分析的应用

由于篇章语义分析以篇章结构和语义信息为分析目标,因此对机器翻译研究(MT,MachineTranslation)的促进作用最为直接。在已有的工作中,研究人员利用篇章语义分析技术从很多角度辅助机器翻译系统的性能提升。首先,篇章语义分析研究结果能够刻画 MT 系统的输入文本块之间的语义关系,这对 MT 系统更合理地组织翻译结果无疑是有益的[36] 。此外,篇章语义分析对关联词、文档结构都进行了比较深入的分析,这些信息有助于提升翻译文本的连贯性,生成可读性更好的翻译结果[37-38] 。

另外,篇章级别的机器翻译评价始终是一个难题,通过引入篇章语义分析研究结果,可以在篇章层面上利用核函数捕捉结构信息,有助于更好地进行翻译质量评估[39-40] 。

自动问答系统(QA,Question Answering)是另一个从篇章语义分析研究中受益的重量级应用。通常情况下问答系统包括问句理解和答案抽取两个模块。在问句理解部分,篇章语义分析有助于理解题干各部分之间的语义关系,从而加深对问题的理解[41] ;在答案抽取方面,篇章语义分析可以用来更精确地分析答案所在文本[42] ,进行候选答案的重排序,有助于更准确的回答问题[43] 。除了传统 QA 研究之外,近年来阅读理解研究也受到了越来越多的关注。阅读理解的任务是对于给定的一篇自然语言文章和给定与文章相关的问题,计算机根据词语特征等语义信息来自动选择与问句相关的候选答案句。在阅读理解任务中,文章主题的广泛性要求对语料库进行深度加工和处理,才能得到比较好的结果。阅读理解研究可以直接应用到许多的社会领域,它不但是自然语言处理的一个重要的研究方向,而且可以对自然语言处理技术的成熟有很大促进作用。事实上,组成篇章结构的语句、片段之间有着明显的语义关系,这些关系可以加深对问题的理解[41] 。在文献 [44-45] 中,已经证明了句法关系对阅读理解答案抽取有促进作用,但是其性能的提升并不明显。目前已有的基于概率和机器学习的答案抽取方法中,都是将篇章中的各个句子看作是相互没有语义关联的独立信息描述单位。但在实际上,篇章中的不同句子之间存在者紧密的逻辑语义关系,全部句子结合之后来才能完成对篇章主题的全面描述。因此,通过在篇章中逐一判别每个句子和用户问题之间逻辑匹配度的方法来选择答案句,就无法正确回答用户的所有问题。基于此,即有了结合篇章语义分析的阅读理解方法,与传统 QA 类似,该研究也得益于篇章语义分析[41,46-47]而获得了性能的显著提升[48] 。