且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

【干货】微软SIGIR 2016演讲:基于但不限于知识库、万维网的问答系统

更新时间:2022-09-21 18:05:40

今天为大家推荐的是SIGIR 2016大会上,来自微软研究院自然语言处理方向的两位研究员——Scott Wen-tau Yih和Hao Ma的分享。


研讨会的主题是“基于但不限于知识库、万维网的问答系统”(Question Answering with Knowledge Base, Web and Beyond)。


研讨会从搜索引擎的发展历程出发,以微软搜索引擎——Bing为例,从最初基于文字搜索的问答系统,发展到了以Cortana为代表的基于对话的问答系统。


【干货】微软SIGIR 2016演讲:基于但不限于知识库、万维网的问答系统


而这背后基于的原理都是如何让机器去更好的理解自然语言,比如可以用自然语言和用户交流的通用语言处理器,有效可以处理陈述句式或问句等。


【干货】微软SIGIR 2016演讲:基于但不限于知识库、万维网的问答系统


现代问答系统中常见的问题分类主要有——


· 事实类问题:

    基于实体客观事实的信息查询;

    竞技类信息


· 描述性问题:

    观点类或指导性查询(例如“如何做”的问题)


· 多模式问题

    基于视觉的问答

    旅行助手


· 人工智能的能力测试

    阅读理解

    小学水平的科学或数学知识测试等


【干货】微软SIGIR 2016演讲:基于但不限于知识库、万维网的问答系统


目前,在技术层面,搜索问答系统主要有以下几个方面的挑战——


· 问题分析:包括回答类型、格子填充、语义分析等

· 文本/数据分析

· 意译&匹配:包括如何处理问题的差异性、本体匹配等

· 搜索复杂度

【干货】微软SIGIR 2016演讲:基于但不限于知识库、万维网的问答系统


基于上述这些问题,研讨会的内容主要分为以下几个部分:


· 基于知识库的问答系统

    现代大规模知识库的介绍

    数据集和最先进的方法论


· 基于万维网的问答系统

    问题的设定与一般系统架构

    关键语言分析

    其他信息源的利用


· 测试机器智能的问答系统

    阅读理解

    推理测试


【干货】微软SIGIR 2016演讲:基于但不限于知识库、万维网的问答系统

本文来源于"中国人工智能学会",原文发表时间"2016-07-14"