且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

ACL 第一天:Tutorial钟爱深度学习,唯一一个workshop关注女性群体| ACL 2017

更新时间:2022-07-18 10:41:42

雷锋网AI科技评论按:计算机语言学和自然语言处理最顶尖的会议之一ACL 将于2017年7月30日至8月4日在加拿大温哥华举行。雷锋网(公众号:雷锋网) AI 科技评论将赴前线带来一手报道,并对论文及大会概况进行梳理。

今天是预热 tutorial 环节,也是 ACL 会议延续至今的传统,旨在帮助研究领域的新手们了解计算机语言学与自然语言处理的核心技术,同时也会介绍目前这些分领域的一些前沿内容。

今年的 Tutorial ***是科罗拉多大学的 Jordan Boyd-Grabe 和柏林洪堡大学的 Maja Popovic,他们经与组委会甄选和分析,最终定下了 7 月 30 日 tutorial 的六个主议程。

ACL 第一天:Tutorial钟爱深度学习,唯一一个workshop关注女性群体| ACL 2017

早上的三个 tutorial 分别是自然语言处理于精准医疗的应用、多模式机器学习及深度学习于语义合成的研究;下午的三个 tutorial 则分别为深度学习在对话系统上的应用;深度学习在多词表达与组合的研究、以及众包问题的探讨。

Tutorial 1: Natural Language Processing for Precision Medicine

在本次 tutorial 中,研究者将围绕精准医疗这个机遇巨大的领域,对 NLP 目前存在的数据集、医疗资源和实际问题进行了解,并降低 NLP 研究人员在医学领域应用的门槛。

Tutorial 2 : Multimodal Machine Learning

多模式机器学习通过整合多种交互模型(语言、声学、视觉信息),初步解决了一些人工智能的想法。不过,由于数据的结构多样化及数据间可能存在的偶然性,给该研究领域带来了挑战。该 Tutorial 基于 CMU2016 年的春季课程,以及 CVPR 2016 和 ICMI 2016 的两个 tutorial 整合而成,对机器学习和深度神经网络的基本概念进行了讲解,并描述了多模态机器学习的五大挑战,包括:1)多模式表示;2)翻译和映射;3)模态对齐;4)多模态融合;5)共同学习。

Tutorial 3: Deep Learning for Semantic Composition

NLP 的一大核心问题在于通过习得表征建模文本的含义。近几年来,研究者们对分布式方法表示出了极大的兴趣,不同粒度的文本被编码为数值向量。因此在本次 Tutorial 上,Xiaodan Zhu 和 Edward Grefenstette 组织大家一起了解了神经网络的语义组合建模知识。

Tutorial 4: Deep Learning for Dialogue Systems

在过去十年的研究中,口语对话系统最为人熟知的应用莫过于虚拟助手了。一个经典的对话系统通常非常复杂,或是流程呈现模块化的特点。尽管近年来,深度学习的发展助推了对话系统的发展,但在本次 tutorial 上,除了介绍它所取得的成果,Yun-Nung Chen, Asli Celikyilmaz 和 Dilek Hakkani-Tur 也提及了深度学习在应用于对话系统的困难与挑战。

相关介绍可参考: http://deepdialogue.miulab.tw.

Tutorial 5: Beyond Words: Deep Learning for Multi-word Expressions and Collocations

深度学习在 NLP 上的应用呈现令人惊喜的成果。以往大多数研究都采用稀疏词袋模型的表征方式,但现在有很多工作采用了分布式表示,通过构造「神经嵌入」的方式对每个单词或文档用向量表示,这个 Tutorial 介绍了一种名为「MWEs」(Multiword Expressions)的表达方式。

Tutorial 6: Making Better Use of the Crowd

NLP 社区是应用众包模式的早期领域之一。但实际上研究者对这个领域中的工作者依然有着很多误解和不了解。在这个 tutorial 上,组织者 Jennifer Wortman Vaughan 从多个方面向观众们阐述众包平台的成员组成,并且打破大家对他们所形成的刻板印象。

从上面几个Tutorial的概况不难看出,本届 ACL 的 tutorial 对深度学习在各项技术上的应用尤为关注。人言 tutorial 可谓是研究者们最为关心的前沿问题,看来所言非虚。

而今天唯一一个workshop的议题也非常有意思——“WiNLP:Women  & Underrepresented Minorities in Natural Language Processing”,主要探讨的是对女性或少数群体在 NLP 研究中的状况。实际上,女性作为研究人员的“稀有动物”,设立这样一个 workshop 也毫不为奇。以 AAAI 2017 为例,就有关注女性群体的议程出现,甚至还有专门针对女性学者的早餐会。这从一定程度上反映了女性群体依然在研究领域上享有较少的话语权——如果不是这样,也就不会有“关注女性研究者”的呼声存在了。

不过有意思的是,当天下午的 workshop 中,在座的不乏女性,也有“万红丛中一点绿”的男性嘉宾。

ACL 第一天:Tutorial钟爱深度学习,唯一一个workshop关注女性群体| ACL 2017

在当天的议程结束后,进行了非常愉快的 welcome reception 晚宴。第一天的议程就此结束,正会明天即将拉开帷幕,敬请期待雷锋网 AI 科技评论带来的报道。

ACL 第一天:Tutorial钟爱深度学习,唯一一个workshop关注女性群体| ACL 2017

雷锋网原创文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

文章点评:

表情 同步到新浪微博
最新文章

ACL 正会在即,哪两位重量级嘉宾将出席做主题演讲?| ACL 2017

本文作者:高云河 编辑:郭奕欣 2017-07-31 13:00 专题:ACL 2017
导语:ACL委员会两名重量级演讲者介绍计算语言学的挑战与前景。

ACL 第一天:Tutorial钟爱深度学习,唯一一个workshop关注女性群体| ACL 2017

雷锋网AI科技评论按:计算机语言学和自然语言处理最顶尖的会议之一ACL 将于2017年7月30日至8月4日在加拿大温哥华举行。雷锋网AI科技评论将赴前线带来一手报道,并对论文及大会概况进行梳理。

今年的ACL邀请到了两位重量级嘉宾进行invited talk,下面是雷锋网(公众号:雷锋网)对演讲简介的编译,Noah Smith将会讨论目前表征学习所面对的挑战,Mirelaa Lapate将会介绍多模式翻译。

详解计算语言学(Squashing Computational Linguistics)

Noah Smith(华盛顿大学)

以下是官网提供的演讲内容简介:

表征学习是计算语言学和自然语言处理领域目前最炙手可热的方法。与出席这次会议的其他人一样,我将介绍在自然语言模型中使用表征学习的新方法。由于一个数据驱动的模型通常需要一个假定的理论(并不一定是***的理论),我会论证语言的representation-learning-infused模型的language-appropriate inductive bias的优点。这种偏差通常以假设的形式被引入到模型中、对推理算法的限制条件中、或者数据的语言分析中。事实上,语言学研究的这几十年(包含计算语言学),使得我们这个领域处于辨别可行的inductive bias的优势位置。新的模型又可以让我们去探索先前不可获得的偏差形式,并产生新的语言学发现。我将着重于新的文档和句子语义结构,并强调抽象的,可复用的组成部分和它们的假设,而并不将重点放在应用上。 

演讲者简介:Noah Smith是华盛顿大学计算机科学与工程系的Paul G. Allen学院的副教授。此前,他曾在卡内基梅隆大学计算机科学学院任副教授。Noah Smith在约翰霍普金斯大学计算机科学系获得博士学位,在马里兰大学获得计算机科学学士学位以及语言学学士学位。他的研究横跨包括自然语言处理,机器学习和计算机社会科学在内的许多话题。他曾任CL,JAIR和TACL编辑,以及SIGDAT的财务主管,并作为2016年ACL会议的程序联合***。他的研究小组:诺亚方舟,是自然语言处理学术上和工业界中的世界级领导者。Smith的工作得到了UW Innovation Award, Finmeccanica career development chair at CMU,NSF CAREER Award,Hertz Foundation graduate fellowship的认可,并获得了无数的***论文奖,曾被NPR、BBC、CBC、纽约时报、华盛顿邮报和Time杂志报导。

多模式与文本的相互翻译(Translating from Multiple Modalities to Text and Back) 

Mirella Lapata(爱丁堡大学)

近年来,研究者们开发了很多计算工具来处理和生成自然语言文本。其中许多工具对于主流计算机用户来说已经很熟悉了,它们多被应用在网络搜索,问答,情绪分析,特别是机器翻译中。机器翻译的应用不仅可以在不同语言之间(例如英语到法语),还可以应用在相同国语言之间,在不同的模式之间或不同的数据格式之间进行翻译(比如视频或图像翻译为文本),这可以进一步增强网络的可访问性。这是由于网络中大多数据都是非语言数据(例如视频,图像,源代码),而大多数检索工具只能对文本数据进行操作,因此大多数数据都不能够被索引或搜索。

在这个演讲中,Lapata 教授会论证为了使个人和计算机的电子数据更易于访问,需要开发新的翻译模型。我将重点介绍三个示例:文本简化,源代码生成和电影摘要。其次,他将描述关于深度学习拓展的最新进展,以引出不同模式的一般性表示,并学习如何在这些模式和自然语言中进行翻译。

演讲者简介:Mirella Lapate是爱丁堡大学信息学院的自然语言处理教授。她的研究重点是让电脑学会理解,推理,以及生成。她是Journal of Artificial Intelligence Research的副主编,曾在ACL和Computational Linguistic委员会任职。她是英国计算机学会Karen Sparck Jones奖的第一个获奖者。她获得过两次EMNLP***论文奖,目前持有欧洲研究理事会著名的Consolidator Grant。

原文链接:ACL 2017 Invited Talks

本文作者:奕欣

本文转自雷锋网禁止二次转载,原文链接