一周AI最火论文 | 讲讲话就能控制UI界面上网冲浪？

更新时间：2021-10-31 10:18:57

本周关键词：机器学习安全性、数据编程、对象再识别

本周***学术研究

提升机器学习系统的安全性：了解如何保护机器学习模型

对于任何软件系统来说安全性都至关重要，这也包括机器学习（ML）模型，因为人们可以通过对抗性示例轻松地适应从而攻击该模型。

现在研究界对于探索和发现对抗性攻击已经有了许多文献和复杂的算法，并提出了一些有可能实施的防御措施。例如，近日一些研究人员发表的这篇论文：机器学习究竟在网络安全领域中处于什么位置？

论文链接：
https://medium.com/ai%C2%B3-theory-practice-business/where-does-machine-learning-stand-in-cyber-security-670e3fe1cda2

但是，根据与华盛顿大学合作和Microsoft Research的一组研究人员的说法，之前对于ML模型安全性的研究大多数的研究对象都是独立的神经网络模型。

在这份最新的研究报告中，研究人员们评估了大规模部署的ML软件产品的安全性，希望能够扩大这一领域的研究范围，从而提供一个从系统安全性视角出发改进现有软件产品的方法。它们描述了使用ML组件在软件中实现系统安全的***实践，并提出了一系列的短期缓解建议，部署机器学习模块的从业人员可以参考他们的研究来保护软件系统。

原文：
https://arxiv.org/abs/2007.07205v1

将自然语言转化为移动UI操作

在ACL 2020上发表的这篇论文中，谷歌AI研究人员展示了解决自动动作序列映射问题的第一步：创建三个新的数据集，用于训练深度学习模型，将自然语言指令应用于可执行的移动用户界面操作。

他们的这一成果为移动设备上的任务自动化奠定了技术基础，从而减轻了通过UI细节进行操作的需求，这对于视力受损的用户将非常有价值。他们还开源了其模型代码和数据管道，以促进研究界的进一步发展。

Github链接：
https://github.com/google-research/google-research/tree/master/seq2act

原文：
https://arxiv.org/pdf/2005.03776.pdf

基于数据编程的工业图像标签系统

最近发布的这篇论文提出了Inspector Gadget：一种用于分类问题的可伸缩图像标签系统。该系统有效地结合了众包、数据增强和数据编程技术。Inspector Gadget的目标应用是在制造业中对大型工业图像进行部分分析，此前在这一领域很少甚至根本没有标签。

与现有的使用对象检测模型预先将图像转换为结构化数据的数据编程方法不同，Inspector Gadget通过提供众包工作流以利用人类知识来识别人们希望研究的模式来直接标记图像。然后，将图案增强并与其他图像匹配，并生成用于神经网络模型训练的相似性特征。

结果表明，Inspector Gadget优于其他图像标记方法，例如Snuba，GOGGLES以及使用CNN而不进行预训练的自习基准模型。研究人员认为，Inspector Gadget开辟了使用数据编程的新方向。

原文：
https://arxiv.org/pdf/2004.03264v2.pdf

用于通用实例再识别的Pytorch工具箱FastReID

在本文中，研究人员介绍了一个名为FastReID的开源库，该库可用于通用实例再识别。

实验结果证明了FastReID在多种任务上具有通用性和有效性，例如：人员再识别和车辆再识别等。研究人员称，共享FastReID是因为开源研究平台对整个AI社区（包括学术界和工业界的研究和从业人员）的快速进步至关重要。

他们希望通过发布FastReID来继续加速通用实例再识别领域的发展，同时也期待彼此之间的学习合作，以促进计算机视觉领域的发展。

原文：
https://arxiv.org/pdf/2006.02631v4.pdf

用于紧凑3D人脸建模的基于关节的神经装备表示（Neural Rig Representation）

本文提出了一种新的3D人脸表示方法，它使用基于关节的人脸装备（rig）搭建人脸模型。该模型非常紧凑，因此需要使用更小的数量级来保有其强大功能。这一需求可以通过学习神经蒙皮权重（neural skinning weights）来满足。研究人员还通过重新拓扑扫描、BU-3DFE、可视化Azure Kinect和2D图像等来评估模型。

该模型具有可进行人脸蒙皮编辑和装饰的优点。研究人员已经将人脸模型整合到点云和2D图像，因此未来的工作是通过学习神经网络来直接预测人脸模型参数，从而为加速实时应用重建提供可能。

原文：
https://arxiv.org/pdf/2007.06755v2.pdf

其他爆款论文

通过像素级自动图像标记实现语义图像分割，性能超过大部分已有的弱监督方法：
https://arxiv.org/pdf/2007.07415v1.pdf

有关机器学习中隐私攻击的最新调查结果：
https://arxiv.org/pdf/2007.07646v1.pdf

从平均场博弈（MFG）和***运输（OT）角度分别理解和分析生成对抗网络（GAN）：
https://arxiv.org/abs/2002.04112v2

特征量化助力GAN训练：
https://arxiv.org/pdf/2004.02088v2.pdf

表情符号预测的拓展和基准测试：
https://arxiv.org/abs/2007.07389v1

学习资源

70多个机器学习数据集和项目构想：
https://googleweblight.com/i?u=https://data-flair.training/blogs/machine-learning-datasets/

2020年机器学习项目Top 21：
https://data-flair.training/blogs/machine-learning-project-ideas/

面向初学者的免费机器学习项目构想：
https://www.skyfilabs.com/blog/free-machine-learning-project-ideas-for-beginners

DeepMind与UCL AI中心共同打造深度学习系列讲座：
https://www.***.com/playlist?list=PLqYmG7hTraZCDxZ44o4p3N5Anz3lLRVZF

AI大事件

AI芯片初创公司Graphcore开启系统业务，称其比Nvidia经济适用得多：
https://www.zdnet.com/article/ai-chip-startup-graphcore-enters-the-system-business-claiming-economics-vastly-better-than-nvidias/

ICML 2020之Google篇：
https://ai.googleblog.com/2020/07/google-at-icml-2020.html

AI的超强能力能否协助人类外科医生减少医疗错误：
https://www.zdnet.com/article/big-backing-pair-doctors-ai-assist-technology/

上一篇 : ：我们扒下了全网所有“年夜饭”菜谱，找到了最有年味的一道菜下一篇 : 云拜年攻略！用Python自动回复拜年消息，还能“抗”七姑八姨的灵魂问题

一周AI最火论文 | 讲讲话就能控制UI界面上网冲浪？

相关阅读

推荐文章