回到主页

智源社区AI周刊#027 (2020.06.22)

为了帮助中国人工智能科研、从业者更好地了解全球人工智能领域的最新资讯,智源研究院编辑团队本周整理了第27期《智源社区AI周刊》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况),数据(数据集),工具(新工具和应用推荐),求职(职场研究报告等)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。

过去一周(2020/06/15~2020/06/21),值得关注的内容有以下4方面:

  • 【2020北京智源大会直播中】第二届智源大会于 2020年6月21 - 24 日召开。本次大会群英荟萃,演讲嘉宾包括 5 位图灵奖得主以及来自全球各地的 100 + 顶尖学者。内行的AI盛会,正在进行中……(详情参见本周报“会议”栏目)
  • 在CVPR 2020上,最佳论文、最佳学生论文等奖项悉数公布,来自牛津大学的吴尚哲等人获得了最佳论文奖,本科毕业于上海交通大学、现为西蒙弗雷泽大学博士一年级学生Zhiqin Chen等人获得最佳学生论文。(详情参见本周报“会议”栏目)
  • 语言技术平台(Language Technology Platform, LTP)是哈工大社会计算与信息检索研究中心(HIT-SCIR)历时多年研发的一整套高效、高精度的中文自然语言处理开源基础技术平台。近日对LTP进行了新一轮的全面升级,并推出了LTP 4.0版本。此次升级包括基于多任务学习框架进行统一学习等改进。(详情参见本周报“代码”栏目)
  • 中国已经成为全球人工智能研究者的最大输出源国家。美国人工智能领域的顶尖研究者中,有近三分之一来自中国。在麦克罗波洛智库分析师马特·希恩看来,美国政府近期一系列面向国际研究者的“驱逐政策”,最终削弱的将是美国自身的国际竞争力。(详情参见本周报“行业与政策”栏目)

下面是各个要点的详情介绍。

▋ 论文推荐

基于节点-边缘协同解纠缠的可解释深图生成

Interpretable Deep Graph Generation with Node-Edge Co-Disentanglement

本文发表于KDD 2020。解纠缠表示学习近年来受到了广泛的关注,特别是在图像表示学习领域。然而,学习图背后的解纠缠表示在很大程度上仍未探索,特别是对于同时具有节点和边缘特征的属性图。图生成的解纠缠学习具有实质性的新挑战,包括缺乏对节点和边缘属性联合解码的图反褶积操作等。为了解决这些问题,提出了一个新的属性图深层生成模型的解纠缠增强框架。特别地,提出了一种新的变分目标来解开上述三种潜在因素,并具有新的节点和边缘反褶积结构。此外,在每种类型中,个体因素的分离进一步增强,这被证明是对现有图像框架的一般化。在综合数据集和真实数据集上的定性和定量实验证明了该模型及其扩展的有效性。

抽取用户多维度兴趣的DHAN网络

Deep Interest with Hierarchical Attention Network for Click-Through Rate Prediction

本文发表于SIGIR 2020。在CTR预估中,用户历史行为信息是很重要的一类信息,从中抽取出用户的兴趣可以有效提升推荐的效果。用户的兴趣往往遵从一种层级的模式,从higher-level的属性(如品类、价格区间、品牌)到具体到lower-level的属性(具体的item)。之前有关用户兴趣抽取的模型如阿里的DIN和DIEN模型,显然忽略了这种层级的模式,仅仅从item级别去抽取用户兴趣。针对用户兴趣遵从的层级模式,论文提出了一种新的结构:Deep Interest with Hierarchical Attention Network。

通过句子级语义匹配和答案位置推断改善问题生成

Improving Question Generation with Sentence-level Semantic Matching and Answer Position Inferring

本文发表于AAAI 2020。本文主要聚焦问答系统(Q&A)的反问题—问题生成(Question Generation,Q&G)。问题生成的目的是在给定上下文和相应答案的情况下生成语义相关的问题,问题生成任务可分为两类:一类是基于规则的方法,即在不深入理解上下文语义的情况下手动设计词汇规则或模板,将上下文转换成问题。另一类是基于神经网络的、直接从语句片段中生成问题词汇的方法,包括序列-序列模型(seq-to-seq)、编码器解码器(encoder-decoder)等。本文讨论的是后一种基于神经网络的问题生成方法。本文的亮点主要包括:

1. 以多任务学习的方式学习句子级语义;2. 引入答案位置感知。

基于纹理Transformer模型的图像超分辨率技术

Learning Texture Transformer Network for Image Super-Resolution

本文发表于CVPR 2020。Transformer结构被广泛应用于自然语言处理任务,取得了显著的成果,然而其在图像生成领域中鲜有应用。针对于图像超分辨率问题,微软亚洲研究院创新性地提出了一种基于纹理Transformer模型的图像超分辩率方法(TTSR),取得了显著的效果。该模型可以有效地搜索与迁移高清的纹理信息,最大程度地利用了参考图像的信息,并正确地将高清纹理迁移到生成的超分辨率结果当中,解决纹理模糊和纹理失真的问题。

现实世界超图的结构模式和生成模型

Structural Patterns and Generative Models of Real-world Hypergraphs

本文发表于KDD 2020。图已被用作对人或物之间的成对关系建模的强大工具。这种结构是一种特殊类型的概念,称为超图,其中每个超边可能包含任意数量的节点,而不仅仅是两个。大量的数据集都是这种形式的-例如,从组织发送的电子邮件的收件人列表,用户参与讨论的主题或在非在线问题中标记的主题标签。但是,由于表示形式复杂且缺少适当的工具,因此很少关注探索这些交互中的基本模式。在这项工作中,作者根据经验研究了多个跨领域的超图数据集。为了进行深入研究,作者引入了多级分解方法,该方法通过一组成对图表示每个超图。每个成对的图捕获了k个节点的子集对之间的交互作用。根据经验,作者发现一个示教分解级,研究的超图遵循五个结构特性。这些属性用作评估超图的标准,并为超图生成问题奠定基础。作者还提出了一种超图生成器,它非常简单,但能够满足这些评估指标,而其他基线生成器模型则很难实现。

▋ 观点

RACV2019观点集锦|主动视觉:感知、行为与动机

区分于传统计算机视觉的任务模式,主动视觉强调智能体对环境的主动感知、主动交互与动态反馈,其更接近于人类智能和生物智能的工作方式。萌芽于上世纪70年代的主动视觉,由于其任务本身极具挑战且涉及多学科发展,历经过去几十年的发展一直不温不火,鲜有重大突破性进展。近年来随着传统视觉感知方法的日趋成熟和视觉传感设备的技术进步,工业机器人、自动驾驶等应用领域催生了对于主动视觉技术的迫切需求,这是否会触发该方向的新一轮研究热潮?为进一步促进交流与思考,RACV 2019组织了“主动视觉:感知、行为与动机”专题,各位专家从主动视觉的形成与发展、主动视觉与传统视觉的区别与挑战、三维感知与主动交互的应用、未来前景与趋势等几个方面开展了深入研讨。

▋ 行业与政策

全球AI人才追踪调查:美国的尖端AI研究者29%来自中国

中国已经成为全球人工智能研究者的最大输出源国家。美国人工智能领域的顶尖研究者中,有近三分之一来自中国。在麦克罗波洛智库分析师马特·希恩看来,美国政府近期一系列面向国际研究者的“驱逐政策”,最终削弱的将是美国自身的国际竞争力。

人工智能产业发展深度报告:格局、潜力与展望

人工智能(Artificial Intelligence,AI)是利用机器学习和数据分析方法赋予机器模拟、延申和拓展类人的智能的能力,本质上是对人类思维过程的模拟。AI概念最早始于1956年的达特茅斯会议,受限于算法和算力的不成熟,未能实现大规模的应用和推广。近年来,在大数据、算法和计算机能力三大要素的共同驱动下,人工智能进入高速发展阶段。据中国电子学会预测,2022全球人工智能市场将达到1630亿元,2018-2022年CAGR达31%。人工智能赋能实体经济,为生产和生活带来革命性的转变。人工智能作为新一轮产业变革的核心力量,将重塑生产、分配、交换和消费等经济活动各环节,催生新业务、新模式和新产品。从衣食住行到医疗教育,人工智能技术在社会经济各个领域深度融合和落地应用。同时,人工智能具有强大的经济辐射效益,为经济发展提供强劲的引擎。据埃森哲预测,2035年,人工智能将推动中国劳动生产率提高27%,经济总增加值提升7.1万亿美元。

闵万里创办的坤湛科技,获超2000万美元首轮融资

近日,坤湛科技宣布完成超2000万美元首轮融资,由高榕资本领投,投后估值近2亿美元。坤湛科技由闵万里(山景)博士创办,定位于产业智能解决方案服务商,聚焦为传统长青产业提供数字化转型与智能升级解决方案。据悉,本轮融资将主要用于加速业务扩展与团队建设。坤湛科技以数据技术推动产业智能升级,聚焦传统产业(工业、农业、零售、物流、医疗等)提供沉浸式数字化转型与智能升级服务,涵盖从战略规划到技术实施的整合解决方案。

▋ 人物

加拿大工程院新增16位华人院士,华为5G专家朱佩英、AI专家芮勇、裴健入选

6月15日,加拿大工程院官方网站公布了52名新院士,其中包括50位院士,两位外籍院士。两位外籍院士分别是芮勇和张涛,前者是联想集团公司首席技术官兼高级副总裁,后者是中科院副院长、中科院院士、中国科学院大连化学物理研究所教授。另外,华为5G专家朱佩英,前华为首席科学家、AI专家裴健也在名单之列。

▋ 数据

《中国图象图形学报》梳理并推出141个常用的行为动作数据集

数据驱动的人工智能技术正在飞速发展,许多国际知名的数据集、样本库都成为开展科学研究、实验检测、成果推广不可缺少的重要资源,并成为学术论文的重要组成部分。与此同时,我们也迫切地需要更具多样性的开放测试数据集,以满足不断涌现的大量创新性科研工作中更公开透明地测试和验证。本文带来141个常用的行为动作数据集。
 

中国图象图形学报 | 参与讨论

▋ 代码

LTP 4.0:单模型完成6项自然语言处理任务

语言技术平台(Language Technology Platform, LTP)是哈工大社会计算与信息检索研究中心(HIT-SCIR)历时多年研发的一整套高效、高精度的中文自然语言处理开源基础技术平台。该平台集词法分析(分词、词性标注、命名实体识别)、句法分析(依存句法分析)和语义分析(语义角色标注、语义依存分析)等多项自然语言处理技术于一体。近日对LTP进行了新一轮的全面升级,并推出了LTP 4.0版本。此次升级的主要改进为:1. 基于多任务学习框架进行统一学习,使得全部六项任务可以共享语义信息,达到了知识迁移的效果。既有效提升了系统的运行效率,又极大缩小了模型的占用空间;2. 基于预训练模型进行统一的表示,有效提升了各项任务的准确率;3. 基于教师退火模型蒸馏出单一的多任务模型,进一步提高了系统的准确率;4. 基于PyTorch框架开发,提供了原生的Python调用接口,通过pip包管理系统一键安装,极大提高了系统的易用性。
 

哈工大SCIR | 参与讨论

中国古典诗词预训练模型BERT-CCPoem开源

近日,清华大学人工智能研究院自然语言处理与社会人文计算研究中心在GitHub上开源了中国古典诗词预训练模型BERT-CCPoem。BERT-CCPoem是完全基于一个囊括了几乎所有中国古典诗词的语料库CCPC-Full v1.0训练而成的,该语料库共计926024首诗词及8,933,162个诗词句子。BERT-CCPoem的模型参数系针对中国古典诗词库规模“度身定做”,采用了512维隐层向量、8层、每层8个注意头的适度配置。BERT-CCPoem以汉字为基本语言单元,将频度低于3的字处理成UNK,所形成的字典含11809个字型。BERT-CCPoem能提供任何一首古典诗词的任何一个句子的向量表示,可广泛应用于古典诗词智能检索与推荐、风格分析及情感计算等诸多“下游”任务。一个典型的应用场景是,可根据用户指定任一句子的向量表示,计算出与该句具有“语义”关联性的句子子集。
 

清华大学 | 参与讨论

谷歌开源“穷人版”摘要生成NLP模型天马PEGASUS

BERT、GPT-2、XLNet等通用语言模型已经展现了强大的威力,它们可以应付各类任务,比如文本生成、问答。当这些模型对各种语言任务进行微调时,可以达到SOTA性能。以上这些NLP模型都是“通才”,虽然全面,但在面向特定任务时需要微调,训练数据集也十分庞大,非一般人所能承受。如果开发一个非通用NLP模型,专门针对某项具体任务,在降低训练成本的同时,性能会不会提高呢?这就是谷歌发布的“天马”(PEGASUS)模型,它专门为机器生成摘要而生,刷新了该领域的SOTA成绩,并被ICML 2020收录。“天马”模型仅使用1000个样本进行训练,就能接近人类摘要的水平,大大减少了对监督数据的需求,创造了低成本使用的可能性。

▋ 教程

【CVPR2020-Tutorial】视觉的图网络结构表示学习

近年来,卷积神经网络在大量计算机视觉任务中的应用出现了戏剧性的增长。卷积结构在许多任务中都是非常强大的,它可以从图像像素中提取相关性和抽象概念。然而,当面对一些更困难的计算机视觉任务时,ConvNets在建模中也有相当多的属性方面存在缺陷。这些属性包括成对关系、全局上下文和处理超越空间网格的不规则数据的能力。一个有效的方向是根据手头的任务重新组织要用图处理的数据,同时构建网络模块,在图内的视觉元素之间关联和传播信息。作者将这种具有传播模块的网络称为图网络结构。在本教程中,作者将介绍一系列有效的图网络结构,包括非局部神经网络、空间广义传播网络、面向对象和多主体行为建模的关系网络、面向3D领域的视频和数据的图网络。作者还将讨论如何利用图神经网络结构来研究连接模式。最后,作者将讨论在许多视觉问题中仍然存在的相关开放挑战。

【书籍】清华孙茂松、刘知远团队专著《知识图谱与深度学习》

知识图谱作为人类知识结构化形成的知识系统,是人工智能研究和智能信息服务的基础核心技术,被广泛应用于搜索引擎、问答系统、智能对话系统以及个性化推荐等知识驱动的领域。近日,清华大学刘知远、韩旭、孙茂松等人出版《知识图谱与深度学习》一书。该书展现了数据驱动的深度学习与符号表示的知识图谱之间相互补充和促进的技术趋势,对于人工智能基础研究具有一定的参考意义,既适合专业人士了解知识图谱、深度学习和人工智能的前沿热点,也适合对人工智能感兴趣的本科生和研究生作为学习读物。

【书籍】现代数据挖掘算法C++和CUDA

发现各种有用的数据挖掘算法,这些算法可以从庞大的候选数据中选择小的重要特征集,或者从测量变量中提取有用的特征。作为一个严谨的数据挖掘程序员,将经常面对数以千计的候选特征,用于预测或分类应用程序,其中大多数特征几乎没有价值或没有价值。读者将知道,其中许多特征可能只有在与某些其他特征结合时才有用,而单独使用或与大多数其他特征结合时实际上是毫无价值的。有些特征可能具有巨大的预测能力,但只能在特征空间的一个小的、专门的领域内。这本书通过介绍现代的特性选择技术和实现这些技术的代码来帮助读者解决这个问题。

▋ 新工具

fastHan:基于BERT的中文NLP集成工具

fastHan是基于fastNLP与pytorch实现的中文自然语言处理工具,像spacy一样调用方便。其内核为基于BERT的联合模型,其在13个语料库中进行训练,可处理中文分词、词性标注、依存句法分析、命名实体识别四项任务。fastHan共有base与large两个版本,分别利用BERT的前四层与前八层。base版本在总参数量150MB的情况下各项任务均有不错表现,large版本则接近甚至超越SOTA模型。

亚马逊AI Lab开源大规模药物重定位知识图谱DRKG

最近,来自亚马逊上海AI实验室、亚马逊AI北美、明尼苏达大学、俄亥俄州立大学、湖南大学等机构的团队,正式开源了大规模药物重定位知识图谱 DRKG和一套完整的用于进行药物重定位研究的机器学习工具,助力新冠及其他疾病的药物重定位研究。近日,亚马逊上海AI实验室联合来自亚马逊AI北美、明尼苏达大学、俄亥俄州立大学、湖南大学的研究者,共同构建了大规模药物重定位知识图谱 DRKG,以及一套完整的用于进行药物重定位研究的机器学习工具,并将其在github上开源给全世界研究机构,帮助相关研究人员更有效地对新冠病毒及其它疾病(如阿尔茨海默病)进行药物重定位研究。

腾讯优图开源新一代移动端推理框架TNN

从学界到工业界,“开源”已经成为AI领域的一个关键词。一方面,它以“授人以渔”的方式为AI构建了一个开放共进的生态环境,帮助行业加速AI应用落地;另一方面,在解决行业实际问题时持续更新和迭代,源源不断地给AI领域输送重要的技术养料和创造力,可以说开源是AI落地和繁荣不可或缺的源动力。近日,腾讯优图实验室宣布正式开源新一代移动端深度学习推理框架TNN,通过底层技术优化实现在多个不同平台的轻量部署落地,性能优异、简单易用。腾讯方面称,基于TNN,开发者能够轻松将深度学习算法移植到手机端高效的执行,开发出人工智能App,真正将AI带到指尖。

▋ 应用

斯坦福团队开发AI视力测试系统

如今,视力限制性眼病普遍存在,影响着全球数十亿人,仅在中国,近视人数就已超过6亿。对于患有眼部疾病的患者或人群,精确测量视力,是早期诊断和治疗视力损害的关键部分。近日,斯坦福大学(Stanford University)计算机科学家克里斯·皮奇(Chris Piech)及其同事开发了一种由人工智能(AI)推动的在线视力测试系统,该系统仅需进行四步操作,即可完成视力测试,且结果十分精准。Science杂志报道称,这种全新的测试诊断结果比传统的字母表测试更准确。如果进一步完善的话,这种测试还可以让眼疾患者在家里就可以完成视力测试。而这也意味着,传统的眼科检查可能迎来全新升级。

MyVoiceYourFace:一键Deepfake,人人都能用的视频自动换脸网站上线

AI换脸应用ZAO因为侵犯个人隐私下架没多久,另一个在线服务又映入人们的眼帘。最近几天,一个名叫MyVoiceYourFace的网站吸引了我们的注意。用户只需上传一张照片和一段视频,网站会用照片里的人脸,替换掉视频里面的人脸。

世界首个AI水墨画家,将传统中国山水画推向全新方向

近日,在一场跨界展览“Making Moments”展会上,香港电影特效导演、跨媒体创作人黄宏达(Victor Wong)开发的人工智能(AI)绘画机器人Gemini,及其创作的系列写意山水画,吸引了众人的关注。这些由AI创作的山水画,包括开创性的AI山水画作品Escapism系列、Far Side of the Moon系列,既融入了写意的传统,同时又结合了画笔的线条、力度和坡度等技巧。

▋ 会议

2020北京智源大会直播中

本次大会群英荟萃,演讲嘉宾不仅包括5位来自美国、加拿大和法国的图灵奖得主:Alan Kay、Judea Pearl、Manuel Blum、Joseph Sifakis、John Hopcroft(智源学术顾问委员会委员);还有人工智能各领域多位世界级的专家:英国曼彻斯特大学教授、智源学术顾问委员会委员Steve Furber;瑞士AI实验室教授、LSTM之父Jürgen Schmidhuber;美国工程院院士、中国科学院外籍院士、密歇根州立大学教授Anil Jain(H-index 188,高居计算机科学领域全球第一);美国工程院院士、数值优化权威Jorge Nocedal;哥伦比亚大学数据科学研究院院长周以真(Jeannette M. Wing);美国工程院院士、MIT Connection Science实验室主任Alex Pentland;AAAI候任Chair、康奈尔大学教授Bart Selman;MIT CSAIL教授、智能医疗专家Regina Barzilay;CMU教授、苹果AI负责人Ruslan Salakhutdinov等。国内专家则包括中国科学院院士、智源学术顾问委员会Chair张钹;创新工场创始人兼CEO李开复;奇绩创坛创始人兼CEO陆奇;清华大学教授张亚勤等学术界和产业界的领袖。

CVPR 2020华人一作包揽最佳论文、最佳学生论文

在CVPR 2020上,最佳论文、最佳学生论文等奖项悉数公布,来自牛津大学的吴尚哲等人获得了最佳论文奖,本科毕业于上海交通大学、现为西蒙弗雷泽大学博士一年级学生Zhiqin Chen等人获得最佳学生论文。

▋ 经验

Nature:好导师的16个标准

在任何学科领域,是否有一个好导师将决定学生的研究生涯初期的成败。2005年,Nature创立了the Nature awards for mentoring in science,用于表彰在指导研究生方面卓有成效的导师。有关人员广泛收集总结了学生们对其导师的评价,总结为给导师的16条建议,如对学生的智力与能力的尊重,对学生职业发展(甚至选择非学术道路)的尊重等等。

以上是《智源社区AI周刊》第27期的内容,智源研究院编辑团队将本着“提供真正内行的AI资讯”的目标,不断优化和完善我们的内容服务,各位读者们如有批评意见,或者好的建议,请不吝赐教发至:editor@baai.ac.cn。谢谢大家。

特约编辑:刘布楼 常政 贾伟 刘沂喆 付建振

所有文章
×

还剩一步!

确认邮件已发至你的邮箱。 请点击邮件中的确认链接,完成订阅。

好的