回到主页

智源社区AI周刊#007 (2020.01.27)

——智源社区AI周刊 发布于 2020/01/27

为了帮助中国人工智能科研、从业者们更好地了解全球人工智能领域的最新资讯,智源研究院编辑团队本周整理、编辑了第7期《智源社区AI周刊》,从学术(论文和新思想分享、最新学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况)、数据(数据集分享),产品(新工具和应用推荐),求职(职场研究报告等)等诸多角度,鸟瞰过去一周内在人工智能领域值得关注的新思想、新动向和新成果等,以飨大家。

在过去一周(2020/01/20~2020/01/26)左右时间,首先值得推荐的内容有以下3方面:

  • 根据欧洲议会近日的一项立法草案,欧盟正在考虑在未来 3~5 年内禁止在公共场所使用人脸识别技术。欧盟希望通过相关立法,防止该人脸识别技术被滥用、侵犯个人隐私等。根据该提案,这一新监管框架“建议 3 至 5 年内禁止在公共场合应用人脸识别技术,并留出更多时间评估技术风险”。这些公共场合包括火车站、运动场和购物中心等。法案的最终版本预计于 2 月份发布。(详情参见本周报“行业与政策”栏目)

  • 随着人脸识别技术的普及,隐私保护和数据安全之类的话题已然成为了社会焦点,也是很多网络安全机构的重点观察对象。近日,一家名为 GDI 基金会的荷兰非盈利组织发现,一个包含数千名中国学生和儿童信息的人脸识别数据库未经保护,可以在互联网上公开访问。该数据库与一套名为“Safe School Shield”的监控系统相连接,由第三方公司托管于阿里巴巴的云服务器上。(详情参见本周报“数据”栏目)

  • 近日,阿里开源了基于 MNN 引擎的项目 MNNKit,面向安卓和 iOS,以 SDK 的方式提供 AI 端侧推理能力。开发者不需要了解算法细节就可以直接使用。目前,MNNKit 已经有人脸检测、手势识别、人像分割等,后续可能有更多 API 接入。(详情参见本周报“新工具”栏目)

下面,是上一周(2020/01/20~2020/01/26)左右时间内,在AI领域值得关注的各个要点的详情介绍。

▌ 论文推荐

NAS-BENCH-201:加速神经网络框架检索

NAS-BENCH-201: Extending the Scope of Reproducible Neural Architecture Search

神经网络结构对深度学习领域的各个应用的性能都起着至关重要的作用,目前,网络结构的设计范式已经逐渐的从专家手动设计转变为了机器自动搜索。网络结构搜索 (Neural Architecture Search,NAS) 旨在研究如何在一个给定的搜索空间内自动地发现高性能高精度高效率的网络结构。在过去的几年内,越来越多的科研人员投入到NAS这一研究领域,越来越多的NAS方法被提出,整个领域也取得了许多突破性的进展。现在是时候回顾一下NAS领域好的一面和不好的一面了。NAS除了以良好的性能著称,还因为海量的计算需求而让众多研究员望而却步,同时目前各个NAS算法的实验设置不尽相同,难以去公平的衡量一个NAS算法的真实好坏。为了进一步推动NAS算法的可复现性,为了降低NAS算法的计算需求,为了让大家着眼于NAS算法的本质,且启发后续的NAS算法,本文提出了NAS-Bench-201。

来源:ICLR 2020 | 论文下载

基于树状结构策略的渐进强化学习

Tree-Structured Policy based Progressive Reinforcement Learning for Temporally Language Grounding in Video

Temporally Language Grounding in Video (自然语言描述的视频片段定位)是视频理解中一项新的具有挑战性的任务,其目标是确定视频中与给定句子描述相对应视频片段的时间边界。该任务需要对语言和视频等模态进行融合理解,并且建模语言和视觉模态之间的联合语义关系。现有的方法大多效率低下且灵活性不高,依赖于稠密的滑动窗口,需要对许多交叉的滑动窗口进行匹配或者穷举搜索;另一方面,现有方法缺乏可解释性,偏离了人的推理机制。当人们在视频中定位描述时,通常假设一个初始的视频片段边界,比较和分析句子描述和边界内视频片段之间的语义差异。然后逐步执行一系列连续动作,如缩放或移动来调节边界。深入研究人类的思维范式,人们通常会进行出一个从粗到细的思考过程,从而做出一个更为合理和可解释的决定。这种自上而下的由粗到细的推理模式已经在机器翻译、文本摘要等任务中得到了探索。基于此,作者提出了一种新的基于树结构策略的渐进强化学习(TSP-PRL)框架,采用迭代优化过程来对边界进行顺序调节。该框架可以有效地分解复杂的行动策略,在增加搜索空间的同时减少搜索步骤的数量,以更合理的方式获得更佳的结果。

来源:AAAI 2020 | 代码链接 | 论文下载 

无需任何真实仿冒签名数据亦可训练高性能笔迹鉴别模型

SynSig2Vec: Learning Representations from Synthetic Dynamic Signatures for Real-world Verification

该论文针对联机签名认证任务中真实签名数据难以获取的难题,提出了一种基于书写运动学理论的签名合成方法,可以基于模板签名合成出不同形变程度的签名样本,并通过优化签名相似度排序的平均准确率(Average Precision,AP)指标进行特征学习,本文提出的SynSig2Vec方法在两个公开的联机签名认证数据集上比之前最好方法大幅度地降低了签名认证错误率。该方法的一个主要亮点是无需任何随机仿冒或专业仿冒的真实负样本数据,也可训练一个高性能的笔迹鉴别模型。

来源:AAAI 2020 | 论文下载

AdaBERT压缩方法

AdaBERT: Task-Adaptive BERT Compression with Differentiable Neural Architecture Search

BERT 等大型预训练语言模型研究已经表明,它们能够有效地处理多种不同的自然语言处理任务。但是,这些模型的参数规模庞大,难以部署到需要通过有限资源执行快速推理的实时应用中。对于这一问题,现有的方法是将 BERT 压缩成小型模型,但这种压缩方法与任务无关,也就是说对于不同的下游任务而言,压缩方法是一样的。面向任务的 BERT 压缩方法是有必要的而且很有用,为此阿里巴巴的研究者提出了一种全新的压缩方法 AdaBERT。该方法利用了可微神经架构搜索来自动将 BERT 压缩成适应不同特定任务的小型模型。研究者为 AdaBERT 提出了两种不同的损失函数。一是面向任务的知识注入损失,可为搜索过程提供提示;二是效率感知型损失,这能提供搜索约束。这两个损失能为任务适应型 BERT 压缩提供效率和有效性之间的平衡。研究者在多个 NLP 任务上对 AdaBERT 进行了评估,结果表明这些任务适应型压缩模型在保证表现相当的同时,推理速度比 BERT 快 12.7 到 29.3 倍,同时参数缩小至 BERT 的 11.5 到 17.0 之一的规模。

来源: AAAI 2020 | 论文下载 

张量图卷积网络文本分类

Tensor Graph Convolutional Networks for Text Classification

图神经网络(GNN,Graph Neural Networks)用于图结构数据的深度学习架构,具有强大的表征建模能力,将端到端学习与归纳推理相结合,业界普遍认为其有望解决深度学习无法处理的因果推理、可解释性等一系列瓶颈问题。本文研究了基于图神经网络在文本分类问题中的应用,并提出了一种新的框架TensorGCN(张量图卷积网络)。首先构造一个文本图张量来描述语义、句法和序列上下文信息。然后,对文本图张量进行两种传播学习。第一种是图内传播,用于在单个图中聚合来自邻域节点的信息。第二种是图间传播,用于协调图之间的异构信息。在基准数据集上进行的大量的实验表明了该框架的有效性。我们提出的TensorGCN为协调和集成来自不同类型图的异构信息提供了一种有效的方法。

来源:AAAI 2020 | 论文下载 | 代码链接

▌ 观点

斯坦福大学马腾宇:显式的正则化方法可能是理解深度学习的更好选择
 

在北京智源人工智能研究院主办的海外学者报告会上,斯坦福大学的马腾宇带来了一场干货味十足的报告,不仅基于近期聚焦的研究工作“设计显式的正则化器”分享了理解深度学习的方法,还基于自己的研究经验分享了不少研究方法论和观点。他指出,现在用来理解深度学习的常用方法是隐式的正则化方法,然而他们在研究中发现,显式的正则化方法可能是更好的选择。同时,他强调,计算机科学跟物理、生物等传统科学的不同之处在于:可以不断地设计新的算法。“虽然我们无法理解现有的深度学习算法,但我们可以设计我们既能理解又能保证有效的新算法。”

▌ 行业和政策

欧盟正考虑3~5年内禁止公共场所人脸识别

根据欧洲议会近日的一项立法草案,欧盟正在考虑在未来 3~5 年内禁止在公共场所使用人脸识别技术。欧盟希望通过相关立法,防止该人脸识别技术被滥用、侵犯个人隐私等。根据该提案,这一新监管框架“建议 3 至 5 年内禁止在公共场合应用人脸识别技术,并留出更多时间评估技术风险”。这些公共场合包括火车站、运动场和购物中心等。法案的最终版本预计于 2 月份发布。消息一发布,也在硅谷科技界引发正反两面的讨论:Alphabet CEO Sundar Pichai 表示支持这个决定,而微软全球总裁 Brad Smith 则是较冷淡的态度。Pichai 表示,毫无疑问,需要对 AI 进行监管,但规则制定者应严谨行事。“明智的监管需要配套的措施,在潜在危害与社会进步之间取得平衡。在高风险但又有高价值的地区尤其如此。”他说。Pichai 认为,监管机构应根据不同部门制定规则,例如说医疗场景和自动驾驶场景所需要遵循的规则应该是不同的,“政府应该调整规则并就核心价值达成共识”。Brad Smith 则称,此类禁令正如使用切肉刀“一刀切”而非使用手术刀精确打击来解决潜在问题。Pichai 在布鲁塞尔的智库机构 Bruegel 组织的一次会议上说:“我认为,政府和法规尽早解决此问题并为之提供一个框架非常重要。”

AI芯片公司耐能智慧获李嘉诚领投4000万美元

耐能智慧业务主要聚焦在终端 AI 芯片解决方案上,是一家设计及开发软硬件整合的终端人工智能解决方案厂商,主攻智能手机、智能安防、智能物联网等领域。耐能的核心技术是一种高效率、低耗电的神经网络芯片(NPU),专注在终端市场。刘峻诚此前在接受采访时表示,这也是他们的核心竞争力。跟大陆的寒武纪、地平线等处于同一市场。2015年创业至今,耐能深耕终端人工智能领域,以自主研发的AI芯片与领先的图像识别算法赋能智能物联网、智能安防、工业控制等领域,并与多家厂商达成合作。2019年5月,耐能发布了首款AI芯片——KL520智能物联网AI SoC,其支持2D、3D图像识别,适用于结构光、ToF、双目视觉等3D传感技术并计算不同神经网络模型,算力最高可达345GOPS (300MHz) ,典型功耗仅500毫瓦,获得CES Asia 2019创新奖。

来源:crunchbase

▌ 数据

数千中国学生的人脸识别数据遭泄露

随着人脸识别技术的普及,隐私保护和数据安全之类的话题已然成为了社会焦点,也是很多网络安全机构的重点观察对象。近日,一家名为 GDI 基金会的荷兰非盈利组织发现,一个包含数千名中国学生和儿童信息的人脸识别数据库未经保护,可以在互联网上公开访问。该数据库与一套名为“Safe School Shield”的监控系统相连接,由第三方公司托管于阿里巴巴的云服务器上。GDI 基金会研究员 Victor Gevers 表示,“我们就数据库问题向阿里巴巴公司发送了警告电子邮件,随后在社交媒体上披露了。目前管理员已经将数据保护起来了,不清楚管理员的身份(不清楚管理员来自阿里巴巴,还是第三方公司的)。”公开资料显示,GDI 基金会以维护网络信息安全为主要目标,Gevers 是该基金会的联合创始人,同时他还在荷兰政府部门工作,曾任 IT 安全架构师。他在网络安全领域经验丰富,领导旗下研究员参与披露了多起数据泄露和网络安全漏洞事件。

▌ 会议

2020顶会指南:征稿截止时间、举办地、举办时间

2 月初,2020 年第一个人工智能顶会 AAAI 2020 将于美国纽约举办。此届 AAAI 收到了 8800 篇提交论文,刷新历史记录,预示着 2020 年的 AI 顶会依然火爆。本文根据清华大学博士生 jackietseng 的项目整理了一份 2020 年顶会时间表,其中的信息已经过查证,有兴趣的读者可以参考。

来源:Github | 机器之心 

▌ 代码

如何实现决策树可视化

在适用于结构化数据的机器学习模型中,梯度提升和随机森林可以称得上是明星级模型,而决策树则是这两者的基石。决策树的可视化工作对于了解这些模型的工作原理有极大的帮助。然而目前的可视化软件工具很基础,对新手并不友好。例如,我们无法利用现有的库展示每个节点是如何划分变量的。此外,当把一个新样本放到决策树中进行预测时,我们只能生成一张可供展示的结果图片,而很难运用现有工具将整个过程可视化。因此本文作者创建了一个通用包来在scikit-learn上可视化决策树模型以及解释模型。本文将演示可视化的效果和具体使用方法。

来源: Explain.ai | 数据派THU 

如何使用Pdpipe与Pandas构建管道?

Pandas 是 Python 生态系统中的一个了不起的库,用于数据分析和机器学习。它在 Excel/CSV 文件和 SQL 表所在的数据世界与 Scikit-learn 或 TensorFlow 施展魔力的建模世界之间架起了完美的桥梁。数据科学流通常是一系列的步骤:数据集必须经过清理、缩放和验证,之后才能被强大的机器学习算法使用。当然,这些任务可以通过 Pandas 等包提供的许多单步函数或方法来完成,但更为优雅的方式是使用管道。在几乎所有的情况下,通过自动执行重复性任务,管道可以减少出错的机会,并能够节省时间。Pandas还提供了 `.pipe` 方法,可用于类似的用户定义函数。但是,在本文中,我们将讨论的是非常棒的小库,叫 pdpipe,它专门解决了 Pandas DataFrame 的管道问题。

来源:AI科技大本营 | 报道链接 

如何防止模型的精度损失?

训练过神经网络的小伙伴都知道,神经网络的参数和中间结果绝大部分都是单精度浮点数(即float32)存储和计算的,当网络变得超级大时,降低浮点数精度,比如使用半精度浮点数,显然是提高计算速度,降低存储开销的一个很直接的办法。然而副作用也很显然,如果我们直接降低浮点数的精度直观上必然导致模型训练精度的损失。《MIXED PRECISION TRAINING》是百度&Nvidia研究院一起发表的,结合N卡底层计算优化,提出了一种灰常有效的神经网络训练加速方法,不仅是预训练,在全民finetune BERT的今天变得异常有用哇。而且调研发现,不仅百度的paddle框架支持混合精度训练,在Tensorflow和Pytorch中也有相应的实现。本文先来讲讲理论,后面再分析混合精度训练在三大深度学习框架中的打开方式。

来源:新智元 | 报道链接  

如何构建识别图像中字符的自动程序?

光学字符识别和手写文本识别是人工智能领域里非常经典的问题。OCR 很简单,就是将文档照片或场景照片转换为机器编码的文本;而 HTR 就是对手写文本进行同样的操作。作者在文章中将这个问题分解成了一组更小型的问题,本文将帮助计算机视觉爱好者大致了解如何对文档图像中的文本进行识别。包括1.按文档边框裁剪图像;2.预处理词图像;3.判断是否是手写词;4.使用tensorflow中的HTR和OCR工具Tesseract。

来源:medium | 机器之心  

▌ 教程

【书籍】深度学习在检索中的应用

深度学习搜索是一本实用的书,关于如何使用(深度)神经网络来帮助建立有效的搜索引擎。这本书研究了一个搜索引擎的几个组成部分,提供了关于它们如何工作的见解,以及如何在每个环境中使用神经网络的指导。重点介绍了基于实例的实用搜索和深度学习技术,其中大部分都有代码。同时,在适当的地方提供相关研究论文的参考资料,以鼓励阅读更多的书籍,加深对特定主题的知识的理解。读完这本书,将对搜索引擎的主要挑战有所理解,它们是如何处理的以及深度学习可以做些什么来提供帮助。并且将对几种不同的深度学习技术以及它们在搜索环境中的适用范围有所理解,将很好地了解Lucene和Deeplearning4j库。这本书主要分为3个部分:第1部分介绍了搜索、机器学习和深度学习的基本概念;第2部分讨论了可以通过深度神经网络更好地解决的常见搜索引擎任务;第3部分将介绍更复杂的场景,如深度学习机器翻译和图像搜索。

来源:Adobe | PDF下载 

【书籍】机器学习系统

这个规模的设计是一个示例丰富的指南,教你如何在你的机器学习系统中实现反应式设计解决方案,使它们像一个构建良好的web应用一样可靠。首先介绍了反应性机器学习基础,然后介绍如何建立一个反应式机器学习系统(收集数据、生成特征、学习模型、评估模型、发布模型),最后介绍如何操作一个机器学习系统。响应式机器学习汇集了几个不同的技术领域,而本书的第一部分旨在确保您对所有这些领域都有足够的了解。第二部分将建立您对机器学习系统组件的知识,从原始数据开始,一直循环到真实世界。第三部分在运行机器学习系统的整个生命周期中,必须完成各种工作,以便您可以更改和改进系统。

来源:manning | PDF下载 | 课程链接 

【教程】微软Azure 深度学习,构建和部署人工智能解决方案

Azure与微软的人工智能平台并驾齐驱,学习创新和加速开放和强大的工具和服务,将人工智能带到每个数据科学家和开发人员。人工智能(AI)是新常态,深度学习算法和硬件的创新正在快速发展。这本书由微软的数据科学专家撰写,微软人工智能平台的深度学习帮助你如何在Azure上进行深度学习,并利用深度学习来创建创新和智能的解决方案。阅读本书你将学习1.熟悉微软Azure上用于深度学习的工具、基础架构和服务,如Azure机器学习服务和批量人工智能。2.使用预先构建的人工智能功能(计算机视觉、OCR、性别、情感、地标检测等)。3.理解常见的深度学习模型,包括卷积神经网络(CNNs)、递归神经网络(RNNs)、生成对抗网络(GANs)和样本代码,并了解该领域如何演变。4.在Azure上训练和操作深度学习模型

来源:微软 | PDF下载 

【深度】对ResNet本质的一些思考

ResNet这东西,描述起来固然简单,但是对它的理解每深一层,就会愈发发现它的精妙及优雅,从数学上解释起来非常简洁,非常令人信服,而且直切传统痛点。ResNet本质上就干了一件事:降低数据中信息的冗余度。具体说来,就是对非冗余信息采用了线性激活(通过skip connection获得无冗余的identity部分),然后对冗余信息采用了非线性激活(通过ReLU对identity之外的其余部分进行信息提取/过滤,提取出的有用信息即是残差)。其中,提取identity这一步,就是ResNet思想的核心。从本文的观点来看,因为从数据中拿掉了非冗余信息的identity部分,会导致余下部分的信息冗余度变高。这就像从接近饱和的溶液中移走了一部分溶质,会使得剩下的溶液的饱和度降低,一个道理。

来源:知乎 | CVer

▌ 新工具

阿里开源MNNKit:基于MNN的移动端深度学习SDK,支持安卓和iOS

近年来,很多企业都在研发面向移动端的深度学习框架。在国内有 小米的 Mace、腾讯的 FeatherCNN(腾讯 AI)和 ncnn(腾讯优图)、百度的 Paddle-moblie 等。而阿里也开发了自己的移动端深度学习框架 MNN。近日,阿里开源了基于 MNN 引擎的项目 MNNKit,面向安卓和 iOS,以 SDK 的方式提供 AI 端侧推理能力。开发者不需要了解算法细节就可以直接使用。目前,MNNKit 已经有人脸检测、手势识别、人像分割等,后续可能有更多 API 接入。MNNKit 可以分为三层结构,从底向上分别为:1.MNN 引擎层,是 MNN库在 Android/iOS 上编译好的包的二进制 Release 版本,提供端侧运行环境。2.Core 基础层,这主要抽象和封装与 MNN c++接口调用粒度基本一致的上层 API,iOS 通过 OC 接口提供,Android 通过 Java 接口提供(TODO)。这一层同时也为上层 SDK 提供一些公共服务类或结构定义。3.业务 Kit 层,包括了人脸检测、手势识别封装的 API。据项目介绍,之后的业务 Kit 层会不断扩展。

来源:阿里巴巴 | 报道链接 | 项目链接

基于动作中心点轨迹的全新Anchor Free时空检测框架:MOC-Detector

现有的action tubelet detector大多依赖于3D anchor的设计,相比于目标检测中2D anchor的设计更加复杂,会带来繁重的计算,并且当输入序列变长人物运动位移变大,在时序上固定anchor回归人物位置大小不再线性,会影响定位精度,因此在本文中我们提出了一种全新的anchor-free时空动作检测框架,称为MOC-detector(MovingCenter Detector),基于运动信息可以有效提高识别精度,协助人物定位的分析,该项目将动作实例建模为每一帧动作中心点沿时序的运动轨迹,依照这种对动作的简化建模方式,该项目的框架可以分解为以下三个部分:1.中心点预测分支(Center Branch),用于检测每个tubelet中间帧动作实例中心点的空间位置和所属类别。2.运动估计分支(Movement Branch),用于估计中间帧动作实例中心点到相邻帧对应动作实例中心点的运动矢量,形成中心点运动轨迹。3.包围框回归分支(Box Branch),在每一帧的预测中心点直接回归bbox大小来得到动作实例在空间上的包围框。这三个分支可以相互协作生成tubelet检测结果,并采用现有的link算法,在UCF101-24和JHMDB数据集上得到了当前最好的效果,尤其是对于更精确的检测要求(高IoU, 如IoU=0.75),本框架大幅度领先sota方法。且因为同一个视频中每一帧的特征只需提取一次,之后对于不同的视频序列可重复使用,MOC-detector的效率也很高。

来源:南京大学 | 论文链接 | 项目链接

微软研究院开源编程语言Verona

计算机安全中很多问题都和内存管理相关,很多相关研究机构正在探究一些方法。近日,微软研究院开源了一个研究型的编程语言项目——Verona。Verona 是一个微软研究院发起的项目,用于研究并发方面的问题。研究者希望提供一种新的并发模型,能够无缝地和所有权结合。根据微软给出的介绍,Verona 项目旨在探索有关语言和 runtime 方面的研究,以实现安全的可扩展内存管理和分区工作。主要的研究问题如下:1.如果设计的语言没有并发突变,是否可以构建可扩展的内存管理;2.能否在不牺牲内存管理的情况下,使用线性区域来消除每个对象线性度的限制;3.能否使用语言级别的分隔?目前 Verona 仍然是一个处于很早期的研究类项目,部分类型检查器还有待实现,同时实现的语言功能也较少。

来源:微软研究院 | 报道链接 | 项目链接 

▌ 应用

谷歌深度学习短时降水预报超越传统方法
 

天气总是会或轻或重地影响人们的日常生活,而天气预报的准确性会极大影响人们应对天气的方式。天气预报可以告知人们是否应当选取一条不同的上班路线、是否应该重新安排周末野餐的计划、是否因为一场风暴的来袭而撤离住所。但对于局部风暴或是雷暴等以每小时为时间尺度演化的天气事件,做出准确的预测是极具挑战性的。在论文《Machine Learning for Precipitation Nowcasting from Radar Images》中,研究人员在降水短时预测问题上提出了基于机器学习模型的新研究,该模型主要是对未来短时间内的天气进行高度局部化的「非物理」预测。机器学习一个很显著的优势在于如果提供已经训练好的模型,那么推断过程的计算成本会很小。这使得在输入数据后的预测几乎是实时的,并且结果具有原始高分辨率。这种聚焦于 0-6 小时短时降水预测方法可以在总延迟仅为 5-10 分钟的情况下生成 1km 分辨率的预测结果,这其中还包括了数据采集的延迟。该方法虽然还处于早期发展阶段,但已经优于传统模型。

来源:Google | 机器之心 

梅奥诊所推出“临床数据分析平台”,利用AI加快新药研发进度

梅奥诊所(Mayo Clinic)医学中心在摩根大通医疗大会上推出其Mayo Clinic Platform的首个AI项目“临床数据分析平台”,主要用于加快梅奥诊所医学中心在药品行业的研发速度。该项目的合作伙伴是位于马萨诸塞州的Nference。Mayo Clinic Ventures主 席Andy Danielsen在摩根大通医疗大会采访中表示:此次合作将专注于确定新药的靶标和生物标志物、为患者匹配最佳治疗方案和发掘现实世界数据(例如药品标签扩展、上市后监测和用药目的)。项目通过减少临床试验失败,降低药物生产成本。其中,AI的作用在于解决临床数据效率低下的问题。Nference联合创始人Venky Soundarajan在摩根大通医疗大会上表示:例如在需要调查服用pembrolizumab(一种新型治疗癌症的药物)的肺癌病人是否康复的时候,研究人员需要查阅大量的医生的笔记、放射学报告、病理数据,还要与大量病理科和影像科的医生和护士沟通,这需要一个研究人员几个月的时间,而AI的加入大大提高了效率。

来源:雷锋网

美国医院使用机器人治疗美国首例新型冠状病毒肺炎患者

1月22日,美国华盛顿的一家医疗中心使用机器人治疗了美国首例新型冠状病毒肺炎患者。据悉,这名患者是美国公民,今年30多岁,近日从武汉旅行返美后在西雅图被确诊为新型冠状病毒肺炎。为了防止疾病传播,这名患者被送至华盛顿埃弗里特市一家医院的特殊病原体病房接受治疗,该病房是医疗中心在2015年为应对埃博拉病毒设立的。据Diaz的描述,治疗期间,他就坐在病房外,通过操作机器人对其进行治疗。而被放置在隔离病房的机器人配有摄像头、麦克风和听诊器。Diaz表示,这是医院为了降低病毒传染风险而采取的众多方式之一。

来源:theguardian | 新智元 

▌ 竞赛

智源 — INSPEC 工业大数据质量预测赛启动

北京智源人工智能研究院联合博世和数据评测平台biendata,共同发布了“INSPEC 工业检测大数据 (Industrial Specification Inspection Data)”,该数据集包含博世某系列产品近年来的质量检测相关数据,具体为每个产品质量检测环节各个步骤记录的相关参数,每个步骤都标注检测判定结果,整体数据量在 3w 条左右。biendata同步开放了“智源 — INSPEC 工业大数据质量预测赛”(2019年12月 — 2020年2月),总奖金为 10 万元。比赛希望挑战选手使用机器学习算法,对正在测试的产品进行质量预测,提前判断次品,节省整体检测时间。

清华发起AI垃圾分类挑战赛

在现在备受关注的“垃圾分类”上,AI能有怎样的表现?姚期智院士会亲自颁奖,清华大学交叉信息研究院和海华研究院主办的AI垃圾分类挑战赛,报名已经开始。发起挑战赛,旨在推动AI技术在垃圾分类问题上的应用,增加垃圾分类解决方案的“脑容量”。比赛开设两条平行赛道,中学组和技术组。技术组第一名团队奖金10万,中学组第一名团队奖金5万,整个挑战赛奖金总计30万元。优秀团队还可获得海华、叉院科研岗位直通资格。

▌ 经验

如何入门数据分析

经常看到很多朋友会问,入行数据分析之前我要不要学个java,学个Tableau,然后在学个Python会比较容易。好像是说,数据分析一定需要Python才能做,分析变成了为某种编程语言、某种可视化工具服务。其实这样误区的是很不对的,按这种方式学习下去,即使最后Python学的很好,也挺难找到一份数据分析的工作。本文详细讲解了什么是数据分析;数据分析职业发展不同阶段;需要的技能树拆解;可供选择的发展方向,给希望入门数据分析的人提供了良好的思路。

▌ 趣闻

AI面试催生韩国新型补习班

从公职考试、外语培训、练习生面试到房地产交易,只有想不到,没有找不到。在补习文化盛行的韩国,只要你需要,补习班都能给你补。最近,由于很多韩国大公司在面试流程中用上了 AI,补习班也上线了一项新课程:教你怎么打(hù)败(nong)AI 面试官。Park Seong-jung 在首尔江南区有一间职业咨询工作室,他的工作内容之一就是帮助学员通过 AI 面试。他会对学生说:「微笑不要靠嘴唇,要从眼睛里透出来。」因为视频面试会通过人脸识别技术分析面试者性格,这点非常关键。至今,他已经辅导了几百个为了 AI 面试而报名课程的学生。在 Park 的工作室,这种课程三个小时的费用为 10 万韩元(约合人民币 592 元)。

来源:机器之心

以上是《智源社区AI周刊》第7期的内容,智源研究院编辑团队将本着“提供真正内行的AI资讯”的目标,不断优化和完善我们的内容服务,各位读者们如有批评意见,或者好的建议,请不吝赐教发至:editor@baai.ac.cn。谢谢大家。

特约编辑:刘布楼 常政 刘沂喆

所有文章
×

还剩一步!

确认邮件已发至你的邮箱。 请点击邮件中的确认链接,完成订阅。

好的