人工智能新趋势(CB Insights)

日期:2021-01-22 来源:

本篇文章的主体部分是《2019人工智能趋势》,译者是侯延露。

【编者Peter Ye按】

进入到2020年,互联网红利(To C)虽然风韵犹存,但影响不如往昔的高光时刻;实体经济(包括工业、农业、服务业等在内的To B)需要进一步降本增效,信息化、互联网化、自动化AI化、区块链化是强大的助推器。

原本AI(人工智能,也即Artificial Intelligence的简称)就摩拳擦掌,在新的十年里准备大展宏图了。在疫情的影响下,由于抗疫的原因,AI有了更大的用武之地

为了控制疫情的蔓延,在海量的数据当中,实现快速分析、决策和响应成为重中之重。另外,非接触的服务和工作、自动化、快速决策和响应的需求等将会爆发。例如,人脸识别(包括免摘口罩的人脸识别)、AI辅助诊断、应急管理、安防监控、知识图谱、基因研究、医药研发、金融服务、智能配送、各行各业的无人值守(例如零售)、物流运输、个人画像、轨迹追踪、舆情分析等等。另外,疫情趋势预测、风险预警、医疗资源和物质的预测和调配,要做到快速、准确、科学的判断,也需要AI的助力。

2020年4月9日,中国工程院士、浪潮集团首席科学家王恩东在2020年浪潮云数据中心合作伙伴大会(简称IPF 2020)上通过“智慧计算 源动新基建”的演讲表示,智算中心是智慧时代最主要的计算力生产中心和供应中心。并指出:

"计算力就是生产力,智慧计算改造升级了生产力三要素,最终驱动了人类社会的转型升级。智慧计算将劳动者由人变成了人加上人工智能,劳动者可以呈现指数增长;智慧计算将数据变成了一种新的生产资料,从有形到无形,生生不息,越用越多;智慧计算将计算力驱动的信息化设备变成了生产工具,也是指数增长,生产力得到了前所未有的解放"。

我们可以看到,以AI为核心的技术及其生态,成为新形态生产力发展的决定性因素,且将助力新基建和抗疫的深入。

最近几个月我曾组织了几场AI或AI存储相关的培训,其中我的同事侯延露分享的《AI基础知识与行业趋势》,比较全面而且具有一定的前瞻性。尤其是她自发的把CB Insights的英文版《CB-Insights_AI-Trends-2019》进行了翻译,达两万多字,令我非常佩服。2017年,我曾经组织并参与《VMware Software Defined Storage》的翻译,知道翻译一个苦活累活,耗时很长。所以,我相信她对AI非常热爱。看到这个翻译稿后,我觉得分享出来,对一些读者朋友可能会有帮助或启发。因此得到她的授权后,就计划在微信公众号“乐生活与爱IT”进行首发了。希望对您有所助益,在此也再次感谢侯延露的授权。

为了形成较为全面和实时的介绍,我还把CB Insights进入2020年的一些新信息收入进来,放在文章的前面供读者参考。

一、CB Insights简介

美国知名的研究机构,2008年5月01日成立。CB Insights会定期发布如按需经济之类的经济发展趋势以及独角兽公司的名单,它将机器学习、算法、数据和可视化结合在一起,帮助大型企业在增长、竞争和未来的市场和技术的相关领域提供咨询。

二、CB Insights发布2020年全球AI百强榜

AI 100是全球人工智能领域最权威榜单之一,由CB Insights从全球近 5000 家初创企业中挑选得出。评选主要依据具体的评定标准包括专利布局、投融资概况、CB Insights 独立开发的 Mosaic 算法、市场潜力、媒体关注、合作伙伴关系、竞争格局、团队实力和科技新颖性、最近一年取得的公开的技术成果等多个因素。

2020年的榜单中,共有6 家中国公司入选,数量与2019年持平。包括第四范式、追一科技、创新奇智、松鼠 AI、蓝胖子机器人、禾多科技等,涉及企业智能、智能制造、自动驾驶、机器人等多元化领域,代表中国人工智能未来发展的方向。另外,还有一家华人创办的AI医学影像公司深透医疗Subtle Medical)。

CB Insights从2017年开始首次发布AI 100榜单,今年AI 100是第 4 届。2017 年,榜单上来自中国的企业有4家(碳云智能、出门问问、rokid、优必选);2018年增加到了7家(今日头条、商汤、旷视、英语流利说、出门问问、寒武纪、优必选);2019年则有6家中国企业上榜(商汤、依图、旷视、第四范式、momenta、地平线)。

今年,AI 100 入选者共有来自13个国家的人工智能初创企业,覆盖了 15 个前沿行业和跨行业应用,包括:医疗、零售、仓储、金融保险、教育、交通、制造、建筑、媒体等。今年100 家入选企业则由 CB Insights 研究团队从近 5000 家初创企业(成立不超过 10 年的非上市公司)中得出。

另外,根据 CB insights 此前发布的最新版《全球人工智能投资趋势年度报告》显示,在刚刚过去的 2019 年,全球范围内 AI投融资分布中,美国占比下降,非美国区域投融资比例上升。美国由 2014 年的占比 71%,逐渐下降到 2019 年的 39%。美国以外的比例则对应上升到 61%。2019 年,美国以外的AI 投融资中心地域,中国占比13%,其次是英国的 7%、日本的 5.3% 和印度的 4.9%。

三、CB Insights - Artificial Intelligence Trends, 2019

下面是侯延露的译文《2019人工智能趋势》。这个应该是目前CB Insights

上关于AI趋势的最新报告了,因为我尚未检索到它有关2020的AI趋势报告。如果您有,欢迎留言或私信给我。

由于原文的编排顺序,可能对于中文读者的阅读习惯可能有一些困难,我做了一些调整,并对译文少数内容、版式、格式进行了一些修改和调整。若有不足之处,欢迎指正,可以和我(QQ号:9269216)联系。

2019 人工智能趋势

首先,我们使用CB Insights NExTT框架评估每个趋势。

NExTT框架告知企业了解新出现的趋势,并根据他们对风险的承受能力指导他们的决策。
NExTT使用数据驱动的信号,从概念到成熟再到广泛采用,来评估技术,产品和商业模型的趋势。

NExTT框架X轴、Y轴的含义:
行业采用(Y轴):包括该领域中的初创公司的发展势头,媒体的关注度,客户采用率(合作伙伴关系,客户,许可交易)。
市场实力(X轴):包括市场规模预测,投资者和资本的质量和数量,研发投资,盈利记录分析,竞争强度,当下交易(并购,战略投资)

X轴、Y轴覆盖的区域分成了四个象限:

                           

分别是:

1、必要的(坐标右上角,NECESSARY)

行业和客户的实施/采用情况以及对市场和应用的了解都在不断出现趋势。对于这些趋势,在位者应制定清晰,明确的战略和举措。

2、实验的(坐标左下角,NECESSARY)

功能性产品很少的概念或早期趋势,尚未得到广泛采用。实验趋势已经激发了早期媒体的兴趣和概念验证。

3、威胁的(坐标左下角,THREATENING)

大型可预测的市场预测和显著的投资活动。这一趋势已被早期采用者所接受,并可能即将获得广泛的行业或客户的采纳。

4、过渡的(坐标左上角,TRANSITORY)

趋势正在被采用,但市场机会存在不确定性。随着暂时趋势得到越来越广泛的理解,它们可能会揭示更多的机会和市场。

我们把发现的25个趋势,放入到NExTT框中,得到如下概述图。

按趋势所在的四个象限,共计25个。其中:必要的  6个;实验的  12个;威胁的  4个;过渡的  3个。

这25个趋势按场景分:

计算机视觉:7个

自然语音处理/合成:5个

智能预测:6个

架构:4个

基础设施:3个

一、必要的

1、开源框架

得益于开源软件,进入人工智能的壁垒比以往任何时候都要低。
Google在2015年开源了Tensor Flow机器学习库。
人工智能的开源框架是双向作用的:它使所有人都能使用人工智能,反过来,像Google这样的公司也从有助于加速其AI研究的贡献者社区中受益。

每月在GitHub上有数百名用户向TensorFlow做出贡献 (用户可以在其中进行协作的软件开发平台)。
以下是一些使用Tensor Flow的公司,从可口可乐到eBay到Airbnb(爱彼迎)。

在与Nvidia,高通,英特尔,微软等公司的研究人员合作创建了一个轻量级的模块化深度学习框架之后,Facebook于2017年发布了Caffe2。该框架可以扩展到云之外,还可以应用于移动应用。Facebook当时还经营PyTorch,一个适用于Python的开源机器学习平台。2018年5月18日,Facebook将两者合二为一,“将Caffe2和PyTorch的有益特性结合到一个包中,并实现从快速原型到快速执行的平稳过渡”。


近几个月来,PyTorch的GitHub贡献者数量有所增加。

Theano是蒙特利尔研究所的另一个开源库学习算法(MILA)。2017年9月,业界领先的AI研究员Yoshua Bengio宣布终止MILA对Theano的开发,因为这些工具已经变得更加普及。YOSHUA BENGIO,在一项MILA公告中说道:

“支持深度学习研究的软件生态系统发展迅速,现已达到健康状态:开源软件已成为常态;提供了各种框架,满足了从探索新想法到将其部署到生产中的需求;强大的工业参与者正在刺激竞争中支持不同的软件栈”。
 

今天,有许多开源工具可供开发人员选择,包括Keras,Microsoft Cognitive Toolkit和Apache MXNet

2、边缘人工智能

实时决策的需要将AI推向了边缘。在智能手机,汽车或者可穿戴设备等边缘设备上运行AI算法,而无需与中央云或服务器进行通信,从而使设备能够处理在本地提供的信息,对情况做出更快的反应。


英伟达,高通和苹果以及许多新兴公司都致力于在“边缘”专门为AI工作负载构建芯片。从消费电子产品到电信到医学成像,边缘AI对每个主要行业都有影响。


例如,自动驾驶汽车针对旅途中发生的事情必须实时响应,能在没有互联网连接的区域发挥作用。决策对时间异常敏感,较大的延迟可能会致命

大型科技公司在2017年至2018年之间在边缘AI方面取得了巨大飞跃。
苹果在2017年发布了带有“神经引擎”的A11芯片,适用于iPhone 8,iPhone8 Plus和X,声称可以每秒执行多达6000亿次操作的机器学习任务。它支持iPhone的新功能,例如Face ID,可在设备本身上运行面部识别以解锁手机。


高通在18年第四季度推出了1亿美元的AI基金以投资初创企业
“分享了设备端AI的愿景,让AI变得更加强大和广泛”,它的举动与5G愿景息息相关。
作为许多数据中心的主导处理器,英特尔不得不发挥作用,进行大规模收购。英特尔发布了设备端AI的愿景:处理芯片Myriad X(由Movidius最初开发,英特尔于2016年收购)。
英特尔在18年第4季度推出了英特尔NCS2(神经计算棒2),它由Myriad X视觉处理芯片提供支持,可在智能家居设备和工业机器人等边缘设备上运行计算机视觉应用程序。


CB Insights盈利记录分析工具显示了以下内容:
边缘AI在2018年的一部分中呈上升趋势

微软表示,仅在18年第三季度,它就推出了100种新的Azure功能,“同时关注安全性等现有工作负载以及IoT和Edge AI等新工作负载。” Nvidia最近发布了Jetson AGX Xavier计算芯片,用于跨机器人和工业IoT的边缘计算应用程序。虽然边缘的AI减少了延迟,但它也有局限性。与云不同,边缘具有存储和处理约束。将会出现更多的混合模型,这些模型允许智能边缘设备与中央服务器相互通信

3、面部识别

从解锁手机到登机飞行,人脸识别已成为主流。在人脸识别方面,中国对安全的推动力以及AI的雄心壮志已成为媒体关注的焦点。

随着政府在监控中增加了一层人工智能,初创企业在为政府提供基础技术方面发挥着关键作用。在CBInsights平台上快速搜索中国的人脸识别初创公司的交易,反映了对该技术的需求。

SenseTime,Face ++和最近的CloudWalk等独角兽已经从中国涌现。(这是我们有关中国的详细报告。)但根据CB Insights专利分析工具,即使在美国,对该技术的兴趣也在激增。

苹果公司通过在iOS 10中引入基于面部识别的登录技术,为日常消费者普及了这项技术。亚马逊正在将其技术出售给执法机构;卡内基梅隆大学等学术机构也在研究有助于增强视频监控的技术。获得了“使面部特征清晰化”的专利-一种方法,当只捕获面部的眼周区域时,可以通过重建整个面部来帮助执法机构识别被掩盖的嫌疑人。然后可以使用面部识别将“半透明脸”与实际脸部图像进行比较,以找到具有强相关性的脸部。

但是技术并非没有故障。据报道,亚马逊因误认一些国会议员为罪犯而备受新闻报道。当“笑脸解锁功能”被暂时禁用时,西雅图学校外的智能相机很容易遭到《华尔街日报》记者的欺骗,后者利用校长的照片进入该场所。“笑脸解锁”和其他此类“活动检测”方法提供了额外的身份验证层。

例如,亚马逊获得了一项专利,该专利可以探索更多安全层,包括要求用户执行某些操作,例如“微笑,眨眼或倾斜头部”。然后,可以将这些操作与“红外图像信息,热成像数据或其他此类信息”结合使用,以进行更可靠的身份验证。

早期的商业应用正在安全,零售和消费电子领域迅速发展,面部识别正迅速成为生物认证的一种主要形式。

4、医学影像与诊断

FDA正在批准AI作为一种医疗设备。
2018年4月,FDA批准了AI软件,该软件可以筛查患者的糖尿病性视网膜病变,而无需专家提出第二次意见。
它被授予“突破性设备称号”,以加快将产品推向市场的过程。
IDx-DR软件可以在87.4%的时间内正确识别出“轻度糖尿病视网膜病变以上”的患者,而在89.5%的时间内识别出没有糖尿病的患者。
IDx是最近几个月被FDA批准用于临床商业应用的众多AI软件产品之一。

FDA批准了初创公司Viz.ai的产品VizLVO,以分析CT扫描并通知医疗保健提供者患者中风的可能性。
在获得FDA批准后,Viz.ai从Google Ventures和Kleiner Perkins Caufield&Byers处获得了2100万美元的A轮融资。
FDA还批准了GE Ventures支持的初创公司Arterys的Oncology AI套件,该套件最初专注于发现肺和肝脏病变。
自2014年以来,快速的监管审批为80多家自筹集了股权融资的AI影像和诊断公司开辟了新的商业途径,共计149笔交易。

在消费者方面,智能手机的普及和图像识别的进步正在将电话变成强大的家庭诊断工具。

Startup Healthy.io的第一款产品Dip.io使用传统的尿液分析试纸来监控一系列尿路感染。用户使用他们的智能手机拍摄试纸的照片,然后计算机视觉算法会校准结果以考虑不同的照明条件和相机质量。该测试可检测出感染和妊娠相关并发症。已被FDA批准的Dip.io,已在欧洲和以色列上市。
除此之外,许多ML(机器学习)即服务平台正在与FDA批准的家庭监控设备集成,在出现异常时提醒医生。

5、预测性维护

从制造商到设备保险商,AI-IIoT可以为现有企业节省数百万美元的意外故障。现场和工厂设备产生了大量数据,但意外设备故障是制造中停机的主要原因之一。
GE最近对450位现场服务和IT决策者进行的一项调查发现,有70%的公司不知道什么时候进行设备升级或维护,计划外的停机时间可能使公司每小时损失25万美元。将使资产保险公司以及制造商的利益无法实现。


在预测性维护中,传感器和智能相机会从机器收集连续的数据流,例如温度和压力。生成的实时数据的数量和各种格式使机器学习成为IIoT不可分割的组成部分。随着时间的流逝,这些算法可以在故障发生之前进行预测。
工业传感器成本的下降,机器学习算法的进步以及对边缘计算的推动使预测性维护得到了更广泛的应用。
对该领域感兴趣的一个主要指标是这里的大型高科技公司和创业公司数量众多。

与专注于工业和能源的AI公司的交易正在增加,其中包括用于IIoT的ML即服务平台。较新的初创公司正在与C3 IoT和Uptake Technologies等独角兽竞争。
GE风险投资于2016年成为这里的积极投资者,支持包括Foghorn Systems,Sight Machine,Maana和Bit Stew Systems(后来被其收购)在内的公司。GE凭借其Predix分析平台是IIoT的主要参与者。
竞争对手包括西门子和SAP,它们已经推出了自己的IIoT产品(Mindsphere和Hana)。
印度塔塔咨询公司(TataConsultancy)宣布,它将为能源公用事业公司推出预测性维护和基于AI的解决方案。
塔塔(Tata)声称,其“数字孪生”技术的早期版本-以数字格式复制地面运营或有形资产以对其进行监控,帮助发电厂每年每吉瓦节省约150万美元。
甚至像Microsoft这样的大型科技公司都在扩展其云和边缘分析解决方案,以包括预测性维护。

6、电子商务搜索

对搜索词的上下文理解正在脱离“实验阶段”,但是广泛采用仍然遥遥无期。
自2002年以来,亚马逊已申请了超过35项与“搜索结果”相关的美国专利。
它拥有一家独家子公司A9,专注于亚马逊的产品和视觉搜索。A9在美国拥有近400项专利申请(并非全部与搜索优化有关)。

一些与搜索相关的专利包括使用卷积神经网络“确定其图像与查询图像具有视觉相似性的一组项目……”,以及使用机器学习来分析图像的视觉特征并基于这些特征构建搜索查询。

亚马逊正专门在其搜索部门招聘150多个职位,包括自然语言理解,混沌工程和机器学习等。

但是,亚马逊在电子商务搜索中的运营规模和研发规模是零售商中的例外。很少有零售商讨论与AI有关的电话会议策略,而许多零售商尚未扩展或优化其电子商务业务。

但是最早这样做的品牌之一是eBay。该公司在其15年第三季度的收益电话中首先提到了“机器学习”。那时,eBay刚开始强制要求卖方必须写产品说明,并且正在使用机器学习来处理该数据以在目录中找到相似的产品。

在使用电子商务搜索显示相关搜索结果时,使用适当的元数据描述网站上的产品是一个开端。

但是仅描述和索引是不够的。许多用户以自然语言搜索产品(例如“没有按钮的洋红色衬衫”),或者可能不知道如何描述他们要寻找的东西。
这使得电子商务搜索的自然语言成为一个挑战。

早期的SaaS初创公司正在兴起,将搜索技术出售给第三方零售商。

图像搜索创业公司ViSenze与Uniqlo,Myntra和日本电子商务巨头Rakuten等客户合作。ViSenze允许店内客户在商店中拍摄他们喜欢的东西的照片,然后上传照片以在线查找确切的产品。

它在加利福尼亚和新加坡设有办事处,并在2016年从包括乐天风险投资公司在内的投资者那里筹集了1,050万美元的B轮融资。它于2017年进入联合利华铸造厂(Unilever Foundry),这使东南亚的初创企业可以用其品牌测试试点项目。

另一家为在线搜索推荐开发AI的初创公司是总部位于以色列的Twiggle。


阿里巴巴支持的公司正在开发一种语义API,该API位于现有的电子商务搜索引擎之上,以响应买方非常具体的搜索。Twiggle在2017年的B轮融资中筹集了1500万美元,并于去年加入即插即用加速器。

二、实验的

1、胶囊网络

深度学习推动了当今大多数AI应用的发展。现在,借助胶囊网络,它可能会进行改造。

Google的深度学习先驱Geoffrey Hinton早在2011年就以纸质方式提出了一个名为“胶囊”的新概念,认为“目前用于识别图像中对象的方法性能较差,并且使用的方法在理论上并不令人满意。”

Hinton提到的那些“当前方法”包括当今深度学习中最受欢迎的神经网络架构之一,即卷积神经网络(CNN)。CNN在图像识别应用中特别受欢迎。尽管CNN取得了成功,但它也有缺点(更多内容请参见下文)。
Hinton在2017年至2018年期间发表了两篇关于“胶囊网络”的替代概念的论文,也称为CapsNet —一种新的架构,有望在多个方面超过CNN。
如果不进行处理,CNN在精确的空间关系方面会失败。考虑下面的脸。尽管相对于其他面部特征,嘴巴的相对位置不正确,但CNN仍会将其识别为人脸。

尽管有缓解上述问题的方法,但CNN的另一个主要问题是无法理解新观点。
“现在,卷积神经网络已成为对象识别的主要方法,因此有必要问一下是否存在任何指数低效可能导致其消亡。卷积网在推广到新颖观点时遇到的困难是一个很好的候选人。”
—胶囊之间的动态布线
例如,CapsNet可以更好地识别第一行和第二行中的玩具图像是否属于同一对象,而仅是从不同角度或角度拍摄的。CNN将需要更大的训练数据集来识别每个方向。

(以上图片来自一个名为smallNORB的数据库,其中包含50个玩具的灰度图像,这些玩具属于5个类别中的1个:四足动物,人物,飞机,卡车和汽车。Hinton的论文发现CapsNets降低了错误率 与其他算法相比,在此数据集上进行测试时降低了45%。)

Hinton声称,对胶囊网络进行了一些复杂的对抗攻击(篡改图像以混淆算法),并发现其性能优于卷积神经网络。

黑客可以引入一些小变化来欺骗CNN。Google和OpenAI的研究人员已通过几个示例进行了演示。

对CapsNet进行比较流行的示例之一是Google的Ian Goodfellow等人在2015年发表的一篇论文。如下所示,人眼不易察觉的微小变化意味着图像会导致神经网络以高置信度将熊猫识别为长臂猿(一种猿类)。

胶囊网络的研究尚处于起步阶段,但可能会挑战当前的最新图像识别方法。

2、下一代假肢

结合生物学,物理学和机器学习来解决假肢最困难的问题之一:灵活性是非常早期的研究。
DARPA已在其高级修复术计划上花费了数百万美元,该计划始于2006年与约翰·霍普金斯大学合作,帮助受伤的退伍军人。但是这个问题要解决。
例如,让截肢者能够在假肢中移动各个手指,解码自愿运动后的大脑和肌肉信号并将其转化为机器人控制,这一切都需要多学科的方法。
正如梅根·莫尔蒂尼(MeganMolteni)在去年《连线》杂志的一篇文章中所解释的那样,举一个简单的弹钢琴的例子。经过反复练习,弹奏和弦成为“肌肉记忆”,但这不是假肢的工作原理。
最近,研究人员开始使用机器学习来解码来自身体上传感器的信号,并将其转换为移动义肢设备的命令。
约翰·霍普金斯大学(JohnHopkins)的“应用物理实验室”(Applied Physics Labs)正在进行一项有关使用“神经解码算法”来进行假肢神经接口的项目。
去年6月,来自德国和伦敦帝国理工学院的研究人员使用机器学习对截肢者残端的信号进行解码,并为计算机供电以控制机械臂。关于“脑机接口”的研究发表在《科学机器人》上。

其他论文探索了中间解决方案,例如使用肌电信号(残端附近肌肉的电活动)来激活相机,并运行计算机视觉算法来估计物体的抓握类型和大小。
“人工智能假肢挑战赛”是NeurIPS 18(领先的年度机器学习会议)中的竞赛项目之一,进一步彰显了AI社区对此领域的兴趣。

2018年的挑战是使用强化学习来预测假肢的表现(本报告以下各节中有关强化学习的更多信息)。研究人员使用一种称为OpenSim的开源软件来模拟人类的运动。
上一年的重点是“学习运行”,有442名参与者试图与AWS,Nvidia和Toyota等赞助商一起教AI如何运行。

3、临床试验人员招募

临床试验中最大的瓶颈之一就是招募合适的患者。苹果也许能够解决这个问题。
尽管可以对医疗记录进行数字化处理,但互操作性(跨机构和软件系统轻松共享信息的能力)是医疗保健中的最大问题之一。

这在临床试验中尤其成问题,在临床试验中,将正确的试验与合适的患者进行匹配对于临床研究团队和患者而言都是耗时且具有挑战性的过程。
作为背景,仅在美国就有超过18,000个临床研究正在招募患者。
如果医生知道正在进行的试验,则患者有时可能会从其医生那里获得试验建议

否则,通过ClinicalTrials.Gov进行搜索的责任就落在了病人身上,Gov是过去和正在进行的临床试验的全面联邦数据库。
理想的AI解决方案是人工智能软件,该软件可以从患者的病历中提取相关信息,并将其与正在进行的试验进行比较,并提出匹配的研究建议。
很少有创业公司直接在临床试验领域与客户合作。
小型创业公司简化临床试验的最大障碍是技术相对较新,行业适应缓慢。
但是,像苹果这样的科技巨头,已经成功地吸引了合作伙伴开展针对医疗保健的计划。
苹果正在改变医疗保健中数据的流动方式,并为AI开辟了新的可能性,尤其是围绕临床研究人员招募和监视患者的方式。
自2015年以来,苹果推出了两个开源框架-ResearchKit和CareKit —帮助临床试验招募患者并远程监控他们的健康。
该框架允许研究人员和开发人员创建医疗应用程序以监控人们的日常生活,消除招募的地理障碍。
例如,将近10,000人使用mPower应用程序,该应用程序提供了诸如敲击手指和步态分析之类的练习,以研究同意与更广泛的研究社区共享其数据的帕金森氏病患者。
杜克大学的研究人员开发了Autism&Beyond应用程序,该应用程序使用iPhone的前置摄像头和面部识别算法来筛选儿童是否患有自闭症

苹果还与Cerner和Epic等知名的EHR供应商合作,以解决互操作性问题。
苹果在2018年1月宣布,iPhone用户将可以通过其iPhone的Health应用程序从参与机构访问其所有电子健康记录。
该功能被称为“健康记录”,是AI医疗保健初创公司Gliimpse在2016年被Apple收购之前所做工作的扩展。
在易于使用的界面中,用户可以找到所需的有关过敏,状况,免疫接种,实验室检查结果,用药,程序和生命的所有信息。
在2018年6月,Apple为开发人员推出了HealthRecords API。
用户现在可以选择与第三方应用程序和医学研究人员共享其数据,从而为疾病管理和生活方式监测打开了新的机遇。
在使用AI和机器学习进行早期诊断,招募合适的患者群体甚至推动药物设计决策方面,可能性似乎无穷无尽。

4、生成式对抗网络

试图彼此超越的两个神经网络在创建逼真的图像方面非常擅长。
您能识别出其中哪些图像是假的吗?

答案是以上所有。这些高度逼真的图像均由生成对抗网络或GAN生成。
(注意:右下图代表“类泄漏”,该算法可能将狗的属性与球混淆,并创建了“狗球”。)
GAN是Google研究人员Ian Goodfellow在2014年提出的概念,它提出了“人工智能与人工智能”的概念。有两个神经网络:一个生成器,它带有伪造的图像(例如,一只狗),以及一个鉴别器,该鉴别器将结果与真实世界的图像进行比较,并向生成器提供复制图像与真实图像有多接近的反馈。

这在试图彼此超越的两个神经网络之间形成了恒定的反馈回路。
上面的图片来自Google DeepMind实习生Andrew Brock在9月18日发表的论文,该论文与DeepMind的其他研究人员一起发表。
他们在非常大规模的数据集上训练了GAN,以创建“ BigGAN”。 Brock和团队在BigGAN遇到的挑战之一:例如,一只蜘蛛有“很多腿”。但是“手数”是多少?

但是,扩展像GAN这样的大型项目的主要挑战是计算能力。这是FastCompany的摘录,粗略估算了这项研究的计算能力:为了扩展GAN,必须并行扩展AI硬件。
Brock文章并不是最近几个月发表的唯一与GAN相关的论文。
来自英国兰开斯特大学,中国西北大学和中国北京大学的研究人员使用GANs开发了一个验证码求解器。
该论文证明了GAN使用桌面GPU可以在0.05秒内破解基于文本的验证码,与以前的方法相比,其成功率更高。

CMU的研究人员在“ deepfake”视频的这一迭代中将GAN用于“面对面”翻译。在下面的Deepfake示例中,John Oliver变成了Stephen Colbert:

华沙理工大学的研究人员开发了ComixGAN框架,使用GAN将视频转换为漫画

佳士得艺术品拍卖行以432,500美元的高价售出了第一幅GAN创作的画作

在有关GAN的最新论文中,Nvidia研究人员使用“基于样式的生成器”来创建超逼真的图像

GAN不仅用于有趣的实验。这种方法还具有严重的含义,包括伪造的政治视频和变形的色情内容。
《华尔街日报》已经在培训其研究人员以发现Deepfake视频。
随着研究规模的扩大,它将改变新闻,媒体,艺术甚至网络安全的未来。 GAN已经在改变我们训练AI算法的方式(有关“合成训练数据”的下一节,将对此进行详细介绍)。

5、联合学习

新方法旨在在使用敏感用户数据训练AI时保护隐私。
我们与智能手机和平板电脑的日常互动-从选择消息中使用的单词到对照片的反应方式-都会产生大量数据。
使用我们独特的本地数据集训练AI算法可以大大提高其性能,例如更准确地预测您要在键盘上键入的下一个单词。
正如Google的研究人员在2017年的一篇论文中解释的那样:“聊天和短信中使用语言通常与标准语言语料库(例如Wikipedia和其他网络文档)有很大不同;人们用手机拍摄的照片可能与典型的Flickr照片完全不同。”
但是,此用户数据也是个人和隐私敏感的。
Google的联合学习方法旨在使用此丰富的数据集,但同时保护敏感数据。
简而言之,您的数据保留在手机上。它不会发送到或存储在中央云服务器中。云服务器将算法的最新版本(称为算法的“全局状态”)发送给用户设备的随机选择。
您的手机会根据本地化数据对模型进行改进和更新。仅将此更新(以及来自其他用户的更新)发送回云以改善“全局状态”,并且该过程会重复进行。

Google正在其名为Gboard的Android键盘上测试联合学习。
请注意,从每个节点汇总单个更新的机制在这里并不是新颖的。已经有一些算法可以做到这一点。
但是与其他分布式算法不同,联合学习方法考虑了数据集的两个重要特征:
•非IID:根据每个人对设备的使用情况,每部电话(或其他设备)上生成的数据都是唯一的。因此,这些数据集不是“独立且相同分布(IID)”,这是其他分布算法出于统计推断的普遍假设,但不能反映实际的实际情况。
•不平衡:某些用户比其他用户更积极地使用应用程序,从而自然生成更多数据。结果,例如,每个电话将具有不同数量的训练数据。

Firefox对联合学习进行了测试,以对当用户开始在URL栏中键入内容时出现的建议进行排名,并将其称为“主要软件项目中(联合学习的第一个实现)之一。”
在联邦学习的另一个应用中,由Google Ventures支持的AI初创公司OWKIN(专注于药物发现)正在使用这种方法来保护敏感的患者数据。投资者Otium Venture称,该模型允许不同的癌症治疗中心进行协作,而患者的数据不会离开场所。

6、先进的保健生物技术

使用神经网络,研究人员开始研究和测量以前难以量化的非典型危险因素。
使用神经网络对视网膜图像和语音模式进行分析可能会有助于确定患心脏病的风险。
根据今年在《自然》杂志上发表的一篇论文,谷歌的研究人员使用了经过视网膜图像训练的神经网络来发现心血管危险因素。
研究发现,不仅可以通过视网膜图像识别年龄,性别和吸烟方式等危险因素,而且“可以量化到以前从未报道过的精确度”。
同样,梅奥诊所与以色列初创公司Beyond Verbal合作,后者分析语音中的声学特征,以发现冠心病(CAD)患者独特的语音特征。该研究发现,当受试者描述一种情感体验时,有2种语音特征与CAD紧密相关。
初创公司Cardiogram的最新研究表明,“糖尿病引起的心率变异性变化可以通过深度学习,通过消费者可自行购买的可穿戴心率传感器来检测”。一种算法方法显示出从心率中检测出糖尿病的准确性为85%。


一个更具未来感的用例是对医疗生物特征的被动监控。
2018年1月,谷歌发布了一项雄心勃勃的专利,该专利旨在从一个人的肤色或皮肤位移分析心血管功能。
传感器甚至可以(根据专利说明)放置在患者浴室的“传感环境”中。

例如,通过识别手腕和脸颊的肤色变化,并“比较测量时间和这些区域之间的距离”,系统可以计算出“脉搏波速度(PWV)”。
然后可以将速度信息用于确定心脏健康指标,例如动脉僵硬度或血压。
该专利称:“可以将机器学习应用于创建特定于患者的模型,以根据PWV估算血压。”
亚马逊在2014年申请了一项类似的被动监控专利,该专利后来在2017年获得批准。该技术将面部特征的识别(使用神经网络或其他算法方法)与心率分析结合在一起。
例如,算法可以使用该数据来计算心率检测,从而跟踪脸部两个区域(如靠近眼睛和脸颊的区域)的颜色变化。

人工智能发现模式的能力将继续为新的诊断方法和识别先前未知的危险因素铺平道路。

7、自动索赔处理

保险公司和初创公司开始使用AI来计算车主的“风险分数”,分析事故现场的图像并监视驾驶员的行为。
阿里巴巴子公司中国蚂蚁金服在其“事故处理系统”中使用深度学习算法进行图像处理。
当前,车主或驾驶员将其车辆带到“事故处理人员面前”,该人会检查车辆的损坏并记录详细信息,然后将其发送给汽车保险公司。
图像处理的进步现在使人们能够拍摄车辆的照片并将其上传到Ant Financial。然后,神经网络分析图像并自动进行损害评估。
Ant采取的另一种方法是创建驾驶员的风险状况,以影响汽车保险的实际定价模型。
“大数据和人工智能等技术的发展使保险公司能够进一步利用
消费者数据并分析车主可能面临的风险。因此,汽车保险的风险因素可以从“面向汽车”的方法转变为“汽车/所有者组合”。
—阿里巴巴云博客

阿里巴巴推出了一种称为“汽车保险积分”的东西,它利用机器学习根据信用历史,消费习惯和驾驶习惯等因素来计算车主的风险评分。
规模较小的初创公司也正在涉足保险和理赔流程,但采用了不同的方法。
例如,Nexar鼓励驾驶员使用智能手机作为行车记录仪,并将镜头上传到Nexar应用程序。作为回报,车主可以享受保费折扣。
该应用程序使用计算机视觉算法来监视道路状况,驾驶员行为和事故。它还提供了“崩溃重现”功能,以重建和分析发生事故的情况,并与保险客户一起处理索赔。
总部位于英国的Tractable允许保险公司将损失图片和估算值上传到其理赔管理平台。“ AI Review”功能将其与数千张图像进行比较,以相应地调整价格。
有趣的是,Tractable还针对生态系统中的其他参与者,例如汽车维修,评估师,供应商和汽车租赁公司。

8、防伪

假货越来越难以发现,在线购物使购买假货比以往任何时候都更加容易。为了反击,品牌和典当行开始尝试AI。
从药品到手袋再到智能手机,假冒是一个影响所有类型零售的问题。
有些仿制品看起来如此真实,以至于被归类为“超级假货”。
中国快速发展的电子商务平台拼多多在其2018年第三季度的收益电话中曾11次提及“假冒”,称其“与假冒商品和“有问题的商人”进行了非常艰苦的斗争。”
“在2017年,我们…主动删除了总共1070万个有问题的产品,并阻止了4000万个链接……引发了侵权问题……我们还与400多个品牌合作,共同打击假冒。”
—拼多多创始人兼首席执行官黄峥

品牌在两个方面与假货作斗争:
•在在线世界中,识别并删除侵犯品牌商标(如品牌名称,徽标和标语)的在线列表;


•在现实世界中,识别像奢侈品手提包这样的假冒伪劣商品 。


网络造假在范围和规模上都是庞大而复杂的。电子商务巨头阿里巴巴因未能在其网站上对假冒商品做足够的努力而备受抨击报道说,该公司正在使用深度学习来持续扫描其平台的IP侵权行为。它使用图像识别来识别图像中的字符,同时使用语义识别来监视网站上列出的产品图像中的品牌名称或口号。


假冒者使用与原始品牌列表非常相似的关键字和图像在假冒网站上出售假冒商品,在合法市场上出售假冒商品并在Instagram等社交媒体网站上推广假冒商品。当一个列表被删除时,假冒者可能会重新发布相同的假冒商品,具有不同关键字字符串的产品。


巴塞罗那的初创公司Red Points正在使用机器学习技术来扫描网站是否存在潜在侵权行为,并在选择造假者使用的关键字时寻找模式。它拥有化妆品,豪华手表,家居用品和服装行业的客户,包括MVMT,DOPE和Paul Hewitt

在物理世界中,发现假货比较棘手,而且更加手动。当卖家发布二手豪华手提包出售或去典当行买卖时,验证过程通常需要认证专家亲自检查袋子,包括品牌,材料和缝制图案。
这是eBay和其他公司使用识别专家对一件豪华手提包进行身份验证的费用。

但是随着“超级假货”或“三重假货”的兴起,用肉眼分辨出这种区别几乎变得不可能了。
建立假冒和伪造商品的数据库,提取其特征,并训练AI算法来分辨差异是一个繁琐的过程。
初创公司Entrupy与身份验证专家合作,建立了一个假货与真实商品的数据库,以对其算法进行2年的培训,而这种过程对于稀有的老式奢侈品来说要困难得多

Entrupy开发了一种连接到智能手机的便携式显微镜,当用户拍摄并上传产品(手提包,手表等)的图片时,人工智能算法会分析每种产品特有的微观特征,并根据已知和真实产品的数据库进行验证。


数据库正在增长,但是市场上没有配套的产品。 Entrupty发表的论文重点介绍了其他一些操作假设和局限性。
关键思想是,与伪造者将使用的制造过程(非标准化,廉价的批量生产)相比,使用标准或指定方法制造的物体在视觉上将具有相似的特征。其次,该技术可能不适用于纳米制造的电子芯片(Entrupy显微镜无法检测到的尺寸变化)。
Cypheme正在采取另一种方法。其基于墨水的技术可以用作产品上的不干胶标签,或直接印刷在标签和包装上。

《日经亚洲评论》(Nikkei Asian Review)在接受CEO采访时详细介绍了该技术:一滴墨水产生了一个随机图案,该图案被另一个橙色墨水圈包围,Cypheme声称这是公司专有的,不可能复制,然后每种独特图案都与数据库中的特定产品相关联。

它使用智能手机摄像头和神经网络进行模式识别,以根据其数据库验证特定产品的墨水图案,这意味着Cypheme必须直接与品牌制造商合作,以确保产品附带示踪墨水。它最近与欧洲领先的包装公司AR Packaging建立了合作伙伴关系,该公司与联合利华和雀巢等食品品牌合作,尽管在包装上印刷油墨可以高效地跟踪制造工厂和整个分销链中的物品,但该技术并没有做到这一点。无法进行二手购买认证。例如,买家可以从奢侈品表的包装中取出Cypheme的贴纸,然后决定在经纪人商店或在线转售。在这种情况下,除非打印是产品本身的一部分,否则无法验证真实性。
面向奢侈品牌和其他高风险零售商的解决方案可能会向前发展,那就是在制造场所识别或添加唯一的指纹到实物商品,并在整个供应链中进行追踪。

9、无人结帐

进入商店,挑选想要的东西,然后走出去几乎“感觉”像是入店行窃。 AI可以让真正的盗窃成为过去,而免费零售更常见。


Amazon Go取消了整个结帐流程,使购物者可以拿走物品并走出去。
亚马逊尚无公开计划将其技术即服务出售给其他零售商,并且一直对运营,成功和痛点守口如瓶,只是透露它使用了传感器,摄像头,计算机视觉和深入的知识。学习算法。它否认使用面部识别算法。
诸如Standard Cognition和AiFi之类的初创企业抓住了机会,介入使其他零售商的Amazon Go民主化。
“抢购”商店的挑战是向合适的购物者收取正确的费用。


根据全国零售联合会,由于入店行窃和文书错误等原因造成的库存损失在2017年使美国零售商损失了约47B美元。
初创公司AiFi的联合创始人兼首席执行官史蒂夫·古(Steve Gu)在接受AI Podcast采访时说:“偷东西就是买东西。”他在讨论拿了就走商店背后的技术。
 

到目前为止,Amazon Go是唯一成功的商业部署,但是成功的参数受到严格控制。
当您控制谁进入商店并自动为他们收费时,最大程度地减少了有人入店行窃的可能性。


亚马逊已经建立了Prime会员基础。到目前为止,所有Go商店都仅限于会员,其他零售业务(如Kindle商店)向公众开放,仍然依赖手动结帐流程。
较小的酒馆,便利店,甚至几个老牌超市都必须从头开始建立会员基础。
史蒂夫·古(Steve Gu)在同一播客中暗示,愿意下载该应用程序的人们可能会遇到“抢走”部分,而那些不想下载的人可能会有一个单独的结帐行。
尚不清楚商店的基础设施如何同时支持这两种情况。这仍然存在销售点库存减少的问题,例如帐单错误或POS盗窃。中国的Yitu Technology和东芝(拥有用于结帐的智能相机)是其中一些分别致力于收缩问题的公司。
防止盗窃的复杂性取决于操作的大小和规模以及货架上产品的类型。


Amazon Go商店仅约1,800至3,000平方英尺,并使用数百个摄像头覆盖几乎每英寸的天花板空间。相比之下,传统的超级市场可以达到40,000平方英尺或更高。Go除了在货架上使用重量传感器之外,还使用摄像头进行视觉识别,目前仅提供有限的商品选择,例如预制和包装的饭盒。
需要考虑的一些事情是如何利用地板空间,尤其是在拥挤的超级市场中,以确保将摄像机放置在最佳位置以跟踪人员和物品。零散的蔬菜和其他农产品每磅要收费52,这大概是依靠传感器技术,但是多个购物者从同一个纸箱中同时捡拾物品无法单独使用传感器。即使是预包装或切块的蔬菜,从一种包装到另一种包装的价格也略有不同。
对于计算机视觉系统来说,服装也特别难以追踪。识别尺寸(S / M / L)并追踪容易折叠和折起的衣服是其中的一些痛点。

初创公司AiFi承诺利用现有的商店基础设施以及传感器和摄像头的组合,但Standard Cognition声称完全放弃了传感器,完全依靠机器视觉。
Standard Cognition宣布与日本最大的CPG批发商Paltac Corporation建立合作伙伴关系,以在2020年东京奥运会之前为日本的3000家商店提供服务。据报道,AiFi拥有约20个零售客户,其中包括与纽约一家主要零售商的合同。
在短期内,归结为部署成本和由于潜在技术故障造成的库存损失成本,以及零售商是否可以承担这些成本和风险。

10、后台自动化

人工智能正在使行政工作自动化,但是数据的多样性和格式使其成为一项具有挑战性的任务。
自动化“后勤任务”的挑战可能是独特的,具体取决于行业和应用程序。
以临床试验为例。许多试验仍然依靠纸质日记来输入患者数据。这些日记以数字形式存储,通常以难以搜索的格式存储,而手写的临床笔记对自然语言处理算法提取信息(解决拼写错误,专业术语,缩写和遗漏条目)提出了独特的挑战。
另一方面,自动化汽车索赔处理带来了一系列不同的挑战,在这种情况下,评估损失并深入研究根本原因,但是不同部门开始不同程度地采用基于ML的工作流解决方案。
机器人过程自动化(RPA)是重复的,可以由机器人自动执行的任何后台办公繁琐工作的宽松术语,一直备受关注。但是,就像AI一样,它是一个总括性的术语,涵盖了从数据输入到合规性,交易处理到客户入职等各种各样的任务。

尽管并非所有RPA都是基于ML的,但许多RPA都开始将图像识别和语言处理集成到其解决方案中。
例如,WorkFusion可自动执行诸如了解您的客户(KYC)和反洗钱(AML)流程之类的后端操作。
Unicorn UiPath的服务已在全球700多家企业客户中使用,包括DHL,NASA和HP,涉及从金融,制造到零售的各个行业。
Automation Anywhere是RPA领域中的另一个独角兽。该公司的一项案例研究强调了与一家全球银行的合作关系,以使用机器学习来自动化人力资源管理。“ IQ Bot”从来自多个国家和地区的多种语言的表格中提取信息,清理数据,然后自动将其输入到人力资源管理系统中。
尽管RPA的概念已存在多年,但许多行业才刚刚开始克服惯性并尝试使用新技术。在其他领域,需要数字化后才能有预测分析层。

11、语言翻译

用于语言翻译的NLP既是挑战,也是未开发的市场机会。大型科技公司正在推动这一领域的发展。
基于机器的语言翻译在跨国公司的后台自动化应用,客户支持,新闻和媒体以及其他方面的应用是巨大的未开发的机会。
百度最近宣布,它将推出新的翻译耳塞,
与Google Pixel Buds类似,据报道它可以实时翻译40种不同的语言。
像Unbabel这样的初创公司正在使用人工在环机器翻译系统,目标是反馈循环将训练算法,使其随着时间的推移变得更好。
用于翻译的NLP面临一些挑战。例如,仅中国自然语言处理就很复杂,有130种方言和30种书面语言。
在深度学习领域的先驱研究者Yoshua Bengio,发表了一篇论文,提出了一种新的机器翻译体系结构-一种使用神经网络代替传统统计方法的新颖方法-一年后Google升级了自己的Google翻译工具算法。


首席执行官Sundar Pichai在2016年的财报电话会议上说:“这一突破将帮助我们为世界各地的人们提供更准确的翻译。”

Google希望摆脱其旧的基于短语的机器翻译(PBMT)算法,并提出了一种新的Google神经机器翻译(GNMT)系统。
尽管已经发表了有关神经机器翻译的不同论文,但是仍然存在一些局限性,例如训练这些模型所需的时间和计算资源,以及翻译稀有单词的失败。
Google提出了解决这些问题的改进建议,并测试了在英语到中文,中文到英语,西班牙语到英语以及其他示例中的算法。

关于该主题的一些研究论文已经发表。但是最近的突破来自Facebook。
根据该论文,“多语言NLP的大多数研究都集中在高资源语言上,例如中文,阿拉伯语或主要的欧洲语言,并且通常仅限于几种(大多数情况下只有两种)语言。相比之下,我们学习了93种不同语言的联合句子表示,包括资源匮乏的语言和少数民族语言”。

随着大型科技公司继续致力于改善翻译框架的资源,效率和语言能力将得到改善,并且在各个行业中的采用率将有所提高。

12、合成训练数据

训练AI算法必须访问具有标签的大型数据集。真实的虚假数据可能会解决瓶颈。
AI算法仅与它们所馈送的数据一样好,并且针对不同的应用程序访问和标记该数据需要大量时间和资金。
访问此类实际数据甚至可能都不可行。
以自动驾驶汽车为例。使用真实数据很难在危险,不那么频繁的情况下对AV进行培训,例如在刺眼的阳光下或行人从停放的汽车后面跳出来时。
这就是合成数据集的来源。
2018年3月,英伟达(Nvidia)为自动驾驶汽车推出了基于云的真实感仿真,该仿真称为DRIVE Constellation。在上路之前,AV可以在虚拟现实仿真中行驶数十亿英里-这是一项旨在创建“将自动驾驶汽车推上道路的更安全,可扩展性更高的方法”的尝试。
想象一下,AV在雷暴中行驶。 Nvidia的解决方案可模拟在这种情况下,汽车中的数据传感器(例如相机或LiDAR)将产生什么。合成传感器数据被馈送到计算机,该计算机就好像在实际道路上行驶一样做出决策,然后将命令发送回虚拟车辆

一个有趣的新兴趋势是使用AI本身来帮助生成更多“逼真的”合成图像来训练AI。
例如,英伟达使用生成对抗网络(GAN)来创建带有脑肿瘤的伪造MRI图像。
“这些结果共同为医学成像中机器学习面临的两个最大挑战提供了潜在的解决方案,即病理发现的发生率很小,以及围绕患者数据共享的限制。”
— NVIDIA研究论文

GAN被用于“增强”现实世界的数据,这意味着可以结合使用现实世界和模拟数据来训练AI,以拥有更大,更多样化的数据集。
机器人技术是另一个可以从高保真合成数据中大大受益的领域。
考虑一个简单的任务,教导机器人掌握一些东西。 2016年,Google研究人员使用了14个机器人手臂来学习如何抓握不同的物体。来自所有14个机器人的失败和成功尝试的数据被用来训练神经网络,以帮助机器人“分享经验”并预测抓握的结果。总共进行了80万次抓握尝试,“相当于大约3000台机器人,研究小组表示,“数小时的练习时间”可以“了解智能反应行为的开始”。
但是,在数百个虚拟机器人在虚拟环境中进行练习的模拟可以大大简化此过程。
挑战之一是创建逼真的对象(例如使苹果或铅笔的模拟看起来尽可能接近真实的对象)。 2017年,Google研究人员使用了生成对抗性
网络(GAN)可以做到这一点,从而大大减少了训练机器人所需的现实世界数据量。

AI.Reverie等早期创业公司正在开发仿真平台,以生成适用于各种行业和场景的数据集。
随着技术规模和综合数据能够更准确地模拟现实情况,这将成为无法访问大型数据集的小型公司的催化剂

三、威胁的

1、强化学习

从在棋盘游戏中击败世界冠军的训练算法到教授AI杂技,研究人员正在通过强化学习来突破界限。但是目前对大量数据集的需求限制了实际应用。
当Google DeepMind的AlphaGo在复杂而战略性的中国围棋游戏中击败世界冠军时,强化学习引起了媒体的关注。
简而言之,强化学习的重点是:您需要采取什么行动才能达到目标并获得最大的回报?
由于这种方法,强化学习尤其在游戏和机器人仿真中得到了应用。
DeepMind的AlphaGo最初是通过监督学习(使用其他人类玩家的数据来训练算法)和强化学习(针对自己的AI)进行训练的。
DeepMind随后发布了AlphaGo Zero,声称它具有超人的性能。它是完全基于强化学习(仅根据一组规则进行对抗)进行训练的。

最近,加州大学伯克利分校的研究人员使用计算机视觉和强化学习来从YouTube视频中教授算法杂技。计算机模拟的角色无需手动注释姿势即可复制视频中的动作。

通过强化学习,模拟角色可以将其技能应用于新环境。例如,如果YouTube视频中的一个人在平坦的地面上进行了后空翻,则模拟角色可以使技能适应在不平坦的地形上进行后空翻。
尽管取得了这些迅速的进步,但强化学习的采用尚未起飞,因为与当今最流行的AI范例监督学习相比,它需要的数据要多。

“考虑到当今创造的经济价值,当您从[不同的学习方法]列表中滑落时,将会迅速下降。强化学习是一类技术,与今天的实际部署相比,PR的兴奋性与比例不成比例。”
— EMTECH 2017年演讲,安德鲁·NG
但是,对RL应用的研究正在增加。在美国专利申请的标题和摘要中进行关键字搜索显示,最近两年的活动有所增加。

顶级申请人包括Google,IBM,Alphaics(一家AI初创公司),Mobileye(被Intel收购),Microsoft,Adobe和FANUC。
在收益电话会议中,百度积极讨论了强化学习,在第18季度的电话会议中提到了7次

“第一季度的一大亮点是,我们首次部署了强大的基于强化学习的基础架构,可以显着提高我们更好地将广告与用户匹配并提高点击率和转化率的能力”
— BAIDU参加了Q1’18的收入电话会议

2、网络优化

从促进频谱共享到监视资产并提出天线的最佳设计,人工智能正在开始改变电信。
电信网络优化是改善延迟,带宽以及设计或体系结构的一组技术,任何以有利方式增加数据流的技术。
对于通信服务提供商,优化直接转化为更好的客户体验。
除带宽限制外,电信的最大挑战之一是网络延迟。手机上的AR / VR之类的应用程序只能在极短的延迟时间内实现最佳功能。
苹果最近获得了一项专利,可以使用机器学习来形成“预期网络”,该网络可以预测诸如智能手机之类的具有无线功能的设备将来可能会执行什么动作,并提前下载数据包以减少延迟。

机器学习的另一个新兴应用是频谱共享。
政府在拍卖中将某些电磁频谱的频率许可给了Verizon等公司。美国联邦通信委员会(FCC)裁定3.5至3.7GHz频谱将在不同用户之间共享。这意味着运营商可以根据可用性动态访问共享频率。这将使他们能够根据网络需求扩大和缩小带宽。它还将向未许可自己专用频谱的小型商业用户提供频谱访问。
美国海军和其他联邦机构使用3.5GHz频段的一部分。为他们提供了第一层访问权限,如果他们未使用频谱,则将访问第二层和第三层用户。
诸如Federated Wireless之类的公司提供安全频谱访问(SAS),以在不同用户层之间动态分配频谱,并确保不干扰联邦信号-并利用机器学习来做到这一点。
在2018年,联邦无线获得了使用ML将无线电信号分类到不同类别的专利,例如联邦信号,噪声信号和未知信号。它这样做是在遮盖联邦信号的功能的同时(这样,黑客就永远无法访问军事/国防信号的特定功能或弱点)。

DARPA希望最终从促进频谱共享的SAS播放器转移到基于ML的自动化系统。为此,它在2016年发起了频谱协作挑战赛。竞赛的参与者必须使用ML来为无线电网络提出独特的方式,让无线网络“自主合作,动态地决定如何无线电频率(RF)频谱应按时刻使用”。


DARPA还在2017年启动了一个射频机器学习系统(RFMLS)计划。类似于上述联合无线专利,DARPA希望使用ML来区分不同类型的信号,尤其是发现打算侵入终端设备的恶意信号(例如作为物联网设备)。
电信运营商还准备将基于AI的解决方案集成到称为5G的下一代无线技术中。
三星收购了基于AI的网络和服务分析初创公司Zhilabs,为5G时代做准备

三星在一份新闻稿中表示,将使用AI软件“分析用户流量,对正在使用的应用程序进行分类并提高整体服务质量”。
高通公司将AI边缘计算视为其5G计划的关键组成部分(边缘计算可减少带宽限制并减少与云的频繁通信,而这正是5G的主要关注领域)。
早期的研究论文也在不断涌现,探索使用神经网络来为电信网络中的天线提供最优化的设计。

3、自动驾驶

尽管自动驾驶汽车有巨大的市场机会,但实现完全自动驾驶的时间表仍然不清楚,许多大型科技公司和初创公司在自动驾驶汽车领域竞争激烈。
Google在汽车领域已经为自己取名了。它的自动驾驶
Waymo项目是第一个部署自动驾驶汽车的自动驾驶汽车开发商
商用AV车队。
投资者对开发完整的自动驾驶系统的公司仍然充满信心,向通用汽车的Cruise Cruise自动化公司(2018年10月从本田获得7.5亿美元,5月之前从软银获得9亿美元)和Zoox(2018年7月为5亿美元)注资数亿美元。这里的其他创业公司包括Drive.ai,Pony.ai和Nuro。
特别是中国,加大了视听工作。中国科技部去年宣布,中国第一批开放式AI平台浪潮将严重依赖百度进行自动驾驶。
2017年4月,百度宣布了一种独一无二的开放平台Apollo,用于自动驾驶解决方案,并吸引了来自全球的合作伙伴。
与其他开源平台一样,该想法是通过向生态系统中其他参与者的贡献开放来加速AI和自动驾驶研究。将源代码提供给所有人都可以使公司从现有研究中获益,而不必从头开始。

阿里巴巴最近还对其自动驾驶汽车进行了试驾。
但有趣的是,就在一年多以前,阿里巴巴对自动驾驶汽车的长期商业机会持怀疑态度,在财报电话会议上提到“没人能算出长期的经济增长”。
模型,但人们之所以这样做,是因为构建自动驾驶汽车涉及一些非常有趣的人工智能相关技术。
即使对技术的未来犹豫不决,汽车制造商仍在全力以赴。到2025年,市场预计将达到约80B美元。
在某些应用中,物流和履约等更早会采用全自动驾驶汽车。

自主物流-特别是自主的最后一英里交付-对于零售商和配送公司来说是头等大事,并且可能是我们看到完全自主权的第一个领域。自动驾驶汽车可以帮助解决在最后一英里运送货物的昂贵而艰巨的挑战,这加起来几乎是一件商品总交货成本的三分之一。


像亚利桑那州这样的拥有自动驾驶汽车自由法的州正在成为试验台。 2018年6月,机器人初创公司Nuro与美国最大的实体杂货店之一Kroger合作交付杂货。 Nuro旨在在附近道路上行驶,而不仅仅是像其他已开发的送货机器人和车辆原型那样的人行道。
在餐厅领域,诸如Domino和Pizza Hut之类的比萨公司一直处于自动驾驶汽车测试的最前沿。福特汽车正在迈阿密试行自动送货,包括比萨饼,杂货和其他商品。 OEM于2018年初与包括Domino在内的70多家企业合作。

4、作物监测

三种类型的作物监测正在农业中起飞:地面,空中和地理空间。精准农业无人机市场预计将在2021年达到$ 2.9B。
无人机可以为农民绘制田野图,使用热成像仪监控水分含量,并确定虫害作物和喷洒农药。
初创公司专注于为第三方无人机捕获的数据添加一层分析,例如塔拉尼斯(Taranis)使用第三方塞斯纳飞机来做到这一点。 Taranis去年还收购了agtech-AI初创公司Mavrx Imaging,该公司正在开发超高分辨率成像技术以侦察和监视领域。

Taranis使用AI将田野图像拼接在一起,并识别农作物的潜在问题。农业设备制造商约翰迪尔(John Deere)与其他几家初创公司合作,为约翰迪尔(John Deere)寻求潜在的解决方案。
迪尔(Deere)一直在通过AI进行自我改造。它以3亿美元以上的价格收购了Blue River Technology,这是一家利用计算机视觉的农业设备公司。除其他事项外,Blue River正在研究“智能除草”和“看见并喷雾”解决方案。
这种类型的个体作物监控可能会成为农业农药行业的主要破坏者。如果地面耕作设备通过计算机视觉变得更智能,并且仅在需要时喷洒单个农作物,它将减少对杀死附近一切植物的非选择性除草剂的需求。精确喷雾还意味着减少除草剂和杀虫剂的用量。
除田间以外,使用计算机视觉分析卫星图像还可以从宏观角度了解农业实践,而地理空间数据可以提供有关全球作物分布方式以及天气变化对农业影响的信息。
嘉吉投资了笛卡尔实验室(Descartes Labs),该实验室使用卫星数据为大豆和玉米等农作物开发预测模型。计算机视觉的这种应用也引起了商品交易者和政府机构的兴趣。 DARPA正在与笛卡尔合作预测粮食安全。

四、过渡的

1、网络威胁狩猎

对网络攻击作出反应已远远不够。使用机器学习主动“寻找”威胁正在网络安全中获得动力。
计算能力和算法的进步正在将以前的理论破解变成真正的安全问题。
根据全球公共数据泄露数据库Breach Level Index的数据,在2018年上半年,全球共有4.5B数据记录遭到泄露(仅供参考,2017年全年为2.6B)。

与AI的其他工业应用不同,网络防御是黑客与安全人员之间的猫捉老鼠游戏,两者都利用了机器学习的先进性来提高他们的游戏水平,并保持领先地位。
顾名思义,威胁搜寻是一种主动寻找恶意活动的方法,而不是仅在发生警报或破坏后做出反应

搜寻工作从对网络中潜在弱点的假设开始,然后使用手动和自动工具以连续不断的迭代过程检验假设。网络安全中庞大的数据量使机器学习成为流程不可分割的一部分。
在Linkedin上快速搜索“威胁猎人”,可显示70多个工作清单
在美国的机构包括Microsoft,Raytheon,Verizon,Booz Allen Hamilton和Dow Jones。
虽然这反映了对各种业务类型的威胁猎人的新兴需求,但也表明该称号本身仍然是利基市场。
“ SANS 2018威胁搜寻调查的结果表明,对于许多组织而言,从流程和组织的角度来看,搜寻仍然是新事物,并且定义不清……对600名受访者的调查显示,大多数搜寻组织往往是大型企业或过去一直是主要目标。”
-IBM赞助的SANS 2018调查。

正如SANS 2018的调查所表明的,对于那些差异化因素是获取数据宝藏的大型企业来说,风险更高。


例如,亚马逊面临来自AWS客户的越来越大的压力,要求他们保护云。错误配置的AWS服务器已导致Verizon,WWE,Dow Jones和Accenture等客户的数据泄露。
亚马逊收购了威胁搜寻创业公司Sqrrl以开发新的用于在AWS客户帐户上寻找黑客的产品。另一家专注于威胁搜寻的AI创业公司Cylance于去年被Blackberry收购。
网络越分散,就越容易受到攻击。
威胁搜寻可能会进一步受到关注,但是它确实面临着一系列挑战,例如应对不断变化的动态环境和减少误报。

2、对话式人工智能

对于许多企业而言,聊天机器人已成为AI的代名词-但诺言并没有跟上现实。
最近,Google因其对话式AI功能Duplex陷入困境。
Duplex可以代表用户拨打电话并进行预订,但是却像真实的人一样交流(带有“ umms”和停顿声)。这引发了道德上的担忧,即在与真实的人交谈时,Duplex是否需要将自己标识为对话代理人。
谷歌在其新手机Pixel 3中增加了Duplex。Pixel3已成为AI的强大力量,其中包括“ screen call”选项,该选项使Google Assistant可以筛选垃圾邮件呼叫者。
自2014年以来,Google一直在为两个对话代理之间的交互申请专利。最新申请“使用情感确定对话代理响应”已于2018年4月提交。

尽管FAMGA和中国的大型科技公司(百度,阿里巴巴和腾讯)都非常关注这一领域,但基于语音和文本的对话代理在某些应用程序中比其他应用程序更可行。
聊天机器人最广泛的应用之一是客户服务。 Bot构成了与用户交互的第一层(注意:并非所有的Bot都使用自然语言处理),并根据复杂程度将查询传递给人类

对于分诊(衡量情况的紧急性)很复杂的应用程序(如健康和保险),这仍然具有挑战性。
同样,在没有视觉提示的情况下,仅通过基于语音的对话进行购物也是一项挑战。
尽管从丝芙兰(Sephora)和雀巢(Nestle)到凯捷(Capgemini)的分析家和CPG品牌都将语音购物视为零售业的下一个大趋势,但它并没有取得成功。除了重新订购特定商品外,它无法提供推动在线商务的关键客户体验。
精神保健是聊天机器人似乎具有潜在破坏力的另一个领域。
心理健康疗法的高成本以及全天候可用的吸引力正在开创基于AI的心理健康机器人的新时代。
早期创业公司专注于使用认知行为疗法(改变负面想法和行为),作为市场上许多情绪跟踪和数字日记健康应用的对话扩展。
但是精神健康是一个频谱。症状存在变化,分析存在主观性,需要高度的情感认知和人与人之间的互动。
尽管有成本和可及性方面的优势,但这使诸如心理保健之类的领域对于算法而言尤其困难。

3、药物发现

随着AI生物技术初创公司的兴起,传统制药公司都在寻求AI SaaS初创公司寻求适用于较长药物发现周期的创新解决方案。
2018年5月,辉瑞与XtalPi建立了战略合作伙伴关系。这是一家由腾讯和Google等技术巨头支持的AI初创公司,旨在预测小分子的药物特性并开发“基于计算的合理药物设计”。
但是辉瑞公司并不孤单。
诺华(Novartis),赛诺菲(Sanofi),葛兰素史克(GlaxoSmithKline),安进(Amgen)和默克(Merck)等顶级制药公司最近几个月都宣布与AI初创公司建立合作伙伴关系,以发现可用于治疗从肿瘤学和心脏病学到各种疾病的新药。
“我们仍处于早期阶段的最大机会是使用深度学习和人工智能来识别全新的适应症,全新的药物。”
— NOVARTIS肿瘤学前首席执行官BRUNO STRIGINI
对这一领域的兴趣正在推动与AI药物研发初创公司进行股权交易的数量:截至2018年第二季度的20笔,与2017年全年持平。

当递归制药(Recursionpharmaticals)等生物技术人工智能公司同时投资人工智能和药物研发时,传统制药公司正与人工智能SaaS初创公司合作。
尽管这些初创公司中有许多仍处于融资初期,但它们已经拥有众多制药客户。

在药物配制阶段成功的可衡量指标很少,但是制药公司将数百万美元押注于AI算法上,以发现新颖的治疗药物候选物并改变药物开发过程。

【译文全文完】

    A+
声明:本文转载自其它媒体,转载目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。