本文系网易智能工作室(公众号 smartman163)出品,此篇为AI英雄人物专访第42期。
选自|Gigaom
翻译|网易见外翻译机器人
审校|秦昕
杰夫·迪恩(Jeff Dean)是美国工程院院士、ACM Fellow、Google高级研究员,属于谷歌最早的雇员之一,他1996年从华盛顿大学计算机系获得博士学位,1999年加入谷歌,他成为谷歌成长过程的关键人物,谷歌分布式计算基础构架主要由他设计和完成,该构架支持了谷歌的大部分产品,他还被称为“谷歌大脑背后的大脑”。
一、关于“Google Brain”项目
【问】我记得你开始在谷歌工作可以追溯到上个世纪了,对吗?
【Jeff Dean】是的,是在1999年。当时公司成立还不到一年,公司非常小,所有员工都挤在帕洛阿尔托市中心的二楼办公室,楼上是一家T-Mobile商店。
【问】感觉就像一家初创公司一样。那当时的环境是怎样的?
【Jeff Dean】我记得我们有一张乒乓球桌,随后变成了两张因为我们要在上面吃午餐。但是当时我们正在努力开发一款搜索引擎,所以每天还都是兴奋充满活力的,在这个领域有很多令人激动的工作。
【问】在过去的十七年里,你所做过的各种工作是不是可以列出一张惊人的清单了?
【Jeff Dean】当然可以。我做的第一件事是把我们广告系统的初始骨架整合在一起,我花了一段时间来研究它。接下来的四五年中,我大部分时间都在和其他人合作,致力于开发我们的核心搜索系统引擎。这就是所谓的“呼叫系统”——把所有我们可以搜集到的网页整合到一个索引中来,然后把它变成一个可以在用户提问时快速作出回应的系统。
用户在谷歌中键入一些东西,随后我们希望系统能够快速分析出哪些页面与该查询相关联,随即给出结果。 当一个查询问题输入到谷歌时,服务系统决定如何在许多计算机上分配这个请求并进行结果查询,最后将它们各自的分析结果整合到一个可以反馈给用户的系统中来。我从事相当长一段时间的核心搜索和索引工作。
【问】现在你带领着谷歌大脑“Google Brain”项目。那么,这个项目究竟是做什么的呢?
【Jeff Dean】没错。主要来说,我们在大量的进行机器学习和人工智能方面的研究,然后利用我们的研究成果来制造智能系统。如果一个智能系统在一种产品中使用,那么通常情况下可能会带动新产品的产生。
当我们致力于将产品整合到现有产品中时,通常会和其他谷歌产品团队紧密合作,一同将我们的研究成果转化为产品。除此之外,我们还单纯地做大量的调查,去发现我们存在能力去开发的一些现在可能不被重视,但是未来却十分有价值的前沿系统。
【问】每个人对“人工智能”都有不同的见解,那么你是怎样理解的呢?什么是人工智能? 你能用几句简单的话术来定义它?
【Jeff Dean】这是自计算机诞生以来就一直存在的一个术语。对我来说,这意味着要打造一种看起来很智能的东西。它是区分人类和其他生物的方式之一,我们拥有更高级的智慧。除此之外,我们可以交流,我们可以获取有益的信息,并能在很高的层次上理解它们。
当我们去做一件事的时候,每个人都有不同的做法。所以我们想要建立一个可以最大程度体现智慧层面的系统。有时候所需的智慧是狭义的,比如我们希望他们能够完成一项我们认为很重要的任务,并具有狭义智能。
但是,与此同时我们也希望建立一个可以做很多不同的事情的智能系统。我认为,目前在某些领域,狭义智能工作表现得相当不错。广泛的、真正灵活的智能目前显然还是一个开放的研究话题,可能需要人们投入一定的时间对它们进行长期研究——实际上问题的关键是找出如何建立能够在多数情况下都能作出反应的智能系统。
【问】你提到“举止聪明”和“显得聪明”。比如人造草皮,并不是真正的草皮,一些系统也并不是真正的智能,而是在模拟智能。这个说法你同意吗?
【Jeff Dean】提到某些模拟智能,我的意思是,它展示出了一些真正智能系统会有的相同特征。但是实际上它可能会用一种不同的方式做事情。比如,生物和硅有着不同的优点和缺点,但是尽管如此你最终关心的是这个系统或媒介是否能以一种有用的方式运作,从而增强人类智力。
二、通用人工智能会成为一种可能
【问】你提到了AGI,通用人工智能。能够实现这种智能的时间大概需要5到500年。那么,你是怎么看待如此大的时长差异呢?
【Jeff Dean】我认为这是一个很大的时间范围,是因为我们正在做的事情有很多是很清楚人不确定性。我们并不类是如何处理得到的各种信息,并对此制定之后的策略的。我们对此仅有一点了解,但没有深入的去研究过,因此这意味着我们无法确定想要完成一个智能系统所需要的时间。
这就导致了各种各样的时间估计偏差。我有点介于两者之间。我认为在过去的五到十年里,我们已经取得了很大的进步,在这之前的二十年或三十年里,我们已经取得了进步。我们的系统将会有非常广泛的智能功能,也许在未来的二十到三十年,但是我在这个估计上可能有很高的误差。
【问】通过你刚才的描述,感觉通用人工智能是我们之前工作的进化,而不是一项完全不同的事物。实际上,我们还没有真正开始研究这个问题。你同意这个观点吗?
【Jeff Dean】我认为我们所做的一些工作已经开始涉及到建立人工智能系统。我们有一大堆不知道如何解决的事情,我们甚至不知道我们还需要什么,这就是为什么这是一个开放且令人兴奋的研究课题。但我坚信,我们今天所做的一些事情将成为解决方案的一部分。
【问】所以你认为你会在事业的巅峰期目睹AGI的出现吗?
【Jeff Dean】未来是不可预测的。也许我明天就会遇到一场自行车事故,但我认为,在未来的15到20年里,肯定会有一些奇迹发生,虽然有些事情我们今天是没有办法想象得到的,但无论如何十年、十五年、二十年之后我们一定会取得令人印象深刻的成就。
【问】那么这会让我们意识到AGI或者说是机器意识是一种完全没有可能的事情吗?
【Jeff Dean】我真的不知道。我倾向于不去探讨什么是意识的哲学辩论。对于我这种外行来说,意识只是生活系统中神经元的某种电子活动——它能意识到自己,能理解后果,如此等等。因此,从这个角度来看,意识似乎并不是什么特别的东西。这似乎是一种类似于智能系统所展示的其他属性。
【问】所以,如果没有你的自行车撞车事故,这个世界会变成什么样子呢?也许二十年后,我们在人工智能上取得了令人难以置信的进步,也许还有类似于AGI的东西出现?你认为这一切会对整个世界造成什么样的影响呢?这对人类有好处吗?
【Jeff Dean】我认为这几乎是一件好事。我认为,如果你回顾一下之前取得的技术进步,比如从农业社会向工业革命的转变。过去99%的人都在努力的种植粮食,而现在,在许多国家,只有百分之几的人在从事粮食供应的工作……这样让人们有时间去做许多其他的事情,这都是这巨大变革后的结果。
所以,我认为,就像任何一种技术一样,也许不会带来什么惊天动地的改变,但总体而言,大很多方面将会因此而进步。一个真正的智能技术可能就是改变人类社会的一个杠杆。如果我有一个问题,一个非常复杂的问题——今天我可以通过搜索引擎来解决。但是当我想要了解一个特定的话题,并希望找到我需要的所有这些论文,然后阅读并总结它们,那要怎么办呢。”
如果有一个智能系统我便可以对它说,“找到我所有关于机器人技术强化学习的论文,并对它们进行总结。”这个系统便可以运转,在二十秒内就完成任务,这对人类非常有用。
三、学习能力开始成为机器学习研究的一个重要领域
【问】那是当然了。那么,你认为有哪些挑战让我们与这个世界有隔阂?换句话说,我们在这个领域需要克服的最新障碍是什么?
【Jeff Dean】在机器学习研究领域,我认为非常重要的一点是,当我们想要为某个特定的任务建立一个机器学习系统时,我们往往会需要一个机器学习专家参与其中。我们有一些数据以及计算,需要一个人类机器学习专家坐下来决定:好吧,我们想要解决这个问题,这就是我们大致的方法。之后我们便建好了一个系统,可以从提供给它的观察中学习如何完成这项任务。
这就是机器学习的工作机制,将会推动当今世界上发生许多非常有趣的事情。这就是为什么计算机视觉在过去五年中取得了如此巨大的进步的原因,为什么语音识别功能的效果会更加出色,为什么现在的机器翻译工作比一、两年前好得多。因为这一功能是非常重要的。
但问题是,你在构建这些狭窄定义的系统时,它们可以在一件事,或者一些事情上做的非常好。我们真正想要的是一个能做十万件事的系统,然后当成百上千件以前没有发生过的事情发生的时候,我们希望它从它的经验中学习,能够运用它在解决前几十万件事情中所获得的经验,从而能够快速学会如何完成千上万的事情。
但是对于这种学习机制,我们希望可以没有人类机器学习专家的出现,去教会它如何去做百上千件事。
【问】这实际上可能就是AGI要实现的目标吧?
【Jeff Dean】我的意思是,随着时间的推移,它会变得更像一个可以自我提升的系统,并且可以通过在已经知道如何做的基础上增加新任务的能力。
【问】一般来说,这就是转移学习,对吧?我们把某物放在一个空间里,用它来影响另一个空间。这是一个新的研究领域,或者说是人们思考了很长一段时间的事情,我们只是还没抽出时间来做而已。
【Jeff Dean】人们对这个问题的思考已经有一段时间了,但通常情况下,我会有很多想做的事情,只从中选出三个。随后,去学习做三这件事,之后用较少的数据去做第四件事。 之后再给它新的任务,这一次,没有任何人类参与,系统就能学会完成新任务了。
所以我认为这是主要的区别。多任务学习和转移学习已经在非常小的范围内取得成功了。当然,我们需要这样的实验,以便我们能在更大的范围内应用它们。
另一件新事物是元学习,它开始成为机器学习研究的一个重要领域——本质上是“学习能力”。这样就会有一个系统,它可以看到一个全新的任务,并根据它的经验来学习完成它,也许它会做一些实验来证明它可能想要尝试去解决这个新任务。在我们需要尝试不同的方式来解决问题以及加快机器学习进程的时候,通常需要人类的参与。
四、正在进行的项目:TensorFlow开源软件包
【问】有些人担心人工智能的发展会对人类的工作产生影响。最后因为机器可以比人类更快地学习新任务,继而社会中一群人将会被高速的经济发展所淘汰。你对此有何看法?
【Jeff Dean】显然,计算机将会在一些层面上让一些工作自动化,并且随着时间的推移,能够让机器自动化取代的工作越来越多了。这种情况以前就发生过,比如从农业社会向工业型经济的转变,很大程度上是因为我们能够将农业生产的许多方面自动化,从而导致了工作岗位的转移。
但是随之人们发现了其他可以做的工作。所以,总的来说,我是一个乐观主义者,我认为,政治家和政策制定者应该思考,如果计算机能够完成比以往更多的任务,那么我们想要的社会结构应该是什么样子。我认为这在很大程度上是政府和政策的问题。我的观点是,计算机能够实现很多事情的自动化,这些都是人类目前所从事的重复性工作,因为它们太复杂,无法让我们的计算机学会如何去做。
【问】那么,如果我理解正确的话,你的意思是你不担心大量工人会因为科技而失业?你现在在人工智能领域正在涉及的事情是什么呢?
【Jeff Dean】作为一个团队我们各有分工,所以我的主要工作就是领导我的团队并为我们现在做的项目提供一些指导。我们团队正在进行的一些研究项目,我个人也参与其中,比如针对在医疗领域中使用机器学习。我认为在未来,机器学习技术可以在医疗保健事业上做出重大的贡献。
我个人就在研究,我们如何能够建立合适的计算机硬件和计算机软件系统,使我们能够建立机器学习系统,从而能够快速地尝试各种不同的机器学习理念——这样你就可以建立起一个可以扩展的机器学习系统。
这就是我们与硬件设计团队的合作项目,确保我们打造了正确的机器学习硬件……TensorFlow是我们团队开发的开源软件包,我们在一年半之前开源——利用它我们得以表达我们的机器学习理念,并将其用作培训我们机器学习系统的设备。
目前我们已经发布了这一系统,所以谷歌外部的很多人也在使用它,并希望在一段时间内共同改进它。我们也进行了一系列不同的研究工作,我个人非常密切地关注“学习“学习项目,因为我认为这将是一个非常重要的研究领域。
【问】许多人认为,如果人类有能力创造“AGI”,那么第一个一定会出自谷歌“之手”。这有可能吗?
【Jeff Dean】好吧,我觉得在AGI之前,我们还有大量的未知和不确定性,因此它也可能来自任意一家公司。这个领域的研究非常的宽泛,但也十分重要,需要不断的进步,我们正在努力建立能够做更多事情的系统。但我想说,AGI是一个相当长远的目标。
【问】那么当谷歌达到一定大的规模的时候,自身也会增添一些不可预见的新属性,你觉得是这样吗?
【Jeff Dean】不好意思我不是很理解这个问题。
【问】人类是不断更新的,不是嘛?你有一万亿个细胞,它们并不知道你是谁,但是换句话说,你的细胞中没有一个是有幽默感的,但你有。所以在某种程度上可以说,系统整体具有其单一部分没有的特征属性。可能有些例子举得不是很恰当。比如,当你看到一些数字时,如人脑中的连接数量以及数字世界中没有的数据,再比如我们看到电子世界中相同类型的命令,需要我们的猜想。
【Jeff Dean】是的,我认为人类的大脑和计算系统的能力相比,仍然有几个数量级的差距。我们可能就像纽特一样。但是,我的意思是,我们的目标是建立更智能的系统,随着你计算能力的提升,这些系统将会变得更有能力。
五、机器学习将涉及更多的研究领域
【问】正因为出色的GPU,更加完善的算法,全面的数据库以及更先进的训练集和摩尔定律,人工智能才得以在过去的10年内取得了巨大的成功。没有比这更复杂的了吗?这是由很多因素共同决定的吗?或者是一些可能不被人注意到的分水岭事件的发生,给我们带来了现在人工智能的复兴?
【Jeff Dean】所以,让我这样来描述一下:我们今天使用的很多算法实际上是在二十、二十五年前开发的,当时人们对神经网络的兴趣首次高涨,这是一种特殊的机器学习模式。二十或二十五年前在非常小的问题上出现过这个模式……但我们缺乏让它们在大问题上良好运行的计算能力。
所以,如果你快速回到二十年前,大概在2007年,2008年或2009年,那时起我们开始有了足够的计算能力,以及足够大、足够有趣的数据集,使神经网络能够解决实际的有趣的问题——比如计算机视觉问题或语音识别问题。
事实上,神经网络已经成为解决这些问题的最佳方式,因为我们现在有足够的计算能力和足够大的数据库。在过去的十年里,我们做了大量的研究工作,来增加二十、三十年前用新技术开发出来的基础算法。
GPU是其中一个有趣的方面,但我认为最根本的是认识到神经网络,以及机器学习模型。与今天在计算机上运行的大多数代码有着不同的计算特性,这些特征基本上都是线性代数的运算——矩阵乘以向量运算,而且它们还相当宽容地降低了精确度。所以当你在计算神经网络的时候,你不需要精确的六到七位数—,仅需要更小的精确度 。
这两个因素结合在一起,可以为非常低精度的线性代数构建专门的硬件。这就增强了我们在这些问题上应用更多计算的能力。GPU是一件事,谷歌开发了一种新的定制芯片,叫做张量处理单元,TPU,它使用的精度低于GPU,并具有显著的性能优势。我认为这是一个有趣且爆炸性的领域。因为当你在构建专门针对某一子集的特定硬件时,而不是像CPU那样采取非常普遍的计算方式,你就会面临这样的风险,即特定的子集只是你在计算系统中想要做的事情的一小部分。
但是,现今神经网络和机器学习模型适用于非常广泛的领域,比如语音识别和翻译、计算机视觉、医学和机器人技术。所有这些东西都可以使用相同的基础元素,以此来加速线性代数——做完全不同的事情。因此,你可以开发适用于许多不同事物的专用硬件。
【问】我明白了。好吧,我想我们的采访已经快到时间了。你还有什么结束语吗,或者我们可以期待从你的工作中看到什么吸引人的成果吗?
【Jeff Dean】我想我有很多成果想激动的和大家分享。我只列举几个……
我认为机器学习在医学和医疗领域的应用将是非常重要的。对于医生和其他医护人员来说,这将是一个巨大的帮助,让他们可以快速的获取病人的确切的病理信息,什么对病人是最有效的,或者是解读医学图像,并为人们就医疗图像提供有效的建议。
我对机器人技术很感兴趣。我认为机器人技术的机器学习将在未来5年、十年成为一个有趣的新兴领域。我认为,这种“学习学习”的工作将带来更灵活的系统,在不需要太多机器学习技能的情况下,它们可以学习做新任务。我认为这将是一件非常有趣的事情,因为它会不断进步。
然后,在所有机器学习工作的背后,我认为,在未来五年里,打造专门针对特定类型机器学习模型的定制硬件的趋势将会非常有前景。
最后一个想法是,我认为机器学习的领域不仅涉及计算机科学,还能涉及很多人们正在钻研的领域。因此,我觉得目前的发展很振奋人心,因为当人们意识到机器学习的光明前景便愿意开始学习和做机器学习研究,并理解机器学习在不同科学领域或不同应用领域的意义。
在过去的五到八年时间里,我们非常兴奋地看到,越来越多来自不同背景的人正在加入这个领域的研究,并在这个领域从事着一些有趣的课题。(完)
点击查看《AI英雄》专题,往期内容一步直击!
注:《AI英雄》专访隶属网易智能工作室,围绕人工智能领域讲述人物故事,洞察技术趋势,捕捉行业机会,关注人的价值。转载请注明出处,违者必究!