翻译:人工智能 – 革命还未开始 – Michael Jordan

Artificial Intelligence—The Revolution Hasn’t Happened Yet by Michael Jordan

https://hdsr.mitpress.mit.edu/pub/wot7mkc1/release/9

翻译:瀑布棕榈

人工智能(AI)是这个时代的禅咒,在技术专家,学者,记者,风险投资人口中一遍遍吟诵。就像许多其他从学界业界普及到日常用语的词汇一样,在这个词广泛使用的过程中也伴随着深刻的误读。但是这并不是一个典型的“普通人不懂科学家”的故事 – 在这个故事里,科学家兴许和普通人一样摸不着头脑。想象一下,我们的时代里,即将涌现出足以匹敌人类的硅基智能体,这是多么有趣 – 这个图景让我们心驰神往,同时又担惊害怕。而同时,不幸的是,这个图景让我们分了神。

对于这个时代,人们有很多种不同的叙事角度。我所要讲的故事包括了这几个关键词:人、计算机、数据、和生死攸关的决策,但是故事重点不在于“硅基智能体”这个图景。 十四年前我的爱人怀孕的时候,我们去做了超声波检查。诊室里有位遗传学家,她发现超声波影像里胎儿的心脏附近有一些白色的小点。“这些白点是唐氏三体综合症的影像特征“,她说,”您的孩子患病的风险增长到了二十分之一“。 接下来她告诉我们,如果想知道胎儿是否确实有唐氏症的基因畸变,需要做羊膜穿刺术。然而羊膜穿刺术是有很大风险的 – 手术致死的风险大约是三百分之一。作为一个统计学家,我决定找一找这些数字是从哪儿得来的。长话短说,我最终找到了十年之前在英国进行的一项统计分析。分析发现,超声波影像里的白点对应着钙化点,而钙化点确实是唐氏症的预兆。但是我也发现,我们接受检查的超声波图像显示器比这个英国研究里用到的更先进一些,每平方尺多了几百个像素。我回到遗传学家那,告诉她这些白点可能是假阳性(译者:即,检测阳性而实际阴性),和字面意义一样,是“白噪音”。 她说,“啊,这能解释最近几年检测出的唐氏症数量激增的缘由了,正好是几年前换了新机器。”

我们没有做羊膜穿刺术,几个月后一个健康的女婴诞生了。但是这件事情一直在我脑中挥之不去,尤其是粗略估算了一下之后:在我们接受超声波的同一天,全世界数千的胎儿也得到了同样的诊断,他们之中很多人选择了羊膜穿刺术,很多许多生命无辜地逝去了,更可怕的是这故事日复一次的发生着,直到某天人们把它纠正过来。这个故事揭示的问题并不只是关乎我的个人医疗,而是关乎医疗系统:人们在某些地点和时期,记录了一些变量(译者注:variable)和结果(译者注:outcome),进行统计分析,之后把结论用在另外的地点和时期。这个问题不仅仅是数据分析的问题,更是数据库研究人员所谓的“数据溯源问题” – 大致来说就是,数据如何产生,基于这些数据进行了什么分析推论(inference),这些分析推论和目前的实际情形有多相关?虽然也许训练有素的专业人士能够把这些问题视情况地分析清楚,真正的挑战在于如何设计一个全人类规模的医疗系统,在没有如此细致监督的情况下运转。

我也是个计算机科学家,对我而言,构筑这种全人类规模的“推断与决策”系统所需的理论 – 如何协调计算科学和统计学,如何进行人性化设计 – 并不存在于我接受的教育之中。而且对我而言,探寻这些理论的重要性应当是很高的,因为这不仅是医疗业的诉求,也是商业,运输业,教育业的诉求。重要性至少不低于那些以游戏攻关或者动态传感功能让我们眼花缭乱的智能系统。

无论我们能不能在不久的将来终于理解“智能”的真正含义,我们目前着实面临着如何用计算机让人类生活更美好这个大挑战。虽然对于有些人而言,这无可争辩地意味着我们需要创造某种“人工智能”,对于另外一些人而言,虽然不那么诗意,但也同样深刻地,意味着我们需要创造某种新的工程学科。就像过去几十年间兴起的土木工程学和化学工程学一样,这个新学科同样会被几个重量级的思想推动,从而给人类带来新的资源和力量,重要的是,也会同样安全而稳重地发展。就像土木工程学和化学工程学是建立在物理和化学的基础上,这个新的工程学科将会建立在我们前一个世纪里发展积淀的思想基础之上,比如“信息”, “算法”, “数据”, “不确定性”, “计算”, “推断” 和 ”优化“。更重要的是,因为这个新的学科将会着重于由人类产生、与人类相关联的数据, 它的发展离不开社会科学和人文科学的参与。

虽然新学科的组成部件已经各自浮现了,但是把它们粘合在一起的理论还没有成型,所以这些部件目前是近乎临时性地拼插在一起。因此,正如人类在土木工程学出现之前就已经建筑了楼宇和桥梁,人类目前正在建设全社会规模的“推断与决策”系统,它涵盖了机器,人,和环境。正如早期的楼宇和桥梁不时会倒塌而产生不可预见的惨痛损失,我们早期的许多全社会规模“推断与决策”系统存在着严重的设计缺陷。不幸的是,我们并不擅长猜测导致下一次崩塌的严重缺陷在什么位置。我们所缺少的正是一个分析、设计这个系统的工程科学。

目前关于这些问题的公共讨论中,“人工智能(AI)”太多地被当作一张思维上的“百搭牌”(译者注:wildcard,牌类游戏里可以随意凑对的变牌,在计算机领域意为“通配”,即视情况可代指不同对象),以至于我们很难确切地考量新科技的影响范围和后续意义。所以首先让我们仔细地回顾一下“人工智能”在历史和目前的含义。

今天大部分被称作“人工智能(AI)”的技术,尤其是在公共领域的所讨论的,实际上在过去几十年一直被叫做“机器学习(ML)”。 机器学习是一个融合了统计,计算机科学,和其他很多学科(见下)的算法领域,旨在设计处理数据、进行预测、协助决策的算法。机器学期实实在在地影响着现实生活,而且已经如此甚久。事实上,从90年代初,人们就已经明确意识到随着机器学习的发展,它会于业界结缔重大深远的关联。世纪之交的时候,远见卓识的企业如亚马逊,已经开始在商业领域应用机器学习来解决至关重要的后台问题 – 比如欺诈识别和供给链预测,以及开发创新性的前端服务 – 比如推荐系统。随着之后二十年间数据集和计算资源的迅速发展,我们清楚地看到机器学习不仅在亚马逊发光发热,更是推动了任何需要以数据为基础做出决策的企业。新的商业模型由是产生了。人们开始用“数据科学”描述这一现象,这个热词有两个重点意义:一是机器学习的算法专家需要掌握数据集,并且和分布式系统专家一起构筑可扩展的(scalable)、稳健鲁棒(robust)的系统;二是这个系统对社会和环境都产生了深远的影响。

过去几年内,这个思维创新和科技发展汇聚交织的新热潮被更名包装成了“人工智能”。这是值得商榷的。

历史上,“人工智能”这个词是50年代末创造出来,以指代当时风头正热的、用软件硬件构建人类级别的智慧体的美好愿景。这篇文章后面我会称这一愿景为“拟人人工智能“(human-imitating AI),从而突出当时强调的“智能体与人相似”的特性:哪怕做不到外形相似,也要心智相似(且不论心智为何物)。这一风潮很大程度上讲是一次学术运动。虽然相关的学术领域,比如运筹,统计,模式识别,信息理论和控制理论,都已然存在且都常常受到人类(和动物)智能的启发,但是可以说当时都尚停留在“具象”的信号和决策层面。打个比方,这些学科会受启发于松鼠感知自己所生活空间的三维结构、并自如地在树枝间跳跃的能力。当时的“人工智能”却意在全然不同的层面:人们想要研究人类“抽象”的、“认知层面“的“理性”和“思考”能力。六十年之后,抽象的推理思考能力依旧是未解课题,而现今被称为“人工智能”的研究进展,大多来自模式识别和动态控制相关的具象的工程问题,以及来自统计学 – 这一学科着重于从数据中寻找模式,并进行有数学基础的预测、假设检验和统计决策。

确实如此,著名的“反向传播“(backpropagation)算法由David Rumelhart在80年代早期重新发现,现在更被视作”人工智能革命“的技术核心,而这一算法其实是50、60年代控制理论领域最先提出的。它最早的应用是优化控制阿波罗宇宙飞船开往月球的推进器。

自60年代以来,科学技术得到了长足的发展,但是基本上可以说,这些发展并非源自对于拟人人工智能本身的探寻。正相反,就像阿波罗飞船的例子里一样,常常是具体学科的研究人员在幕后根据实际需求创造和发展了新理论。尽管普罗大众可能并不察觉,在许多领路里此类的学术研究和系统建设已经取得了极大成功,比如文件检索、文本分类、欺诈识别、推荐系统、个性化搜索、社交网络分析、设计、诊断、和A/B测试等等领域。这些技术进步作为核心驱动力,推动着包括谷歌,网飞,脸书,和亚马逊在内许多公司。

也许我们可以简略地把这些发展统称为“人工智能“,的确,这个词已经被赋予如此意义了。对于许多优化论和统计学研究者而言,这个标签来的也许有点意外:一夜之间大家都变成了“人工智能研究人员”。 且不论研究人员的领域归属,更严重的问题在于,因为“人工智能”这个词定义不明确,把它以一概全地滥用使得人们更难清晰定义它所涵盖的知识领域和商业领域的具体范围。

作为拟人人工智能这一图景的副产品,“智能强化”(Intelligence Augmentation, IA)这个领域却在过去二十年间收获了学术界和工业界的重大进步。这个领域旨在提供以数据和计算为基础,强化和协助人类智慧和创造力的服务。举例而言,搜索引擎可以算是IA服务(强化记忆力和知识库),自然语言翻译也算是IA服务(强化沟通交流能力)。计算机生成的音频视频,可以作为素材库来协助艺术家发挥创造力。我们可以设想使用更抽象的逻辑思维能力来协助此类服务,但其实目前它们并没有这么“高级” – 主要还是通过各种诸如字符串匹配、数字运算的方式,来获取人类可以识别使用的模式。

希望读者们原谅我再引入最后一个简称词:让我们构想一个“智能设施”(Intelligent Infrastructure, II)学科,旨在以计算、数据和实体构成网络,从而使人类生活的环境更加便利、有趣和安全。这些设施已经开始在运输业、医疗业、商业和金融业等等许多领域崭露头角了,并且给个人和社会都带来了深远的影响。这些新鲜事物有时候在对话中被称作“物联网”(internet of things),但其实物联网更多指的仅仅是把“物”联接到“网上”这件事本身,而忽视了后续。其实远不止于此,这些“物”的功能带来了一系列挑战和机遇:它们能够通过分析数据来探索周围的世界,能够与人类和其他“物”进行交互沟通 – 而沟通的抽象程度也远不仅是传递字节信息这么简单。

打个比方,在此前我自己的故事里,我们可以构想一个“全社会规模医疗系统”,这个系统要建立从医生到体内外传感器间的数据流和分析流,从而帮助人类智慧做出诊断、提供医疗。这个系统要综合体内细胞、基因、血液检测、环境、人口遗传等等信息,以及大量的药物和治疗相关的科学研究。它不是仅仅着眼于一对医生和患者的关系,而是着眼于全人类 – 正如现在的药物测试能把一小部分人类(或者动物)身上试验得出的结论推及到全人类一样。它会保持时效性、可溯性、可靠性 – 正如现在的银行系统应对金融和结算领域的这些挑战的措施一样。而且,虽然我们可以想象这个系统会存在诸多问题 – 比如隐私问题,责任问题,安全问题,等等 – 应该理性地把这些问题视为挑战,而不是断绝发展的阻碍。

好了,现在到了关键问题:在上述这些更广更深的挑战面前,我们真的应该把传统的拟人人工智能作为最好的或者唯一的着重点么?近期大获成功的机器学习成果,大部分实际来自于拟人人工智能的周围领域, 比如计算机视觉,语音识别,游戏攻关,和机器人控制。所以我们只要继续期待这些领域新的进展就好了吗?我从两个角度回答这个问题。第一,报纸上大篇幅的报道不会告诉人们的是,事实上拟人人工智能领域的成果非常有限,我们距离实现拟人的图景尚还非常遥远。对于这个领域哪怕一点点小进展的兴奋(或者担忧),都会引起公众各种层面的过度反应和媒体的集中聚焦,这在其他工程领域是不曾出现的。

第二,更重要的是,拟人领域的成果既不是解决IA和II问题的充分条件,也不是必要条件。从充分条件的角度说,我们以自动驾驶为例:为了实现自动驾驶我们需要解决一系列工程学问题,然而这些问题通常与人类本身的能力(和欠缺的能力)并没有什么关系。理想中完整的交通系统,作为一个II系统而言,应该更像是现存的航空管制系统,而不是现存的人类车辆系统这样车流疏松、面朝正前、由注意力不时刻集中的人类司机构成。当然,它应该远比目前的航空管制系统复杂,尤其是它应该使用巨量的数据和自适应的统计分析工具来进行细微的调整决策。这些才是建立系统的第一要务,相比之下,对拟人的执着只是歧途。

从必要条件的角度说,的确,有些人声称拟人人工智能的图景从内容上涵盖了IA和II的图景,因为拟人系统不仅能解决传统意义上的AI问题(比如图灵测试问题),也能最优地解决IA和II问题。这个说法毫无历史依据。难道土木工程学是以“人工木匠”、“人工瓦匠”为图景而发展的?难道化学工程学是以创造“人工化学家”为目标构建的?从更论辩的角度来说:如果我们的目标是建设一个化工厂,我们是否应该先造出一个“人工化学家”,再让它来设计建设化工厂?

一个类似的论点是,人类智慧是我们所知的唯一智慧,所以我们应该先试图模仿人类。但问题是,人类其实在有些问题上并不是很擅长 – 我们会决策失误,会带有偏见,会有局限性。更重要的是,我们并没有进化出像II系统这样解决大规模的决策问题的能力,也没有能力应付II问题里涉及的各种不确定性。也许有人要说,AI系统不仅能模拟人类智能,还能“矫正”它,从而使之可以对应各种规模的问题。这种说法已经属于科学幻想范畴了。这种含糊其辞的猜测论据,也许可以作为有趣的科幻设定,但是不该作为核心思想来指导我们如何面对已经开始浮现的IA和II问题。我们应该把IA和II作为课题来解决,而不是仅仅当作拟人AI议程的副产品。

在II系统的算法和基础设施所面临的种种挑战中,许多并非拟人AI研究的重点。II系统需要有能力综合管理一系列分布存储的、可能不断变化、且地域间不相一致的知识库。它必须有能力云边(cloud-edge)交互,从而作出及时的、分布的决策,同时还要应对数据中少数人有大量数据、而多数人只有少量数据的长尾效应。它必须解决如何跨越管理权边界和竞争边界进行数据分享的难题。最后,也很重要的事,II系统必须在这个连结人和人、人和商品的统计、计算系统中,融入“激励机制”、“定价”等经济概念。这样以来我们可以说,II系统不仅仅是提供服务,更是创造市场。有许多领域,比如音乐、文学和新闻界,都在翘首期盼如此一个连结内容生产者和用户的市场。这一切都必须结合不断进步的社会、伦理和法理标准而发展。

当然了,经典的拟人AI问题也依旧有趣。然而,现在的AI研究模式——收集数据、研发深度学习模型、展示一些可以小范围模拟人类技能的系统——大多并不与新的解释原理相干,这一模式转移了关于经典AI开放课题的注意力。这些需要解决的开放问题包括:把意义和逻辑囊括进自然语言处理系统,推断和表示因果关系,开发可以计算的表示不确定性的方法,开发制定和解决长期目标的系统。这些都是拟人AI届的经典目标,但是在现在的AI革命喧闹之中,人们很容易地忘记了这些重要问题还没有解决。

IA也依旧会是重要的学课,因为在可预见的未来,计算机对于真实世界的抽象推理能力必定无法匹敌人类。我们将会需要利用一些精心设计的人机交互方式来解决我们的紧迫问题。我们希望计算机能够启发人类创造力更进一步,而不是取代人类(不管这句话什么意思)。

AI这个词是John McCarthy教授(当他还在达特茅斯大学任教,即将去MIT任教之前)发明的。显然是为了把他正酝酿的研究方向与Norbert Wiener(当时MIT更年长的一位教授)区分开来。Wiener发明了“控制论”(cybernetics,大陆同control theory一并译作控制论,台湾译作模控论)一词来指代他对于智能系统的愿景——他的愿景与运筹学,统计学,模式识别,信息科学和控制理论更加相关。McCarthy则更强调其研究与逻辑学的关系。有趣的是这二者反转了,如今Wiener的知识议程披着McCarthy的术语的大旗。(当然目前这个状态一定只是暂时的,AI届的人最擅长摇摆不定)

抛开McCarthy和Wiener的历史不谈。我们应当意识到如今对于AI的公共讨论大多专注于一些学界业界的狭隘的子集,这种狭隘蒙蔽了我们,让我们看不见AI,IA和II在弘大范畴下的许多机遇与挑战。

这个范畴不太关乎实现科幻梦想或者超人噩梦,而是更加关乎如何理解和塑造人类生活中日益常见、日益重要的科技。更重要的是,在这个理解和塑造的过程中,需要来自各行各业的各种不同声音,而不只是擅长科技的这群人自说自话。过分专注于拟人AI的现状掩盖了这些本该听取的广泛的不同声音。

业界将会推动许多新的发展,学界也将会扮演重要的角色。不只是提供一些顶尖的创新科技想法,更是把计算和统计学课的研究人员与其他学科的研究人员聚拢起来,后者——尤其是社会学科,认知学和人文学科——它们的看法和贡献都是十足重要的。

一方面来说,人文和社科对我们的前景至关重要,另一方面,我们也不能忽视我们所谈论的是一项具有史无前例的规模和范围的工程项目。社会在试图制造一类新的人工制品。这些人工制品应当按照设计目标工作。我们不希望制造出本该提供医疗运输和商业机遇的系统,却发现他们实际上没法发挥功用,给人类的生命和幸福带来损失。从这个角度而言,就像我之前强调的,数据科学和学习科学领域还有一门新的工程学科尚未出现。尽管这两个领域看起来令人兴奋,它们目前还并不能被视为一门工程学科。

我们应当接受这个事实:我们正在见证一门新的工程学科诞生。“工程”这个词在学术圈内外都隐含着一种冰冷,无情机械,失去人类控制的意味。但是“工程学科”可以被塑造成我们希望的样子。在这个时代,我们有切实的机会来构建一个历史性的新事物:一门以人类为核心的工程学科。我不想给这个新兴学科命名,但是如果“AI”这个缩写继续作为这个学科的临时占位名,我们需要警惕这个占位名的现实局限性。让我们开阔视野,减少炒作,正视前方严峻的挑战。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注