人类是唯一可以制造机器的动物。通过这种方法,我们扩展了自身的能力,超越了我们的生物极限。而现在,我们正在创造一项全新的技术,用代码赋予它通过数据和练习进行学习的能
在过去十年间,我们每年都会开发数以千计的新算法。现在机器学习算法大致可以分为5个大类,每一类都是从不同的学科领域获得了灵感。有一种机器学习方法就是在模拟自然选择,我们称这样的算法为进化算法。
但这种进化是低效的。当前应用最广泛的机器学习方法是深度学习,它的灵感来自大脑。这种方法从模拟单个神经元功能的高度简化的数学模型出发,构建出包含数千个神经元的网络,并通过学习不断调整不同神经元之间的连接。
机器学习也会借鉴心理学。与人类相似,这种以类比为基础的算法通过在已有的数据中寻找近似的问题来解决新的问题。
通过自动执行科学方法,机器也可以实现学习。为了引入新的假设,所谓的符号学习会进行逆向推理演绎。
最终,机器学习可以完全构建于数学原理之上,其中最重要的是贝叶斯定理。按照这个定理,我们可以基于现有知识,先给不同假设指定初始概率,然后提升与数据相符的假设的概率,并降低与数据不符的假设的概率,最后计算所有假设的加权平均值,就可以作出预测:概率越高的假设,权重也越高。
这5类机器学习算法,每一种都既有优势,也有不足。所以机器学习研究者一直致力于把各种方法的优势结合起来。就如同一把能打开所有锁的万能钥匙,我们也在努力创造一个所谓的主算法(master algorithm)——这个算法可以从数据中学习到一切特征,提取出所有可能得到的知识。
智能机器人:这个机器海星会使用进化算法来学习如何模拟自己。进化算法是机器学习算法中的一大类,科学家希望可以把它与其他算法结合起来,得到“主算法”,那将是一种非常强大的工具。
当前,机器学习领域面临的挑战和物理学家面临的挑战类似:量子力学可以在微观尺度上很好地描述宇宙,广义相对论则适用于宏观尺度,但这两个理论却是不相容的,有待调和。在粒子物理学的标准模型建立起来之前,詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell)首先统一了光、电和磁;与此类似,包括我和华盛顿大学的同事在内,很多研究团队都提出了将两种或多种机器学习方法统一到一起的思路。但科学进步是断断续续、非线性发展的,因此很难预测这个大一统的主算法什么时候才能实现。不管怎样,这一目标的实现并不会导致一个全新的、强大的机器种族出现,相反,它会促进人类的进步。
人工智能不会取代我们
一旦我们获得主算法,并输入由每个人产生的大量数据,人工智能系统就可能通过学习得出每个个体的非常准确和详细的模型:我们的口味和习惯、优点和缺点、记忆和愿望、信仰和个性、我们在乎的人和事,以及任何特定场景下我们会如何回应。我们的模型实质上能够预测我们将做出的选择,这既令人兴奋又令人不安。
许多人担心,拥有这些能力的机器会利用它们新获得的知识来夺走我们所有的工作,奴役我们,甚至消灭我们。但这是不可能发生的,因为它们没有自己的意志。基本上,所有的人工智能算法都是由我们设计的目标驱动的。这些算法与普通算法的区别在于,它们可以灵活地决定如何实现我们为它们设定的目标,而不是需要执行预先定义的一系列步骤。即使通过不断执行任务而得到优化,它们的目标仍然没有改变。此外,人类会核查机器的成果是否符合我们的目标。
人工智能只是一种解决难题的能力,而这一任务并不需要自由意志。它与人类作对的可能性,并不比你的手突然不听使唤,扇自己耳光更大。和其他技术一样,人工智能将永远是我们自身的扩展。我们所设计的人工智能越强大,人类也就受益越多。
那么,人工智能会让我们的未来变成什么样子呢?智能机器确实会取代许多工作,但对社会的影响可能类似于以前的自动化机器。200年前大多数美国人都是农民,如今机器已经取代了几乎所有的农民,却没有造成大规模的失业。末日论者认为,这一次是不同的,因为机器正在取代的不仅仅是我们的肌肉,更是我们的大脑。但是,人工智能距离承担我们的所有任务仍然非常遥远。在可预见的未来,人工智能和人类将擅长不同的事情。机器学习的主要作用将是大大降低智力成本。这种普及进程将让人工智能在更多的领域变得经济可行,创造新的就业机会,并改造旧的工作,让相同数量的人力能完成更多工作。
然后,还有未来学家雷·库兹韦尔(Ray Kurzweil)宣扬的“奇点”。他设想,技术进步会永远不断加速:机器学会制造更好的机器,而新的机器又能制造出比它还要好的机器。但我们知道这是不可能的,即便是量子计算机——它的计算能力也受到物理定律的严格限制,而且在某些方面,我们距离这样的极限已经不远了。人工智能的进步,就像其他一切的进步一样,最终会趋于平稳。
人工智能,尤其是机器学习,事实上只是人类进化的延续。在《延伸表型》(Extended Phenotype)一书中,英国科学家理查德·道金斯(Richard Dawkins)谈到,动物基因控制的不止是它们的身体,还有环境,而且这种现象相当普遍——从杜鹃产蛋到河狸筑坝,都是如此。技术就是人类表型的延伸,我们今天所构建的是我们的另一层技术外骨骼。未来人类会如何运用人工智能?我认为最可能出现的情景要比通常的推测更有趣。
在十年内,我们中的每一个人都可能拥有一个“数字替身”,这个人工智能助手将比我们今天的智能手机更加不可或缺。你的数字替身不需要和你一起移动,它很可能存在于云中的某个地方,就像你现有的个人数据一样。我们可以在Siri、Alexa和Google助手等虚拟助手中看到它的雏形。数字替身的核心是一个你自身的模型,该模型将从你与数字世界互动时产生的一切数据中学习,包括桌面电脑、网站、可穿戴设备以及智能扬声器、恒温器、手机信号发射塔和摄像机等环境传感设备。
我们的学习算法越好,我们给数字替身提供的个人数据越多,它们就会变得越精确。一旦我们有了主算法,就可以通过增强现实设备和其他个人传感器连续捕捉你的感觉和运动信息,这样一来,数字替身会比你最好的朋友都更了解你。
你的数字模型和数据将由一个“数据银行”来维护,这与你用来储蓄和投资的传统银行不同。许多现有的公司肯定愿意为你提供这种服务。谷歌创始人谢尔盖·布林(ergey Brin)表示,谷歌想成为“你的大脑的第三个半球”,但如果你大脑的一部分要通过向你展示广告来维持它的存在,你可能不愿意。最好是由利益冲突更少的新型公司或由与你志趣相投的人形成的数字联盟来给你提供更好的服务。
毕竟,人工智能最值得担心的地方不是它会自发地变邪恶,而是控制它的人会滥用它。因此,你的数据银行的首要任务是确保你的模型永远不会被用来损害你的利益。你和数据银行都必须保持警惕,时刻监控人工智能犯罪,因为这项技术同样也能增强坏人的能力。我们将会需要人工智能警察来抓捕人工智能罪犯。
当然,这也给某些机构提供了机会,让它们更容易监视和约束你。考虑到机器学习的发展速度,电影《少数派报告》(Minority Report)中的情景也可能出现——人们在即将犯罪时被提前逮捕。
作为个人,我们的首要任务是不要自满,不要盲目信任我们的数字替身,忽略它们才刚诞生没多久的事实。从外表看,人工智能似乎是客观,甚至完美的,但在内里,它们同我们一样有诸多缺陷,甚至更多,只是方式不同而已。例如,人工智能缺乏常识,很容易犯一个人永远不会犯的错误,比如把横穿马路的人误认成被风吹起的塑料袋。它们往往只能理解我们指令的字面意思,精确给出我们要求的东西,但那不是我们真正想要的。
实际上,你的数字替身和你如此相似,以至于它可以在各种虚拟互动中替代你。它的工作不是像你一样生活,而是要帮助你选择那些你没有时间、耐心或知识亲自去选的东西。它会阅读亚马逊上的每一本书,推荐一些你最可能想要阅读的书。如果你需要一辆车,它会研究各种选项,并与汽车经销商的替身讨价还价。如果你在找工作,它会寻找所有符合你需要的职位,然后为你安排最有可能通过的真人面试。如果你被诊断出了癌症,它会尝试所有可能的治疗方法并推荐最有效的治疗方法。如果你正在寻找爱侣,你的数字替身将会与所有符合条件的数字替身进行数百万次的虚拟约会。在虚拟空间中擦出爱情火花的情侣们则可以在现实生活中约会。
从本质上说,你的数字替身会在虚拟空间中度过无数种可能人生,这样真实世界中的你就可能选出其中最好的一个版本。你的模拟生活是否真实,你的数字化身是否有某种自我意识,就像英剧《黑镜》(Black Mirror)中的一些故事那样,都是有趣的哲学问题。
一些人担心,这意味着我们将把自己生活的控制权交给计算机。但它实际上给了我们更多的控制权,而不是更少。你的模型还将从每次虚拟体验的结果中学习(你享受这次约会吗?你喜欢你的新工作吗?)所以随着时间的推移,它给出的建议会越来越接近你本人的选择。
事实上,我们已经习惯了在潜意识的干预下做出我们的大多数决策,因为这就是我们大脑的运作机制。你的数字替身就像是大幅扩展了的潜意识,但它们之间有一个关键的区别:当你的潜意识在你的身体里独自生活时,你的数字替身将会不断地与他人和组织进行互动。每个人的数字替身都将继续努力学习其他人的模型,构成一个基于模型的社会,它们会以计算机的速度生活,探索所有的可能性,猜测我们在当下可能做出的选择。我们的机器将是我们的侦察兵,为独立个体和整个人类物种开辟一条通往未来的道路。它们将带领我们去往哪里?我们将选择奔赴何处?
撰文:佩德罗·多明戈斯(Pedro Domingos),华盛顿大学的计算机科学教授,也是《终极算法》(The Master Algorithm,Basic Books,2015年出版)的作者。
翻译:崔迪潇,西安交通大学人工智能与机器人研究所讲师。