第十五章 人工进化 15.7 死亡是最好的老师
戴维·艾克利是贝尔通信研究所神经网络和遗传算法领域的研究员。我偶然间了解到了艾克利对进化系统一些最独到的看法。
艾克利是个壮得像头熊、满嘴俏皮话的家伙。他和他的同事迈克尔·利特曼制作了一段关于人工生命世界的搞笑视频,并在1990年第二届人工生命大会上播放出来,惹得在场的250位严肃的科学家们哄堂大笑。他的“造物”实际上就是些代码片断,和经典的遗传算法没有多大区别,但是,他用滑稽的笑脸来表示这些代码片段,让它们四处游动相互啃咬,或者撞上代表边界的墙壁。聪明的活下来,愚蠢的则死掉。和其他人一样,艾克利发现,他的世界能够进化出对环境异常适应的有机体。成功的个体非常长寿——按其所在世界的时间尺度衡量的话,能活25000“天”。这些家伙把系统给琢磨透了。它们知道如何用最小的努力来获取自己所需的东西,也知道如何远离麻烦。具有这种基因的“生物”,不仅个体很长寿,而且由其组成的种群也世代兴旺。
在对这些“街霸”的基因进行了一番研究后,艾克利发现它们有些资源尚未充分利用,这使得他觉得自己可以像神一样有番作为:通过改进它们的染色体,利用上这些资源,使它们更加适应他为它们搭建的环境。于是,他修改了它们进化后的代码(这个举动实际上相当于早期的虚拟基因工程),再把它们放回到他的世界。作为个体,它们能力超强,脱颖而出,适应力超过了以往的任何前辈。
然而,艾克利注意到,它们的种群数目总是低于自然进化而来的那些家伙。作为一个群体来说,它们活力不足。尽管从未绝迹,但它们总是濒临灭绝。艾克利认为,由于数目太少,这个物种的繁衍不会超过300代。也就是说,尽管手工改进的基因能够最大限度地适合个体,但从对整个族群有利的角度看,却不如那些自然成长起来的基因。此时此刻,在这午夜黑客的自酿世界中,一句古老的生态学格言第一次得到了明证:对个体而言最好的,对物种而言却不一定。
“我们弄不明白从长远看到底什么才是最好的,这点让人很难接受。”艾克利在人工生命会议上的一席话赢得了一片掌声。“但是我想,嘿,这就是生命!”
贝尔通信研究所之所以允许艾克利从事他的芥子世界的研究,是因为他们认识到进化也是一种计算。贝尔通信研究所曾经而且现在也一直对更好的计算方法很感兴趣,尤其是那些基于分布式模型的方法,因为电话网就是一个分布式计算机。如果进化是一种有效的分布式计算,那么是否还有其它的方法?如果可以的话,我们又能对进化技术做出怎样的改进或变化呢?借用我们常用的那个图书馆/空间的比喻,艾克利滔滔不绝地说道,“计算的空间庞大得令人难以置信,我们只不过探索了其中非常微小的一些角落。我现在做的,以及我想进一步做的,是扩展人类认识到的计算的空间。”
在所有可能的计算类型中,艾克利最感兴趣的是那些与学习有关的过程。“强学习”是一种学习方式,它需要聪明的老师。老师会告诉学生应该知道些什么,而学生则分析信息并将其储存在记忆中。不太聪明的老师则通过不同的方法教学。她对所要教的东西本身也许并不了解,但是,她能告诉学生什么时候猜出了正确答案——就像代课教师给学生测验打分一样。如果学生猜出了部分答案,老师可以给出“接近”或“偏离”的暗示,帮助学生继续探索。这样一来,这位不太聪明的老师就可能生成其本身所不具备的知识。艾克利一直在推动对“弱学习”的研究,他认为这是一种让计算空间最大化的方式:利用最少的输入信息,获取最多的输出信息。“我一直在试图找出最愚笨、最孤陋寡闻的老师,”艾克利告诉我,“我想我找到了。答案是:死亡。”
死亡是进化中唯一的老师。艾克利的使命就是查明:只以死亡为老师,能学到什么?我们还不是很清楚答案,但却有些现成的例证:翱翔的雄鹰,鸽子的导航系统,或白蚁的摩天大楼。找到答案需要些时间。进化是聪明的,但同时又是盲目和愚笨的。“我想像不出比自然选择更笨的学习方法了。”艾克利说道。
在所有可能的计算和学习的空间中,自然选择占据了一个特殊的位置,它是一个极点,在这个点上,信息传递被最小化。它构成了学习和智能的最低基线:基线之下不会有学习产生,基线之上则会产生更加智能、更加复杂的学习。尽管我们仍然不能完全理解自然选择在共同进化世界中的本质,但它依然是学习的基础熔点。如果我们能够给进化一个度量值的话(我们还不能),就可以以此为基准评判其他形式的学习。
自然选择躲藏在许多表象之下。艾克利是对的;如今计算机科学家们都意识到,计算方式有许多种——其中许多是进化的方式。任何人都知道,进化和学习的方式可能有数百种;不论哪种策略,实际上都是在对图书馆或空间进行搜索。“传统人工智能研究的闪光思想——也是唯一思想——就是‘搜索’,”艾克利断言道。实现搜索的方法有很多种,对自然生命中起作用的自然选择只是其中的一种。
生物意义上的生命是与特殊的硬件绑定在一起的,这就是以碳为基础的DNA分子。这个特殊的硬件限制了自然选择所能使用的搜索方法。而有了计算机这个新硬件,特别是并行计算机,许多新的自适应系统得以问世,全新的搜索策略也得以应用。例如,生物DNA的染色体无法将自己的代码向其它生物体的DNA分子“广而告之”,以便它们获得信息并改变其代码,而在计算机环境中,你就能做到这一点。
戴维·艾克利和迈克尔·利特曼都是贝尔通信研究所认知科学研究组的成员。他们着手在计算机上构建一个非达尔文的进化系统。他们选择了一个最合逻辑的方案:拉马克进化——也即获得性遗传。拉马克学说很有吸引力。直觉上,它远比达尔文进化更有优势,因为按道理有用的变异能更快地进入基因序列。然而,它的计算量之大很快就让满怀憧憬的工程师们明白,构造这样一个系统是多么不现实。
如果一名铁匠需要凸起的肱二头肌,他的身体该怎样倒推出基因上所需的变化呢?拉马克系统的缺陷在于,对于任何一个有利的变化,都需要回溯到胚胎发育期的基因构成。由于生物体的任何变化都可能由多个基因引起,或者是在身体的发展过程中由多个相互作用的指令引起。任何外在形式的内在因果都是一张错综复杂的网络,理清这个网络所需的追踪系统其复杂性与这个生物体本身相比也不惶多让。生物学上的拉马克进化受困于一条严格的数学定律:求多个质数的乘积极其容易,但分解质因素则异常困难。最好的加密算法正是利用了这种不对称的难度。拉马克学说之所以没有在生物界中真正存在过,就在于它需要一种不可能存在的生物解密方案。
不过,计算中并不需要躯体。在计算机进化(如汤姆·雷的电进化机)中,计算机代码兼任基因和躯体两个角色。如此一来,从表象中推导出基因的难题就迎刃而解了。(事实上,这种“表里如一”的约束并非只限于人工领域,地球上的生命必然已通过了这个阶段。也许任何自发组织的活系统都必须从一个“表里如一”的形式开始,就像自复制的分子那么简单。)
在计算机的人工世界里,拉马克进化是有效的。艾克利和利特曼在一台拥有16000个处理器的并行计算机上实现了拉马克系统。每个处理器管理一个由64个个体组成的亚种群,总计大约有100万个个体。为了模拟出躯体和基因的双重信息效果,系统为每个个体制作了基因副本,并称其为“躯体”。每个躯体的代码都略微有些差别,它们都尝试解决同一个问题。
贝尔通信研究所的科学家们设置了两种运行模式。在达尔文模式中,躯体代码会发生变异。某个幸运的家伙可能会意外地得到较好的结果,于是系统就选择它进行交配和复制。然而在达尔文进化中,生物交配时必须使用其代码的原始“基因”副本——即它所继承的代码,而非后天获得的经过改良的躯体代码。这正是生物的方式。所以,当铁匠进行交配时,他使用的是他的“先天”代码,而非“后天”代码。
相比之下,在拉马克模式中,当那个改良了躯体代码的幸运儿被选中进行交配时,它能使用后天获得的改良代码,作为其交配的基础。这就好比铁匠能将自己粗壮的胳膊传给后代一样。
经过对两个系统的比较,艾克利和利特曼发现,就他们所考量的复杂问题而言,拉马克系统的解决方案要比达尔文系统强上两倍。最聪明的拉马克个体比最聪明的达尔文个体聪明得多。艾克利说,拉马克进化的特点在于它把种群中的“白痴非常迅速地排挤出去。”艾克利曾经朝一屋子的科学家大喊道:“拉马克比达尔文强太多了!”
从数学意义上来说,拉马克进化注入了一点学习的要素。学习被定义为个体在活着时的适应性。在经典的达尔文进化中,个体的学习并不重要。而拉马克进化则允许个体在世时所获得的信息(包括如何增强肌肉,或如何解方程)可以与进化这个长期的、愚钝的学习结合在一起。拉马克进化能够产生更聪明的答案,因为它是更聪明的搜索方法。
拉马克进化的优越性使艾克利大感惊讶,因为他认为大自然已经做得很好了:“从计算机科学的角度看,自然是达尔文主义者而不是拉马克主义者,这实在是很蠢。可是自然受困于化学物质,而我们没有。”这使他想到,如果进化的对象不局限于分子的话,也许会有更有效的进化方式和搜索方法。