2431
需用时 04:51
算法的“仿生学”:AI从生物身上学到了什么?

2016年3月13日,谷歌DeepMind公司的围棋人工智能软件AlphaGo与韩国围棋职业九段李世乭进行了五番棋的第四局较量。这一次,李世乭终于打败AI。

如果说之前专业棋手和非专业人士对AlphaGo的胜利还持保留态度的话,那么现在已经普遍认可了这款软件的棋力。AI会从李世乭的这一局中学会什么我们还不得而知,不过,在人工智能的研究中,除了和计算机科学、神经科学相关外,其实还有仿生学。我们可以试着从进化生物学的角度来看看这件不寻常的事。

黏菌与交通网设计

在生物学的视角里,进入人工智能视野的生物有机体有许多种。其中最简单的生命形态是一种被称为多头绒泡菌(Physarum Polycephalum)的黏菌(属于原生生物中的阿米巴Amoebozoa),这种生物是一种单细胞生物,最有趣的特点是在平板培养基上,它们细胞的“生长路线”对于平面交通网络等的设计和算法具有参考价值1

如果将黏菌的食物源按照地图上一个国家的城市的位置进行摆放的话,那么黏菌生长路线形成的网络与现实中比较完备的公路、铁路等网络具有很高的相似性。也就是说,虽然从生物学的角度看,黏菌不属于多细胞动物,没有神经细胞分化,也没有脑,但是其细胞生长对于食物源化学信号的感知和反应已经可以为人工智能的设计提供参考。

根据食物源的方位, 黏菌长成的“交通网”可以给现实中的交通网设计提供启发。图F和东京附近的铁路网十分相似。图片来源:wired.com

为什么黏菌的生长可以从一个食物源开始,以非常接近最短路线的方式到达其它食物源呢?究其原因,单细胞的属性是一个因素。作为具有很强变形能力的单细胞(阿米巴也叫变形虫),细胞膜的局部形变突出是它们对食物源化学信号浓度梯度做出的反应。如果向着某个方向形变之后感受到的食物源浓度更高,它就继续生长;如果感受到的浓度更低就保持或退回,这和所有基于似然值进行搜索的策略是一样的。

相对来说,虽然脊椎动物循环系统、昆虫气管系统在个体发育的形态建成过程中也具有类似的氧气浓度依赖性,但是多细胞的分化方式决定了“修改”不再有用的结构时,需要以细胞“程序化死亡”的方式进行(可以理解为降解掉细胞),而不能像变形虫一样降解掉细胞内部的相关细胞骨架。

社会性昆虫、灵长目与人工智能

在智能程度相对比较高的生物有机体中,最著名的两类可能是社会性昆虫(蜚蠊目的白蚁,膜翅目的蚁科、蜜蜂科、胡蜂科等)和灵长目动物。这两类动物在“智能”方面既有相同点,也有不同点。

在相同的一面,它们的个体都具有脑占身体比重高的特点。这个指标往往是衡量生物有机体智能高低的一个关键指标,指标高的生物的确常在智能方面有更复杂的行为和更好的表现,例如软体动物门中的头足纲动物Cephalopoda(章鱼、鱿鱼等);另外一个共同点是,这两类动物的种内个体间关系都很复杂。虽然包括人类在内的灵长目动物的社会性与社会性昆虫的真社会性有所区别,但是毕竟都存在复杂的个体间关系。事实上,脑体比重高和种内复杂个体间关系这两个特点往往相伴而生(例如鲸目动物Cetacea也是这样)。对于两者之间的因果关系,一般普遍认为群体性与个体间协作行为的需求是前提、是基础。

在不同的一面,灵长类动物的个体能力要高于社会性昆虫的个体能力,两者分属于生态学上的“K对策生物”和“r对策生物”——前者一般繁殖率低、后代个体数量少、个体大、寿命长;后者则相反。也就是说,虽然社会性昆虫个体的脑体比重在昆虫中是相对高的,但是每一个单独的个体很难表现出比较复杂的智能行为,只有群体才能表现出协同捕食、筑巢等复杂行为,具有个体数量依赖性。也因此,社会性昆虫会被称为“superorganism”。不过,数量多也是有好处的。

类似蚂蚁寻路的“蚁群算法”。图片来源:sciencedirect.com

蚂蚁与蚁群算法

在社会性昆虫中,蚂蚁是以收集——捕食为主,大多在地面爬行。相对来说蚂蚁的行为既复杂又容易被观察,为蚁群算法(Ant Colony Algorithms)的提出提供了基础。

蚁群算法最早由马洛克·多瑞哥(Marco Dorigo)在博士论文工作期间提出2,是群智能方法(swarm intelligence methods)的一种,可以为人们解决路径优化的问题提供帮助。简单来讲,比如我们想要解决“一个多面体上的两点,怎么走才最短”这个问题时,我们可以不断地在一个点释放“蚂蚁”,这些“蚂蚁”会在多面体上运动并走到另外一个点。当“蚂蚁”数量足够多时,我们就能得到在特定条件下,某条“蚂蚁”走出的“最优”路线。

人类智能与人工智能

说到人工智能,就必须提到与DeepMind公司同为英国人的图灵(Alan Turing, 1912-1954)和彭罗斯(Roger Penrose, 1931-)。前者是人工智能的奠基人(同时也提出了生物有机体发育过程中模式建成的理论),后者作为数学和物理学领域国际顶尖的学者,曾经写过著名的科普读物《皇帝新脑》(The Emperor's New Mind)。彭罗斯教授指出,即使人工智能和人脑原理在算法本质上可能没有区别,但是从硬件方面来说有一个不同:人脑是一个动态系统。

在现生的灵长目动物中,人的脑体比重是最高的、脑的绝对容量是最大的、个体间关系是最复杂的。关于人类大脑容量的进化,有研究显示,人类大脑容量增加并非匀速的,而是与外界环境的周期性密切相关。而人类脑容量增加最显著的时期往往是气候变化最为剧烈的时期3。看来人类智力的进化历史,就是一部人类生于忧患的历史。

而沿着彭罗斯教授的思路,我们可以看到DeepMind仍然和人脑有很大不同,因为他/她还不是一个可以自主运行的系统,还需要“人”的参与。反过来说,人类的智慧进步过程中,通过输入和输出的持续反馈,人脑的硬件结构并没有直接被外界干预,而人脑的思维(算法)又是完全依赖于各种细胞和分子构件的硬件。相比之下,DeepMind可能还不会通过输入和输出的各种反馈而自己改变源程序,仍然要依靠人类设计者团队去优化算法。

人脑的思维(算法)依赖于各种细胞和分子构件的硬件。我们的大脑还有什么优势?图片来源:robohub.org

人类智能的优势?

即使DeepMind或其它人工智能围棋软件能够有一天能不再需要人类设计者团队而自行独立改进算法;即使这些电脑软件能在围棋联赛和国际比赛中能够持续胜出,我们生物的大脑仍然具有一个方面的优势——能量效率。人类大脑的耗能在对战过程中肯定还是要低得多。

一般来说,人类大脑的耗能大概是20-30W。当然,下棋时大脑全功率运转,这个数字还可能往上升。不过AlphaGo的耗能呢?根据计算,“alphago分布式版本(1202个CPU,176个GPU,打败樊麾的那个)所有计算元件耗能应该超过200000W,总耗能没准会翻倍。”

计算耗能差不多是人类大脑的一万倍。

当然,围棋软件使用了远超过人类大脑耗能的硬件,这本身会是潜在的不公平。也许在算法不断提高的未来,相同的耗能下的计算量会大大增加,不过从某种意义上来说,这也体现了人类智能和人工智能的不同。

人类的知识进步本来就是拉马克式遗传或者叫获得性遗传,这源于人类的长寿命和世代重叠,后来各种信息介质的发明不断强化了这一点。由于DeepMind目前还做不到这一点,因此至少目前AlphaGo仍然可以被视为人类知识积累在计算机硬件辅助下的一种“延伸”,而不是一种简单的并行或竞争关系。(编辑:Jerrusalem)

参考文献

  1. Tero A, et al. 2010. Rules for Biologically Inspired Adaptive Network Design. Science 327: 439-442.
  2. Dorigo M. 1992. Optimization, Learning and Natural Algorithms, PhD thesis, Politecnico di Milano, Italy.
  3. Grove M, et al. 2012. Orbital dynamics, environmental heterogeneity, and the evolution of the human brain. Intelligence 40: 404-418.
The End

发布于2016-03-14, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

举报这篇文章

谢强

南开大学动物生物学和发育生物学研究员

pic