作者:Adi Livnat, Christos PapadimitriougydF4y2Ba ACM通信,2016年11月,第59卷第11期,84-93页gydF4y2Ba 10.1145 / 2934662gydF4y2Ba评论(3)gydF4y2Ba
信贷:阿明StaudtgydF4y2Ba
看看你的周围,你会被进化的成果所震惊。诺贝尔奖得主雅克·莫诺德认为,关于进化论的一个奇怪的现象是,所有受过教育的人都认为他们对进化论相当了解,然而很少有人(如果有的话)真正了解。理解进化论是必要的:“生物学中没有任何东西是有意义的,除非在进化论的光下,”著名的20gydF4y2BathgydF4y2Ba 世纪生物学家狄奥多西·多布赞斯基进化论比黑洞和其他科学之谜更接近我们的家——它感觉就像你的家族史。gydF4y2Ba
回到顶部gydF4y2Ba
关键的见解gydF4y2Ba
与大多数科学领域相比,进化论有一个尖锐的开端:查尔斯·达尔文的著作的出版gydF4y2Ba物种起源gydF4y2Ba 在1859年。gydF4y2Ba8gydF4y2Ba 当然,事情没有那么简单:在19的前半部分gydF4y2BathgydF4y2Ba 几个科学家相信我们周围生命的多样性一定是进化的结果(参见查尔斯·巴贝奇的侧栏和附图)。达尔文的巨大贡献体现在三方面:他认定自然选择是进化的引擎;他提出了共同血统假说,指出不同的物种来自共同的祖先,并进一步暗示所有的生命都来自共同的起源;以及他的理论所拥有的无与伦比的论证力量。当然gydF4y2Ba原点gydF4y2Ba 达尔文对遗传学一无所知,也不知道性别在进化中的作用,这是他的几个重要空白。例如,关于性的最终原因,他写道,“整个主题仍然隐藏在黑暗中。”gydF4y2Ba
数学很早就为这一理论提供了依据。孟德尔通过观察表现出不同特征的兄弟豌豆植株的比例和建立模型的数学模式,发现了遗传学。当他的定律在40年后被重新发现时,它们离散的性质被误解为与达尔文对特征的连续感知相冲突。一场深刻的科学危机肆虐了20年,最终在数学的帮助下得到了解决:离散等位基因(参见术语表)可以通过累积贡献产生连续的表型性状。在20世纪20年代和接下来的20年里,R.A.费雪、J.B.S.霍尔丹和S.赖特开发了数学方程,用来预测一个种群的遗传组成如何在几代人之间发生变化。人口遗传学的数学理论在侧栏“达尔文和孟德尔的和解方程”中有简要介绍。这是所谓的“现代进化综合”的关键gydF4y2BathgydF4y2Ba 因为它提出了一种统一达尔文主义和孟德尔主义的方法。gydF4y2Ba
性不仅本质上是普遍的,而且似乎是生活的中心舞台,是各种各样行为和结构的基础。gydF4y2Ba
在此后的近一个世纪里,进化论研究蓬勃发展成为一门成熟、全面、享有盛誉的科学学科,而在过去的二十年里,它被大量的分子数据所淹没,这是一个巨大的科学金矿,为进化论的信条提供信息,并常常挑战它。然而,尽管现代进化生物学取得了卓越的成就,仍有几个重要的问题超出了我们目前的理解:gydF4y2Ba
性在进化中扮演什么角色?gydF4y2Ba 重组繁殖在生命中几乎无处不在(甚至细菌交换遗传物质),而专性无性繁殖物种似乎是罕见的进化死胡同。然而,专家们对性何以如此有利还没有达成一致意见。gydF4y2Ba
进化优化到底是什么?gydF4y2Ba 随着计算机科学家编码的所有进化启发的优化启发式(我们将在下文中讨论),这个问题在过去几十年里也被生物学家们深思熟虑。gydF4y2Ba
变异的悖论。gydF4y2Ba 由于选择,人类和许多其他物种的遗传变异比理论预测的要高得多;假设变异是中性的也有它的问题。gydF4y2Ba
突变是完全随机的吗?gydF4y2Ba 我们知道它们在基因组中远不是均匀分布的,但它们会是复杂遗传机制的结果吗?gydF4y2Ba
正如我们在本文中所述,计算机科学家和生物学家最近的联合研究,将计算的思想和概念引入生物学,在这些问题上取得了相当出乎意料的进展。在线附录中的其他背景和文献可在ACM数字图书馆(gydF4y2Badl.acm.orggydF4y2Ba )在“资料来源”下。gydF4y2Ba
回到顶部gydF4y2Ba
进化与计算机科学gydF4y2Ba
在过去的70年里,计算机科学家,从冯·诺伊曼开始,gydF4y2Ba37gydF4y2Ba 都被进化论所启发和吸引。在20世纪50年代,从事优化工作的计算机科学家开发出了局部搜索启发式:从一个随机解开始,重复以下步骤:如果这个解的“突变”比当前解更好,就改为该解,直到发现局部最优解。所谓“突变”(更常见的是使用“邻居”一词),我们指的是在非常少量的特征上不同于当前的解决方案;例如,在旅行推销员问题中,一个突变可以改变旅行的两个或三个边缘,形成一个新的旅行。这个过程从随机开始重复多次,这个策略可以被看作是维持种群的顺序方式(参见Papadimitriou和Steiglitz)gydF4y2Ba32gydF4y2Ba 一项关于20世纪80年代的调查)。gydF4y2Ba
这个局部搜索的基本思想在20世纪80年代被一个热力学隐喻强化了,gydF4y2Ba20.gydF4y2Ba 帮助算法逃避局部最优和障碍:gydF4y2Ba模拟退火gydF4y2Ba 这种局部搜索的变体被称为“局部搜索”,它甚至允许采用一种不利的突变,尽管其概率会随着不利和时间的推移而降低。另一种变体叫做gydF4y2Ba与赢家同行gydF4y2Ba 1gydF4y2Ba 更接近进化,因为它保持了一个解决方案的种群,将停留在局部最优的个体传送到更有希望的点。请注意,所有这些启发式都是受到无性进化的启发(解决方案之间不会发生重组);这种类型的启发式已经在许多实践领域中得到了成功的应用,并且有几个实践中非常重要的难题,例如图划分,在这方面这种启发式可以与最著名的启发式相竞争。gydF4y2Ba
在20世纪70年代,约翰·霍兰德(John Holland)提出了另一类启发式算法,称为遗传算法:gydF4y2Ba14gydF4y2Ba 解决方案的种群通过突变进化gydF4y2Ba而且gydF4y2Ba 重组。重组在优化问题上应用起来要困难得多,因为它预先假定了一个遗传密码,将问题的特征映射到可重组的基因上(要了解困难,可以想想旅行推销员问题:旅行团可以突变,但它们不能重组)。群体中每个个体解决方案的进化适应度(即它将拥有的孩子数量)与潜在问题中被最大化的数量成正比。在许多代之后,人口中可能会包含一些优秀的解决方案。霍兰德的想法立即引起了人们的注意,并吸引了大批追随者,到目前为止,关于这一主题已有大量的参考书目(参见米切尔的著作)gydF4y2Ba28gydF4y2Ba 和戈德堡gydF4y2Ba12gydF4y2Ba ).条款gydF4y2Ba进化算法gydF4y2Ba 而且gydF4y2Ba进化计算gydF4y2Ba 通常被用作“遗传算法”的大致同义词,但它们通常描述更一般的概念,例如非常有趣的算法工作,也被归类为人工生命的研究,其目的不是为实际优化问题找到好的解决方案,而是通过揭露硅的新奇、复杂的进化现象来理解自然界的进化,参见Jong。gydF4y2Ba16gydF4y2Ba
回到遗传算法,文献中已经报道了一些解决实际优化问题的成功案例,但普遍的印象似乎是,遗传算法在实践中远不如局部搜索和模拟退火成功。如果这是真的,那就相当了不起了——一个巨大的科学奥秘,因为在自然界中,完全相反的情况发生了:重组是成功的和普遍存在的,而专门的无性繁殖是极其罕见和挣扎的。gydF4y2Ba
作者们从2006年开始合作对进化进行计算理解,正是为了调查这个谜团,我们在本文中叙述了我们的发现。就在同一年,莱斯利·Valiant第一次写了他的进化理论,这是另一次试图用计算术语理解进化的尝试。gydF4y2Ba36gydF4y2Ba Valiant把进化看作是一个理想适应度函数的近似值,它是在多项式多个世代中由多项式大的基因型种群所形成的gydF4y2Ba35gydF4y2Ba 通过突变学习。值得注意的是,在他的理论中没有重组(性),尽管它可以被添加到一个适度的优势。gydF4y2Ba17gydF4y2Ba 在这个意义上,函数的几种自然类别是可进化的;实际上,函数易受一种有限的弱形式的学习称为gydF4y2Ba统计学习gydF4y2Ba .gydF4y2Ba18gydF4y2Ba 在“基因之间的游戏”一节中,我们讨论了机器学习算法和进化之间另一个有趣的联系。gydF4y2Ba
回到顶部gydF4y2Ba
性的角色gydF4y2Ba
性在生命中几乎是普遍存在的:在动物和植物中通过精子和卵子的结合发生,在真菌中通过菌丝的融合发生,甚至在细菌中也发生:gydF4y2Ba34gydF4y2Ba 例如,两个细菌细胞可以配对,并在它们之间建立一个桥梁,通过这个桥梁基因可以被转移。许多物种在某些时候进行无性繁殖或自交,但在其他时候也进行有性繁殖,保持它们的基因型洗牌良好。相比之下,不以任何形式或方式交换基因的物种,被称为“专属无性动物”,是极其罕见的,它们栖息在生命之树的稀疏、最近的小枝上,来自失去了性行为的有性祖先物种,并在没有产生子种的情况下走向最终灭绝。gydF4y2Ba22gydF4y2Ba
性不仅本质上是普遍的,而且似乎是生命的中心舞台,是各种各样奇妙行为和结构的基础:从细菌结合到减数分裂(细胞分裂产生配子)的激烈分子机制,从花的颜色到鸟的求偶舞蹈,从雄鹿打架一直到人类激情的戏剧,生命的大部分似乎都围绕着性。所以为什么?性在进化中可能扮演什么角色?gydF4y2Ba
一个常见的答案是,性别产生了大量的基因多样性,因此它一定有助于进化。但是,就像性行为将基因组合组合在一起一样,它也会将它们分解:下一代将缺少高度成功的基因型,因为孩子的一半基因来自父母双方。要说性的作用是创造特殊的、高度有利的基因组合,就好比看一个男人钓到鱼后把鱼扔回海里,然后得出结论说他想给家人的餐桌带来食物。(顺便说一句,遗传算法的设计者们很清楚性的这个缺点,他们通常会把最成功的个体传给下一代,这一策略被称为“精英主义”,然而这是自然界不容易模仿的。)gydF4y2Ba
进化理论家花了大约一个世纪的时间来寻找性别在进化中的作用的其他解释,但所有的20个gydF4y2BathgydF4y2Ba 世纪的解释只有在特定的条件下才有效,这与自然界中普遍存在的性相矛盾。gydF4y2Ba9gydF4y2Ba ,gydF4y2Ba一个gydF4y2Ba
这不是一个小问题。想象一下,例如,即使大部分陆地世界是绿色的,我们也不知道树叶为什么会存在。这在我们对自然的理解上是一个相当大的差距。不知道性的作用是一个更大的差距,因为交换基因的生命形式远远多于光合作用。难怪性在进化生物学中被称为“问题女王”。gydF4y2Ba6gydF4y2Ba
由于性别会破坏基因组合,进化中主要认为有效的选择作用于个体的等位基因,gydF4y2Ba38gydF4y2Ba 也就是说,每个(非中性的)等位基因本身要么是有益的,要么是有害的。根据这一思路,有两种主要的力量驱动着等位基因的频率:作为独立角色作用于等位基因的选择(等位基因通常被认为是对适应度的附加贡献)和随机遗传漂变(如前所述,对等位基因频率的随机抽样效应)。等位基因之间的相互作用,位点内部和位点之间的相互作用,尽管它从一开始就引起了种群遗传学的兴趣gydF4y2Ba10gydF4y2Ba ,gydF4y2Ba39gydF4y2Ba 在“上位性”一词下起了次要作用,常常被当作是对上述问题的一个简单更正。几年前,在与生物学家Marcus Feldman、Jonathan Dushoff和计算机科学家Nicholas Pippenger合作时,我们提出了一个问题,等位基因之间的相互作用是否对以一种尚未探索的方式理解性的作用至关重要。gydF4y2Ba23gydF4y2Ba ,gydF4y2Ba24gydF4y2Ba ,gydF4y2Ba25gydF4y2Ba ,gydF4y2Ba26gydF4y2Ba 基于用来描述基因型频率如何随世代变化的标准方程(参见达尔文和孟德尔侧栏),我们证明了两性和无性之间的一个重要区别:在无性进化中,等位基因的最佳组合总是占上风。然而,在性别存在的情况下,自然选择倾向于“混合”等位基因,这些等位基因即使可能不参与任何真正伟大的基因组合,也能在各种不同的组合中充分发挥作用。gydF4y2Ba23日gydF4y2Ba 换句话说,在侧边栏中假设的3乘3适应度情景中,无性进化的获胜者将是适应度矩阵中最大的条目(在本例中为1.05)。相比之下,粗略地说,性进化会倾向于那些平均值较大的等位基因(行和列);这里的“平均”考虑到了这些基因型在人群中的流行程度,正如我们将探讨的那样。gydF4y2BabgydF4y2Ba
回到顶部gydF4y2Ba
性别是一个随机算法gydF4y2Ba
在过去几十年里,算法研究中最核心和最引人注目的主题之一是随机化的惊人力量。gydF4y2Ba29gydF4y2Ba 矛盾的是,唤起机会通常是解决计算问题最安全、最有目的和最有效的方法。首先,它有助于避免最坏的情况,如快速排序。第二,从分布中抽样gydF4y2BaDgydF4y2Ba 帮助在相互竞争的假设之间做出决定gydF4y2BaDgydF4y2Ba :用于软件测试的随机算法,以及用于测试素数或多项式恒等式的有效性的随机算法是这样的。gydF4y2Ba
性别下的进化可以看作是后一种随机算法的实例。假设我们想设计一个假设的进化实验,以确定在所有基因组合中,某一特定基因的新等位基因是否比其替代等位基因表现得更好。如果种群是无性繁殖的,可以通过在一个个体的基因组中插入这种突变,然后测量由此建立的谱系,看它是否繁殖。这种抽样是非常低效的,因为我们从一个小的样本池(刚好在群体中可用的基因型)中取样,并且必须在许多个体中重复多次插入。但如果种群是有性的,那么在log之后插入一次突变gydF4y2BangydF4y2Ba 一代又一代,gydF4y2BangydF4y2Ba 是与这种特殊等位基因相互作用的基因数量,gydF4y2Ba33gydF4y2Ba 我们将从所有的样本中取样gydF4y2Ba可能的gydF4y2Ba 原则上可以构建的基因组合。性使进化能够从基因组合的整个空间中快速取样,在它们出现在种群中的分布情况下。更重要的是,性别下的进化不仅决定了相互竞争的假设(哪个等位基因表现更好),而且还决定了gydF4y2Ba实现了gydF4y2Ba 这个决定(最终,并且极有可能,它将决定谁是赢家)。gydF4y2Ba
最后,用计算机科学家所熟悉的术语和概念来解释性生活在生活中无处不在的另一个观点,请查看红蓝树定理侧栏。gydF4y2Ba
回到顶部gydF4y2Ba
基因之间的博弈gydF4y2Ba
在种群遗传学中寻找由自然选择优化的数量的研究由来已久。费雪想要一种进化理论,它的数学定律和热力学第二定律一样简洁而核心,gydF4y2Ba10gydF4y2Ba 而赖特指出,二倍体位点上等位基因的频率会朝着增加种群平均适应度的方向变化。gydF4y2Ba40gydF4y2Ba 后来,研究人员再次尝试寻找可以描述进化的李亚普诺夫函数,尽管收效甚微。gydF4y2Ba
我们对涉及混合性的分析最大化原则的研究以一个令人惊讶的结果结束:我们没有回答“进化优化是什么?”这个问题,但是,也许更有趣的是,我们确定了每个基因在性别进化过程中似乎优化的数量。与埃里克·查斯坦和乌梅什·瓦齐拉尼一起,gydF4y2Ba7gydF4y2Ba 我们关注的是达尔文·孟德尔侧栏中描述的标准方程,在一个被称为gydF4y2Ba弱的选择gydF4y2Ba .gydF4y2Ba30.gydF4y2Ba 弱选择是普遍认为基因型之间的适应度差异很小的假设。基因型的适合度gydF4y2BaggydF4y2Ba 在这个体系中gydF4y2BaFgydF4y2BaggydF4y2Ba = 1 +gydF4y2Ba年代gydF4y2Ba ggydF4y2Ba ,在那里gydF4y2Ba年代gydF4y2Ba 很小,gydF4y2BaggydF4y2Ba 是gydF4y2Ba微分健身gydF4y2Ba 基因型,范围为[1,1]。gydF4y2Ba
利用弱选择假设,经过一些代数操作后,我们注意到性别下的种群进化方程在数学上相当于一个新的过程,这需要一种完全不同的方式来看待进化:gydF4y2Ba
这一过程是有机体基因之间的博弈。回想一下,游戏是几个玩家之间互动的数学模型,每个玩家都有一组可用的行动或纯策略,还有一个效用函数:玩家在游戏中试图最大化的目标,从每个玩家的行动选择到一个实数的映射。这里的博弈是重复的,也就是说,相同的博弈被反复进行了很多轮,每轮对应的是一代人的人口。gydF4y2Ba
每个基因/玩家的可用动作与基因的等位基因相对应。gydF4y2Ba
在每一代中,每个基因都选择并执行一种混合策略:它的行为是随机的,也就是说,它的等位基因。在这种混合策略中,分配给每个等位基因的概率对应于该等位基因在这一代群体中的频率。gydF4y2Ba
博弈论的复杂性主要是由于玩家目标之间的冲突。但在基因参与的游戏中,没有冲突——这不是道金斯自私的基因比喻:所有玩家都有相同的效用函数,这是由玩家的选择导致的基因型的适应度。相同效用的博弈在博弈论中称为协调博弈,是最简单的一种。只有在玩家认知能力较弱或不能有效沟通的情况下,他们才会感兴趣。gydF4y2Ba
在重复博弈中,玩家必须根据前几轮的结果,在下一轮更新自己的混合策略。这里有一个最大的惊喜:在这个游戏中,基因使用的更新规则与一个古老的学习算法相同,计算机科学家熟知它的强大能力,在许多困难的问题和环境中出奇地好gydF4y2Ba增加的重量gydF4y2Ba 更新算法(MWU),gydF4y2Ba2gydF4y2Ba 在机器学习中也被称为“无悔学习”或“对冲”(参见在线附录中的“专家问题”框)。MWU改变频率gydF4y2BaxgydF4y2Ba我gydF4y2Ba 的gydF4y2Ba我gydF4y2Ba 基因的-th等位基因如下gydF4y2Ba
在哪里gydF4y2Ba米gydF4y2Ba我gydF4y2Ba 的期望差适合度是正的还是负的gydF4y2Ba我gydF4y2Ba -当前基因库中的第一个等位基因。这个量gydF4y2Ba米gydF4y2Ba我gydF4y2Ba 是衡量我们所谓的gydF4y2Ba可混性gydF4y2Ba 等位基因的gydF4y2Ba我gydF4y2Ba 在当前的基因组合中,它与其他基因的等位基因形成合适组合的能力。总而言之,在性进化的每一代中,每个基因通过一个因子来提高其每个等位基因的频率,这个因子随着该等位基因在当前一代中的混合性而增加。自然地,由方程得到的量被适当地归一化,以便加为1。gydF4y2Ba
这是一种全新的看待进化的方式。这是一个富有成效的观点,因为它变得更有趣:让我们回头看看更新后的等式1,再问一个问题:基因对等位基因的新概率的选择,是在优化什么吗?这一次,答案非常清晰:是的,等式1中所示的基因对等位基因频率的选择优化了以下特定于该基因的等位基因频率函数:gydF4y2Ba
在这里gydF4y2Ba米gydF4y2Ba我gydF4y2Ba 表示等位基因的累积相对适合度gydF4y2Ba我gydF4y2Ba 的和gydF4y2Ba米gydF4y2Ba我gydF4y2Ba 在公式1的所有代中gydF4y2BatgydF4y2Ba 1.很容易注意到,这是一个严格凹函数,因此有一个最大值,这个最大值可以通过常规计算检查,正好是等式1中更新的新频率!注意到的第二项是分布的熵gydF4y2BaxgydF4y2Ba 这是一个众所周知的衡量分布多样性的指标。gydF4y2Ba
这里有很多出乎意料和发人深思的地方,但也许最令人惊讶的是,这种对进化的全新解释潜伏了近一个世纪,如此接近这些老生常谈的方程的表面。像MWU这样有效的算法参与性别下的进化也很重要。我们报纸的一篇评论指出了这一点gydF4y2Ba5gydF4y2Ba MWU也存在于无性生殖中。事实上,无性进化可以被简单地认为是MWU帮助大自然选择基因型。然而,我们的观点是,在性进化中,这幅图要复杂得多,有机得多,发生在生命层次的更深处:个体基因相互作用,每个基因使用MWU“管理它在等位基因上的投资”,在由其他基因创造的环境中,当然还有环境。gydF4y2Ba
函数是进化中罕见的显式优化原理。第二项,尤其是它的大常数系数(回想一下选择强度gydF4y2Ba年代gydF4y2Ba 是小的,|gydF4y2Ba米gydF4y2Ba我gydF4y2Ba | 1)认为,对多样性的关注是这一机制的一个重要组成部分,这一评论可能与遗传多样性如何保持的问题有关。但在非多样性术语中有一个神秘之处:适应度系数的累积性质gydF4y2Ba米gydF4y2Ba 这表明,在决定下一代的基因组成方面,任何前一代的表现都和当前一代的表现一样重要。这怎么可能呢?gydF4y2Ba
通过博弈论和机器学习,以及最大化原理,进化和算法之间令人惊讶的联系是最近才出现的,对它们的全面解释还在进行中。gydF4y2Ba
如前所述,我们所讨论的关于性的洞见揭示了遗传算法的奥秘。在启发式和进化论之间存在着不匹配。启发式应该努力创建包含优秀个体的种群。相比之下,性别下的进化似乎擅长于一些明显不同的事情:创造一个“好种群”。所以,难怪遗传算法不是最好的启发式方法。另一方面,这些见解也表明,当寻求解决方案的鲁棒性时,或当真正的目标未知或不确定或容易变化时,遗传算法可能是有价值的。gydF4y2Ba
回到顶部gydF4y2Ba
随机突变吗?gydF4y2Ba
什么是突变?点突变(单个碱基的变化,比如a变成C)只是故事的一部分,因为许多重要的突变都是DNA小片段和大条带的重排:复制、删除、插入、倒置等等。gydF4y2Ba13gydF4y2Ba 长期以来,人们一直认为突变是辐射损伤或复制错误等意外事故的结果。但到目前为止,我们有大量的证据指向导致和影响突变的相关生物机制。gydF4y2Ba22gydF4y2Ba
例如,我们知道基因组的一个区域与另一个区域发生突变的几率是不同的,并且会受到本地和远端DNA的影响。gydF4y2Ba22gydF4y2Ba 人类近四分之一的点突变都发生在C碱基上,这个碱基在C碱基经过化学修饰后的G碱基之前。gydF4y2Ba甲基化gydF4y2Ba );gydF4y2Ba11gydF4y2Ba 甲基化被认为是复杂的酶促过程的结果。关于重排突变,有强大的诱变剂(gydF4y2Ba创建突变gydF4y2Ba ),例如转座元件:DNA序列容易从基因组的一个位置“跳跃”到另一个位置,并携带其他DNA序列。gydF4y2Ba13gydF4y2Ba 哺乳动物怀孕的关键步骤(gydF4y2BadecidualizationgydF4y2Ba )是大约1500个基因大规模进化重组的结果,部分是由转座因子介导的。gydF4y2Ba27gydF4y2Ba 此外,参与重排突变的基因序列很可能是功能相关的,因为它们可能在3D空间中彼此接近,并具有序列相似性,这两者都允许通过基于重组的突变机制相互作用(参见LivnatgydF4y2Ba22gydF4y2Ba 和引用)。事实上,影响性别重组的机制也涉及到突变,并且实际上产生不同类型的重排突变,这取决于存在的基因序列。gydF4y2Ba13gydF4y2Ba 最后,不同的人群会经历不同种类的突变,从而产生相同的有利效果,比如疟疾抗性,这表明人群之间的基因差异导致了突变起源的差异。gydF4y2Ba22gydF4y2Ba
在启发式和进化论之间存在着不匹配。启发式应该努力创建包含优秀个体的种群。性别下的进化似乎擅长于一些明显不同的事情:创造一个“好的种群”。gydF4y2Ba
由于拉马克的遗产,突变可能不是偶然的这一观点仍然受到怀疑。拉马克在1800年左右相信,有机体可以通过与环境的相互作用,感知进化改进所需的东西,并能够做出正确的遗传变化。从现代生物学的角度来看,这似乎是不可能的——对计算机科学家来说,这听起来就像反转单向函数或哈希函数——意外突变的概念流行起来。但在科学领域,人们不能想当然地认为,唯一相关的选择是那些熟悉的、盒子里的选择。突变是随机的,但把它们看作随机的可能会更有成效,就像随机算法的输出是随机的一样。事实上,突变是一种生物过程,因此它们必然受到基因之间相互作用的影响。这个关于遗传的新概念是令人兴奋的,因为它创造了一个进化的形象,甚至更明确的算法。这也意味着,一个有机体中的基因相互作用会给该有机体的后代留下遗传影响。gydF4y2Ba22gydF4y2Ba 由性创造的幸运基因组合注定从地球表面消失(我们前面比喻中的渔夫把鱼扔了)已经不再重要:它可能已经通过诱变性对种群产生了持久的影响。最后,影响突变的生物机制可能自身进化。gydF4y2Ba
回到顶部gydF4y2Ba
论变异的保存gydF4y2Ba
如果有一个想法渗透到所有关于进化的计算思考的各个方面,就像在过去的章节中解释的那样,那就是:基因之间的相互作用对理解进化至关重要。基因间的相互作用也出现在我们最近的研究中:一个物种内的变异是如何保存的?gydF4y2Ba
经典数据表明,对于种类繁多的植物和动物来说,蛋白质编码位点的多态性(即在一个群体中超过1%的个体中存在多于一种蛋白质变体)和这种位点在个体中杂合的比例分别平均约为30%和7%。gydF4y2Ba31gydF4y2Ba 这个数字远远超出了传统选择理论所能解释的范围。gydF4y2Ba21gydF4y2Ba 遗传变异是由突变产生的,根据群体遗传学的方程,它会因固定而减少,一个等位基因的最终胜利和同一基因的所有其他等位基因的灭绝。在许多关于这个主题的论述中,选择被假设为作用于个体基因,因此适应度是附加的。方程告诉我们,固定会在之后发生gydF4y2Ba 最适合的等位基因和第二适合的等位基因之间的相对适合度的差异在哪里。固定看起来相当快。gydF4y2Ba
2014年春,西蒙斯研究所邀请了60名生物学家和计算机科学家来到伯克利,交流关于进化的观点。正是在那段时间里,Costis Daskalakis和Albert Wu共同探讨了如果考虑到基因间的相互作用,我们对固定速度的理解会受到怎样的影响。我们通过几十年前关于局部搜索复杂性的工作来探讨这个主题;gydF4y2Ba15gydF4y2Ba 该理论考察了局部搜索过程达到局部最优的难度,在许多情况下,结论是:“相当困难”。通过将这一观点应用到相互作用基因的选择中,我们证明了存在gydF4y2BangydF4y2Ba -基因系统,其中适应度是某些等位基因对贡献的总和,也就是说,超越对单个等位基因选择的下一步,对单个等位基因的固定需要成比例的2代gydF4y2BangydF4y2Ba 发生。在普遍接受的复杂性假设下,也可以获得更强的结果,即局部搜索通常是难以处理的(见Johnson等。gydF4y2Ba15gydF4y2Ba 详情)。这意味着,如果考虑到基因的相互作用,固定可能会gydF4y2Ba多gydF4y2Ba 比单个基因的选择机制要长。gydF4y2Ba
这种见解能解释变异的奥秘吗?还没有,因为到目前为止,除了突变和选择,我们的分析忽略了进化中作用于变异的另外两种强大力量:种群的有限性和杂合性(携带同一基因的两个不同等位基因的二倍体有机体)。gydF4y2Ba
首先,有限性。因为携带相关等位基因的个体数量是有限的gydF4y2BaNgydF4y2Ba ,每一代携带每种等位基因的个体数量在[0]的范围内以一种随机游走的方式进化,gydF4y2BaNgydF4y2Ba ,忽略了选择,这导致了之后的固定性gydF4y2BaOgydF4y2Ba (gydF4y2BaNgydF4y2Ba 一代又一代。gydF4y2Ba19gydF4y2Ba 第二,二倍体引入了超显性的可能性,在这种情况下,拥有一个基因的两个不同等位基因的生物比拥有一个等位基因的两个副本或另一个等位基因的两个副本的生物更适合。在显性情况下,选择方程指向稳定的变异,两个等位基因在群体中享有稳定的高频率。gydF4y2Ba
有限种群效应、杂合性效应和选择效应对跨位点等位基因组合的影响是如何相互作用的,这是进一步研究的重要课题。gydF4y2Ba
回到顶部gydF4y2Ba
后记gydF4y2Ba
计算机科学家对进化取得如此巨大成就的聪明方式感到惊叹:系统具有显著的资源效率、可靠性和生存能力、对外生环境的适应性,更不用说对通信、合作、视觉、运动和推理等难题的独创性和原始解决方案了。人们不禁要问:gydF4y2Ba什么算法能在10分钟内完成所有这些gydF4y2Ba12gydF4y2Ba 步骤?gydF4y2Ba 在10号gydF4y2Ba12gydF4y2Ba 之所以会出现一万亿,是因为人们认为这是自生命诞生以来的世代数3.5·10gydF4y2Ba9gydF4y2Ba 多年前(请注意,我们的大多数祖先最多只能活一天)。这并不是一个巨大的数字:手机处理器在一小时内要执行更多的步骤。gydF4y2Ba
在过去的十年里,计算机科学家和进化生物学家共同努力,对围绕进化的核心开放问题提出了新的见解,其中令人惊讶的是,从计算的角度看待进化,提出了一个关于“算法”问题的答案。当然,在这个过程中,更多的问题也被提出,引起了类似的调查。gydF4y2Ba
回到顶部gydF4y2Ba
参考文献gydF4y2Ba
1.D.奥多斯和瓦齐拉尼,美国。“跟着赢家的算法走。在gydF4y2Ba35届会议记录gydF4y2BathgydF4y2Ba 计算机科学基础年度IEEE研讨会gydF4y2Ba (1994)。492501.gydF4y2Ba
2.Arora, S., Hazan, E.和Kale, S.乘权更新方法:元算法及其应用。gydF4y2Ba计算理论8gydF4y2Ba , 1(2012), 121164。gydF4y2Ba
3.阿特丽娅,k,内,P。gydF4y2Ba分支流程gydF4y2Ba .施普林格,1972年。gydF4y2Ba
4.巴贝奇C。gydF4y2Ba布里奇沃特论文第九篇gydF4y2Ba .2gydF4y2BandgydF4y2Ba 经济日报。约翰·默里,伦敦,1838年。gydF4y2Ba
5.巴顿,n.h.,诺瓦克,S.和Paixão, T.进化和计算机科学中的多种选择形式。在gydF4y2Ba美国国家科学院院刊gydF4y2Ba , 29(2014), 1039810399。gydF4y2Ba
6.贝尔,G。gydF4y2Ba自然的杰作:性的进化和遗传学gydF4y2Ba .加州大学伯克利分校,加州,1982年。gydF4y2Ba
7.查斯坦,E.,利夫纳特,A.,帕帕迪米特里欧,C.和瓦齐拉尼,U.算法,游戏和进化。在gydF4y2Ba美国国家科学院院刊gydF4y2Ba , 29(2014), 1062010623。gydF4y2Ba
8.达尔文,C。gydF4y2Ba论物种的起源是通过自然选择的手段,或在生存斗争中保留有利的种族gydF4y2Ba .穆雷,伦敦,1859年。gydF4y2Ba
9.费尔德曼,M.W. Otto, P. Christiansen, F.B.群体遗传学视角下的重组进化。gydF4y2Ba遗传学年度评论gydF4y2Ba (1997), 261295。gydF4y2Ba
10.费舍尔,R.A.gydF4y2Ba自然选择的遗传理论gydF4y2Ba .英国牛津克拉伦登出版社,1930年。gydF4y2Ba
11.k·j·弗里克塞尔和w·j·莫恩。人类基因组中的CpG突变率高度依赖于局部GC含量。gydF4y2Ba分子生物学与进化gydF4y2Ba (2005), 650658。gydF4y2Ba
12.戈德堡,D。gydF4y2Ba遗传算法在搜索、优化和机器学习中的应用gydF4y2Ba .Addison-Wesley, Reading, MA, 1989。gydF4y2Ba
13.格罗尔,d和李,w - h。gydF4y2Ba分子进化基础gydF4y2Ba .Sinauer Associates,桑德兰,马萨诸塞州,2000年。gydF4y2Ba
14.荷兰,J.H.gydF4y2Ba自然和人工系统的适应性:生物学、控制和人工智能应用的导论分析gydF4y2Ba .密歇根出版社,1975年。gydF4y2Ba
15.Johnson, d.s., Papadimitriou, c.h.和Yannakakis, M.局部搜索有多容易?gydF4y2BaJ.计算机与系统科学gydF4y2Ba , 1(1988), 79100。gydF4y2Ba
16.郑大世,K.A.D.gydF4y2Ba进化计算:一种统一的方法gydF4y2Ba .麻省理工学院出版社,剑桥,2006。gydF4y2Ba
17.五、进化与重组。在gydF4y2Ba52人会议记录gydF4y2BandgydF4y2Ba 计算机科学基础年度IEEE研讨会gydF4y2Ba ,(2011), 837846。gydF4y2Ba
18.从统计查询中有效的抗噪学习。gydF4y2Baj . ACM 45gydF4y2Ba , 6(1998), 9831006。gydF4y2Ba
19.木村,M.和Ohta, T.在一个有限的种群中,突变基因固定之前的平均世代数。gydF4y2Ba61年基因gydF4y2Ba 3(1969), 763。gydF4y2Ba
20.Kirkpatrick, S., Gelatt, Jr ., C.D.和Vecchi, M.P.模拟退火优化。gydF4y2Ba科学220gydF4y2Ba (1983), 671680。gydF4y2Ba
21.自然居群基因杂合性研究的分子方法自然居群的变异量和杂合度gydF4y2Ba果蝇pseudoobscura。基因54gydF4y2Ba (1966), 595609。gydF4y2Ba
22.互动进化:自然选择和非随机突变如何共同作用。gydF4y2Ba生物学直接8gydF4y2Ba , 1(2013), 24。gydF4y2Ba
23.利夫纳特,费尔德曼,M.W,帕帕迪米特里欧,C.和皮蓬格,N.有性物种在多样化率上的优势。未出版的手稿。gydF4y2Ba
24.利夫纳特,帕帕迪米特里欧,杜瑟夫,J.和费尔德曼,M.W.性别在进化中作用的混合理论。在gydF4y2Ba美国国家科学院院刊gydF4y2Ba , 50(2008), 1980319808。gydF4y2Ba
25.利夫纳特,帕帕迪米特里欧,C.和费尔德曼,M.W.适应度最大化和混合性选择之间的分析对比。gydF4y2BaJ.理论生物学273gydF4y2Ba , 1(2011), 232234。gydF4y2Ba
26.利夫纳特,帕帕迪米特里欧,皮蓬格,N.和费尔德曼,M.W.性,混合性和模块化。在gydF4y2Ba美国国家科学院院刊gydF4y2Ba , 4(2010), 14521457。gydF4y2Ba
27.Lynch, v.j., Leclerc, r.d., May, G.和Wagner, G.P.转座子介导的基因调节网络的重新布线促进了哺乳动物妊娠的进化。gydF4y2Ba自然遗传学43gydF4y2Ba (2011), 11541159。gydF4y2Ba
28.米切尔,M。gydF4y2Ba遗传算法导论gydF4y2Ba .麻省理工学院出版社,剑桥,马萨诸塞州,1996年。gydF4y2Ba
29.莫特瓦尼,r和拉加万,P。gydF4y2Ba随机算法gydF4y2Ba .剑桥大学出版社,1995年。gydF4y2Ba
30.王晓明,王晓明,王晓明。弱上位性或弱选择下多位点系统的收敛性。gydF4y2BaJ.数学生物学38gydF4y2Ba , 2(1999), 103133。gydF4y2Ba
31.Nevo, E., Beiles, A.和Ben-Shlomo, R.遗传多样性的进化意义:生态、人口和生活史相关。gydF4y2Ba生物数学课堂讲稿gydF4y2Ba (1984), 13213。gydF4y2Ba
32.C.帕帕迪米特里欧和K.施泰格利茨。gydF4y2Ba组合优化:算法与复杂性gydF4y2Ba .多佛,1998年。gydF4y2Ba
33.拉巴尼,Y.拉比诺维奇,Y.辛克莱,A.人口遗传学的计算观点。在gydF4y2Ba27国会议记录gydF4y2BathgydF4y2Ba ACM计算理论年度研讨会gydF4y2Ba ,(1995), 8392。gydF4y2Ba
34.南卡罗来纳州斯特恩斯和R.F.胡克斯特拉gydF4y2Ba进化:介绍gydF4y2Ba .牛津大学出版社,纽约,2005。gydF4y2Ba
35.勇敢的,L。gydF4y2Ba大概是正确的:在复杂世界中学习和繁荣的自然算法gydF4y2Ba .基本的书,2013年。gydF4y2Ba
36.勇敢的,低速齿轮可发展性。gydF4y2Baj . ACM 56gydF4y2Ba , 1(2009), 3。gydF4y2Ba
37.冯·诺伊曼,A.W.伯克斯。自我复制自动机理论。gydF4y2Ba神经网络汇刊gydF4y2Ba , 1(1966), 314。gydF4y2Ba
38.威廉姆斯,G.C.gydF4y2Ba适应与自然选择gydF4y2Ba , 8日版。普林斯顿大学出版社,1996。gydF4y2Ba
39.孟德尔种群的进化。gydF4y2Ba遗传学16gydF4y2Ba (1931), 97159。gydF4y2Ba
40.基因频率在群体中的分布。在gydF4y2Ba美国国家科学院学报,23gydF4y2Ba 6(1937), 307320。gydF4y2Ba
回到顶部gydF4y2Ba
作者gydF4y2Ba
Adi LivnatgydF4y2Ba (gydF4y2Baalivnat@univ.haifa.ac.ilgydF4y2Ba )是以色列海法大学进化与环境生物学系、进化研究所高级讲师。gydF4y2Ba
克里斯托PapadimitriougydF4y2Ba (gydF4y2Bachristos@cs.berkeley.edugydF4y2Ba )是加州大学伯克利分校计算机科学系的c·莱斯特·霍根教授。gydF4y2Ba
回到顶部gydF4y2Ba
回到顶部gydF4y2Ba
数据gydF4y2Ba
数字观看作者在此独家讨论他们的工作gydF4y2Ba通信gydF4y2Ba 视频。//www.eqigeno.com/videos/sex-as-an-algorithmgydF4y2Ba
回到顶部gydF4y2Ba
旁注:查尔斯·巴贝奇论进化论gydF4y2Ba
计算机科学之父查尔斯·巴贝奇无疑是第一个从算法的角度思考进化的人。在183722年出版之前gydF4y2Ba物种起源gydF4y2Ba 就在达尔文将生命之树的草图写在笔记本上的同一年(见下图),巴贝奇写了《布里奇沃特论第九篇》。gydF4y2Ba4gydF4y2Ba 这篇论文是一系列关于神的哲学论文中的第九篇,在这些论文中,他广泛地提到了他的差分机,以及如何通过编程连续数天计算难以想象的大整数,而无需程序员的进一步干预。巴贝奇用这幅图来论证仁慈的创造者不一定可以设计物种,而是可以设计一种算法(他没有使用这个词)来创造物种。gydF4y2Ba
查尔斯·巴贝奇(左)和查尔斯·达尔文(右)的肖像。中间是达尔文的草图,展示了共同世系导致分支模式的原理。gydF4y2Ba
回到顶部gydF4y2Ba
栏:术语表gydF4y2Ba
等位基因gydF4y2Ba :基因的变体。其中一些已知会影响我们对疾病的易感性。gydF4y2Ba
二倍性gydF4y2Ba 在一个细胞中,每个染色体和每个基因都有两个实例的状态。每条染色体和基因都有一个实例的生物称为单倍体。gydF4y2Ba
健身gydF4y2Ba 个体在其自然环境中生存和繁殖的能力,表现在其存活后代的预期数量上。gydF4y2Ba
基因gydF4y2Ba 编码功能产物的遗传单位和DNA区域。据认为,人类有超过2万个这样的基因。然而,现在人们知道编码远比原来想象的要复杂得多,如何定义这些单元及其边界就不再清楚了。gydF4y2Ba
基因型gydF4y2Ba 一个人或一群人共有的全部或部分基因组成。gydF4y2Ba
杂合的gydF4y2Ba :具有某一基因的两个不同等位基因的个体。gydF4y2Ba
突变gydF4y2Ba :遗传物质的变化。gydF4y2Ba
表型gydF4y2Ba :除遗传密码外,个体的特征。gydF4y2Ba
复合gydF4y2Ba 在有性生殖中,广义地说,这个术语指的是后代的遗传物质是父母遗传物质的拼凑,这是由于染色体数量减半时染色体的独立组合和染色体的交叉,即在配子产生时发生的两个对应染色体(在人类中,通常是每个染色体2-3个)之间的片段的洗牌。更一般地说,DNA重组,即两个DNA分子之间或同一DNA分子片段之间的遗传物质交换,是突变机制的重要组成部分。gydF4y2Ba
回到顶部gydF4y2Ba
边栏:调和达尔文和孟德尔的方程式gydF4y2Ba
在Fisher展示了一个连续的性状是如何通过将多个离散的孟德尔因子的贡献相加而产生的之后,他、Wright和Haldane建立了经典的种群遗传框架,用于研究基因型种群如何从一代进化到下一代。其中的中心思想是适应性,这是对达尔文进化优势概念的数学表达,是对生物表型的有益总结。形式上,这种基因型的适应度可以被认为是一个具有这种基因型的有机体在预期情况下将拥有的存活后代的数量。为了简单起见,想象一个单倍体生物(每个基因都有一个副本),它的适应性只依赖于两个基因,而这些基因每个都有三个等位基因。这个物种的适应度函数可以用这个3 × 3的表来表示gydF4y2BaWgydF4y2BaijgydF4y2Ba :gydF4y2Ba我gydF4y2Ba = 1;2;3;gydF4y2BajgydF4y2Ba = 1;2;3:gydF4y2Ba
假设在某个时间点,在gydF4y2BatgydF4y2Ba 本种第一代,9个基因型有这些频率,表示gydF4y2BaPgydF4y2Ba tgydF4y2Ba ijgydF4y2Ba :gydF4y2Ba
通过重组(性)进行繁殖;这意味着一个孩子从父母中的任何一方继承了每个等位基因;假设它以相等的概率从两个基因中任意一个独立地继承它(例如,如果两个基因位于不同的染色体上,这是成立的)。然后下一代的基因型频率,gydF4y2Ba ,到小数点后第4位,将如下表所示:gydF4y2Ba
而第10代和第100代的频率将如下:gydF4y2Ba
这个公式是从gydF4y2Ba 到gydF4y2Ba 如下:gydF4y2Ba
在哪里gydF4y2Ba 是所有分子的和吗gydF4y2BaijgydF4y2Ba .当然,这个等式是建立在某些关键的假设基础上的:假设几代人不会重叠(就像一代人在死前同时生育一样),假设人口如此之大,以至于可以被认为是无限的,假设交配是完全随机的,没有性别区分,假设期望可以被添加和分割而不受惩罚。然而,为了简单起见,这些假设已经在进化理论中被广泛和成功地应用了几十年。到目前为止,我们一直假设有性繁殖。如果这个物种是无性繁殖的,那么下一代,10个gydF4y2BathgydF4y2Ba 和100年gydF4y2BathgydF4y2Ba 因此是这样的:gydF4y2Ba
这个等式就简单多了:gydF4y2Ba
与gydF4y2Ba 扮演同样的角色。自然地,许多进化涉及的事件根本不进入这些方程:突变产生新的等位基因,物种形成事件(在生命树中创建一个新的分支,有自己的方程),以及环境的变化。这些方程应该被认为是对一个谜题的数学描述,经过近一个世纪的研究,这些谜题仍在研究中。gydF4y2Ba
回到顶部gydF4y2Ba
边栏:红蓝树定理gydF4y2Ba
基于未发表的研究成果,对进化中无处不在的性进行了完全不同的研究,使用了计算机科学家非常熟悉的概念和图像。gydF4y2Ba
想象一棵树有两种节点:红色和蓝色。树从一个蓝色的根开始,通过一个随机过程生成。在每一步(树的深度),这个深度的节点被替换,如图所示,每个节点独立于其他节点,根据如下所示的概率。gydF4y2Ba
这是生成生命树的一个非常粗糙的模型(这里的概率是指示性的,不应该反映一些生物现实)。红色节点是有性物种,蓝色节点是不同的无性物种(“物种”一词并不完全适用于后者)。尽管我们有理由相信生命的起源gydF4y2Ba性gydF4y2Ba ,gydF4y2Ba22gydF4y2Ba 我们不像今天那样有一个很好的物种划分,我们假设树从一个蓝色节点开始,这对我们目前的目的来说是保守的。根据所选择的参数,性恋者和无性恋者灭绝的概率相等。如果没有发生灭绝,有性物种会多出50%的分支。以很小的可能性,其中一个新物种可能是另一种。gydF4y2Ba
树的叶子(也就是我们周围的生命)会是什么样子?仅仅50步之后,无性恋者和性恋者的预期比例大约是2:1000(顶部中间事件的概率)。gydF4y2Ba
无性结是罕见的!而且,对于一个计算机科学家来说,这是显而易见的:我们知道分支因素(在树中,计算机病毒传播,递归算法,等等)在最终意义上可以使一个情况的所有其他成分相形见绌。有趣的是,这个简单的模型立即解释了性行为分布的主要特征:它预测无性形式是罕见的,在整个生命树中分布稀疏,最近从有性祖先派生出来。经验证据表明,这三点都是正确的。gydF4y2Ba22gydF4y2Ba
确切的相关定理如下gydF4y2Ba23gydF4y2Ba (这是众所周知的分支特性的结果,参见Athreya和NeygydF4y2Ba3.gydF4y2Ba ):gydF4y2Ba
考虑一个生成红蓝树的连续随机过程,其中B BB、B BR、B消光、R RR、R BR和R消光事件的速率分别为:gydF4y2Ba一个gydF4y2Ba ,gydF4y2Ba ,gydF4y2Ba一个gydF4y2Ba ,gydF4y2Ba年代gydF4y2Ba ,gydF4y2Ba 而且gydF4y2Ba年代gydF4y2Ba 让gydF4y2Ba年代gydF4y2Ba =gydF4y2Ba年代gydF4y2Ba 年代gydF4y2Ba =gydF4y2Ba一个gydF4y2Ba =gydF4y2Ba一个gydF4y2Ba ,gydF4y2Ba一个gydF4y2Ba 而且gydF4y2Ba年代gydF4y2Ba >gydF4y2Ba一个gydF4y2Ba .假设> 0和> 0相对于gydF4y2Ba年代gydF4y2Ba 一个gydF4y2Ba .则叶片上无性繁殖物种与有性繁殖物种的渐近比值为/(gydF4y2Ba年代gydF4y2Ba 一个gydF4y2Ba ).gydF4y2Ba
这个论点表明,可以想象的是,性的一个关键优势可能是它在生命之树上的“分支因素”。即使性对物种和生物来说是一种负担(这至少是部分事实),它促进了多样性和对新的进化利基环境的探索,这一事实可能足以让这种奇怪的特征主宰地球。gydF4y2Ba
版权归作者所有。授权ACM出版权利。gydF4y2Ba
数字图书馆是由计算机协会出版的。版权所有©2016 ACM, Inc.gydF4y2Ba
评论gydF4y2Ba
CACM管理员gydF4y2Ba
2017年1月31日11:35gydF4y2Ba
以下信件发表于2017年2月出版的《致编辑的信》(//www.eqigeno.com/magazines/2017/2/212426)。gydF4y2Ba ——CACM管理员gydF4y2Ba
在《作为算法的性:计算透镜下的进化理论》(2016年11月)一书中,Adi Livnat和Christos Papadimitriou雄辩地指出,性进化的非凡成功尚未得到充分解释。有些矛盾的是,他们得出的结论是,性并不是特别适合产生“杰出个体”的任务。他们还表示,遗传算法同样不适合这项任务。gydF4y2Ba
应该注意的是,这种对以重组进化为模型、广泛使用的导数自由优化启发式遗传算法的批评与大量实践成功的经验记录是相反的。这也说明了进化计算理论家长期以来在遗传算法的抽象工作和遗传算法优于局部搜索的一般条件方面缺乏共识。在这些问题上的共识有望为作者最初想要回答的问题提供线索:为什么重组进化会产生具有杰出个体的种群?gydF4y2Ba 生成性低混合能力消除(1)是解决这一问题的最新理论,它假定遗传算法有效地实现了一种抽取启发式,通过迭代消除小集合的“低混合基因座”(等位基因不能很好地混合的基因座)的联合熵,随着时间的推移产生更适合的种群。重组,或混合,允许这样的位点进入固定,即使它保护了非相互作用的位点的边际熵。gydF4y2Ba
退一步来说,人们可能会问,这个理论和Livnat和Papadimitriou提出的理论应该如何评价。在任何可能的情况下,对可靠性的证明总是可取的,但在分析诸如大脑和进化群体等生物系统的计算时,端到端证明是难以捉摸的。相反,我们必须采用科学的方法(2),这种方法有以下原则:gydF4y2Ba
假设==>预测预测==>假设gydF4y2Ba
与物理学等学科的基础不同,计算机科学的基础在逻辑上是可验证的;假设不起作用。因此,虽然计算机科学家已经目睹了大量的工程革命,但他们没有看到像从牛顿宇宙到爱因斯坦宇宙的转变,或从燃烧的燃素理论到拉瓦锡的氧基理论,或托马斯·库恩的《科学革命的结构》中描述的任何其他基本转变。理论物理学家、化学家和生物学家在科学方法的应用方面接受过非正式的(如果不是正式的)培训,他们知道如何评估和处理相互竞争的假设。今天的理论计算机科学家就不能这样说了。对他们来说,科学方法是不熟悉的领域,有着不同的规则和不同的严格概念。例如,假设必须是弱的,假设必须是可测试的。gydF4y2Ba
所有计算机科学作为一个领域必须对自然科学做出贡献,它也有很多东西要学习。gydF4y2Ba
Keki m . BurjorjeegydF4y2Ba 伯克利分校,gydF4y2Ba
----------------------------------------------------gydF4y2Ba
参考文献gydF4y2Ba (1)进化系统中的低混合性消除。在第十三届遗传算法基础会议论文集中(英国阿伯里斯威斯,1720年1月)。ACM出版社,纽约,2015,163175。gydF4y2Ba
(2)波普尔:科学发现的逻辑。劳特利奇,伦敦,英国,2007年。gydF4y2Ba
----------------------------------------------------gydF4y2Ba
虽然Adi Livnat和Christos Papadimitriou的文章(2016年11月)为煽动性的杂志封面提供了理论依据,但文章本身以一个错误的说法开始,忽略了性进化成功的一个更简单的解释。大约38亿年前,在地球上出现生命后不久,进化开始以一种非常务实的方式使生命形式多样化,增加个体生存和繁殖能力的突变被遗传给下一代,而那些不利的突变则被自然丢弃。这个过程很快就发现,有性繁殖比简单的细分更有效,因为它允许发生在不同家族中的有利突变被结合起来,使进化进行得更快,而细分则不允许。于是有性繁殖成为主导。gydF4y2Ba
然而,这篇文章说,“性别在进化中扮演什么角色?”重组繁殖在生命中几乎无处不在(甚至细菌交换遗传物质),而专性无性繁殖物种似乎是罕见的进化死胡同。然而,专家们对性何以如此有利还没有达成一致意见。”gydF4y2Ba
性进化的原因如此明显,怎么可能没有达成一致呢?为了实现性进化,每一代人都必须死亡,有些人认为这是不方便的,促使他们想象来世。另一方面,细分产生了潜在的永生者,他们天生多样性较低,因为他们比性感的物种突变得更少。gydF4y2Ba
莱斯特认真gydF4y2Ba 加利福尼亚州斯坦福大学gydF4y2Ba
附注:我并不反对克里斯托斯·帕帕迪米特里欧,我已经认识他50年了。gydF4y2Ba
----------------------------------------------------gydF4y2Ba
作者的回应gydF4y2Ba
欧内斯特的想法,首先由R.A.费雪(1930)和H.J.穆勒(1932)提出,并没有解决问题,在我们的在线附录中有参考,有兴趣的读者可以开始探索这个迷人的话题。专家之间的争论还在继续,我们最近的文章对此提出了一个新的观点。Burjorjee并没有拿出证据来支持他所声称的遗传算法的经验成功,比如与模拟退火相比。作为科学哲学的命题,他可以参考帕帕迪米特里欧1995年的文章《数据库元理论:问大问题》(http://dl.acm.org/citation.cfm?id=211547),其中有T. Kuhn、K.R. Popper和P. Feyerabend的章节,以及他们与计算机科学的相关性。gydF4y2Ba
Adi LivnatgydF4y2Ba 以色列海法gydF4y2Ba
克里斯托PapadimitriougydF4y2Ba 伯克利分校,gydF4y2Ba
CACM管理员gydF4y2Ba
2017年1月31日11:38gydF4y2Ba
以下公开信发表在2017年2月出版的《致编辑的信》(//www.eqigeno.com/magazines/2017/2/212426)上。gydF4y2Ba ——CACM管理员gydF4y2Ba
我写这封信是为了表达我对2016年11月刊封面上Adi Livnat和Christos Papadimitriou的文章“性作为一种算法:计算镜头下的进化理论”的失望和失望,我认为这篇文章具有攻击性和吸引眼球的方式与ACM的公共使命不一致。gydF4y2Ba
虽然我猜大多数读者要么不在乎,要么觉得封面“有趣”或“可爱”,但我和很多同事谈过,他们把自己的反应描述为“震惊”、“震惊”、“冒犯”和“尴尬”,因此我认为这是一个值得进一步思考的严肃问题。gydF4y2Ba
具体来说,对于ACM这样一个声称要代表和支持其所有成员和计算学科的所有成员的专业组织来说,分发一个有些人不好意思从我们的邮箱中收到、在我们的办公桌或会议桌上展示、或者在有人可能在我们肩膀后面监视时在我们的计算机上查看的问题真的合适吗?gydF4y2Ba
首先,这项研究不是关于性,而是关于有性生殖及其对种群多样性的影响。两者之间有一个主要的区别,以这种方式将两者混为一谈会让人觉得幼稚。我不禁想到了“更衣室谈话”。gydF4y2Ba
其次,把“性”这个巨大的黑体字放在粉红色的封面上,会让人立刻联想到女性。考虑到女性在该领域的代表性不足,这种信息完全是适得其反的,特别是提醒年轻女性,她们可能不太确定自己在该领域是否受欢迎,她们应该与性,而不是科学联系在一起。gydF4y2Ba
第三,这期杂志出版的时间恰逢全国乳腺癌宣传月,这无疑是有意为之,但对于我们这些因乳腺癌而失去亲人的人来说,这张粉红色的封面让人感到不尊重和不敏感。gydF4y2Ba
这似乎没什么大不了的,我敢肯定有些读者认为我过于敏感和缺乏幽默感。但说实话,作为一名女性,在一个极度男性主导的领域工作已经够艰难的了,而且在公众场合展示自己所在专业机构的杂志也不会让人感到尴尬和尴尬。gydF4y2Ba
最后,我没看就把它扔进了回收箱。gydF4y2Ba
玛丽des查顿gydF4y2Ba 马里兰州巴尔的摩gydF4y2Ba
----------------------------------------------------gydF4y2Ba
主编的反应:gydF4y2Ba
这个有问题的封面(我对此负有最终责任)本意是幽默的。由于有几位读者被它冒犯了,现在回想起来,显然这种幽默是被误导了。为此,我真诚地道歉。这个问题设计团队已经讨论过了,我们希望能从这个错误中吸取教训。gydF4y2Ba
摩西·y瓦迪gydF4y2Ba 主编gydF4y2Ba
CACM管理员gydF4y2Ba
2017年3月28日02:08gydF4y2Ba
以下公开信发表在2017年3月出版的《致编辑的信》(//www.eqigeno.com/magazines/2017/3/213824)上。gydF4y2Ba ——CACM管理员gydF4y2Ba
Adi Livnat和Christos Papadimitriou评论文章《性作为一种算法》(2016年11月)很吸引人,但标题错误。它讨论了夫妻关系的好处。乔治·c·威廉姆斯在《性与进化》中把更普遍的概念“夫妻关系”与“性”区分开来,“性”指的是,在地球上所有的夫妻物种中,一个物种中的夫妻株数等于参与夫妻二的个体数。这似乎是一个重要的区别,我认为《通讯》杂志的封面具有误导性。在我自己的书《信天翁》中,我强调了这一点和其他的区别,旨在避免无意义的谈话,就像c·k·奥格登和I.A.·理查兹在《意义的意义》中所说的那样:“the gostak distims the doshes”。gydF4y2Ba
Livnat和Papadimitriou提到的杂合性的非覆盖性很有启发性。我相当怀疑杂合性是性取向的先决条件;当然,很多有性物种在配子世代是单倍体,在其他世代是二倍体。gydF4y2Ba
一些关于共轭二值性的数学可能会很有趣。在其他星球上进化出具有三螺旋结构,三共轭结构和三性结构的生命的可能性有多大?gydF4y2Ba
John a .遗嘱gydF4y2Ba 奥克兰gydF4y2Ba
显示gydF4y2Ba3gydF4y2Ba 评论gydF4y2Ba