Dwarkesh Podcast

David Reich – 为什么青铜时代是人类演化的拐点

David Reich – Why the Bronze Age was an inflection point in human evolution

二〇二六年五月九日收听原版播客

摘要

Harvard ancient DNA 教授 David Reich 介绍其团队 preprint：用约1.6万古代个体、1000万个变异位点和 relatedness 校正模型，分析欧洲与 Middle East 过去1.8万年 natural selection，识别约7200个候选位点，immune、metabolic traits 富集，Bronze Age 后 selection 增强，并讨论 Neanderthal、Denisovan 与 modern humans 的混合模型。

我请回了 David Reich，他是 Harvard 的 ancient DNA 教授。你会怎样描述你研究的内容？

我是 geneticist，研究人类历史，以及人群之间的关系——古代人群彼此之间的关系，还有他们与今天人群之间的关系。

好。我们之前做过一次访谈，应该是 2 年前了，那次后来成了我做过的最受欢迎的访谈之一。我想大家觉得很有吸引力的一点是，人类历史中还有太多我们不知道的东西，而现在借助你们实验室使用的这些技术，我们才刚开始了解。你们有一篇新的 preprint，很有意思，我想和你聊聊。那我们开始吧。你能先给我一点背景，说明今天要谈的是什么吗？

这个领域刚开始的时候，也就是 ancient DNA 领域在 16 或 17 年前起步时，大家的期待是，我们将会学到很多关于 biology 的东西，了解人群的 biology 如何随时间变化。方法是从古代人类遗骸中提取 DNA，并追踪随时间发生的变化。但从这个领域一开始，这个期待其实一直没有真正实现。这个领域在了解人类历史方面非常成功，带来了很多关于人类迁徙的出人意料的发现，比如生活在某地的人并不一定是几百年、几千年或几万年前生活在同一地点的人群的后代；混合在人类历史中很常见；带有 sex bias 的过程在人类历史中也很常见；还有一些考古学原本没有预期到的事情。所以从这个角度看，这个领域很成功。

但不成功的是，我们还没有真正学到 biology 和 biological change。一个很大的原因是样本量太小。因为当你有一个人的 DNA 时，它能提供大量关于历史的信息。这是因为当你观察一个人的 DNA，它并不只是一个人，而是很多人。它包含你的两个父母、四个祖父母、8 个曾祖父母、16 个再上一代祖先，如此往前推。随着时间往前追溯，会有成千上万、数万，甚至数十万的祖先对今天的人产生贡献。所以当你观察单个人的 genome，或者一个 Neanderthal genome 时，实际上你的数据里代表了数以万计的祖先。你可以非常精细地把这个个体放到与其他已有数据人群的关系中去定位。

但如果你关心的是某个特定 genetic variant 的变化，比如它影响你的 skin pigmentation，影响你成年后消化 cow's milk 的能力，或者影响某种 behavioral trait；当你想看它如何随时间变化时，一个人只给你一个样本，或者最多两个样本，一个来自母亲，一个来自父亲。所以要获得这个频率如何随时间变化的高分辨率图景，你需要非常大的样本量，真正大量的人群样本。而直到最近几年，我们才终于有了这样的数量。因此，我想今天我们要谈的这项研究，以及未来几年希望其他一些团队也会做的工作，其动机就在于：我们现在终于有了这些数量，可以用这些数据来观察频率如何随时间变化。

我能问个问题吗？接下来几个小时我会问很多初级问题，不过为什么频率变化特别有意思？

我们感兴趣的是利用自然在我们过去数万年历史中进行的“实验”，来理解我们的 DNA 中哪些东西在 biologically significant。如果一个人群经历了环境变化——比如转向 agriculture，或者开始与 domesticated animals 近距离生活，或者从寒冷地区迁移到温暖地区，从低海拔迁移到高海拔——那么这个人群就会受到压力，需要适应这些新的压力和新的需求。你检测这种适应的方式，就是观察某个 genetic variant 的频率是否发生变化。比如某个 variant 可能让你能在更高海拔生活，或者可能在行为模式上轻微推动你，使你在新环境中更有优势。这个 genetic variant 的频率可能会系统性地朝某个方向变化，而且变化幅度足够大，大到你可以检测出来。

当然，如果没有非常大的样本量，就很难检测到几个百分点或 10% 这样轻微的频率变化。因此，我们要寻找的是那些过于极端、不可能由偶然性解释的频率变化。这样就能告诉我们，由于人群经历了环境变化，他们的 biology 受到了某种选择压力。

有意思。好，那你们发现了什么？

7 年前，Ali Akbari，他是——

当时他是我实验室的一名 postdoctoral scientist，几年后成为我实验室的 permanent staff scientist。他开始利用我们生成的数据，研究生物随时间发生的变化。我认为他之所以对我们实验室感兴趣，而不是其他地方，是因为我们实验室的一个重点，一直是从古代人类样本中生成真正大规模的数据。我们一直在努力把这个流程工业化，让成本变得很低，同时保证高质量，并生成大量样本，为这个目的提供很多好的数据。因此，我们已经生成了大量数据，这使我们可以重新提出这样一个问题：频率是否随时间发生了变化。

过去几十年里，人类进化研究的主流观点是，在人类历史最近几十万年中，natural selection（自然选择）相当平静。人们用几条证据来支持这一点。其中一条是，如果你比较世界不同大陆上的多个人群，比如 Europeans 和 East Asians，并观察这些群体之间频率不同的 mutations（突变）——所有 mutations 的频率都会有一点差异，有时差异很大——你可以问：在 Europeans 和 East Asians 之间，哪些 mutations 的频率差异最大？结果是，几乎没有任何 genetic changes 在 Europeans 和 East Asians 之间达到 100% 的频率差异。

Europeans 和 East Asians 来自 40,000 或 50,000 年前的一个共同 ancestral population，这个人群走出 Africa 和 Middle East。这个人群有一组 gene frequencies，也就是 genetic frequencies，这些 variants 随机波动，这个过程叫 genetic drift（遗传漂变），也可能在某个方向上受到 selection。自 40,000 或 50,000 年前以来经过的时间，在进化尺度上仍然足够短，所以 Europeans 和 East Asians 这两个群体之间平均来说没有太多 genetic differentiation。

不过，如果发生过 natural selection，比如帮助某个地方的人更好地消化 alcohol，或者更好地消化 milk，或者更好地完成其他某种功能，那么你可能会预期某个 mutation 的频率会迅速上升到很高。40,000 或 50,000 年其实是相当长的时间，大概是 1,500 到 2,000 代。因此，这段时间本来很容易足以看到 100% 的频率差异，但实际上你看到的并不比随机情况下预期的更多。

所以这让人觉得 selection 一直很平静。也许在几十万年前，人类 ancestral population 达到了某种 optimum，之后在任何方向上都没有太多 genetic change。可能有少量 natural selection，或者存在 selection 来移除那些不断落到 genome 上的有害 mutations，但不是我们所说的 directional selection。directional selection 指的是新出现的 mutations，或者已有 mutations 被系统性地推向某个方向，帮助人群达到另一个更适应的 set point，也就是更有利于该人群所处环境的状态。

因此，我们能够把在 DNA 中看到的所有 mutations 的频率变化进行分解——我们观察的大约是 10 million 个会发生变异的位置——看其中有多少是由 directional selection adaptation 造成的，又有多少是由其他因素造成的，尤其是 genetic drift。结果是 98% 来自其他因素，尤其是 genetic drift。也就是说，压倒性地，是 migrations 和 population structure 导致了频率波动。因此，要真正检测到 adaptive natural selection 的信号非常困难，因为它们只占总频率变化的一小部分。绝大多数变化来自这些 migrations 和 mixtures。尽管如此，我们的研究认为已经显示，natural selection 的量其实非常大，事实上它在 genome 中相当普遍。

我想在这里问一个澄清性问题。为什么我们要把 population admixture 或 replacement 排除在 selection 之外？因为如果从群体层面考虑，一个人群取代另一个人群，这不就是 selection 吗？我记得上一期里你解释过，某个特定地区的人群构成发生过巨大变化。一个人群进入，基本取代了之前的人群，然后又有一个新的人群进入并取代之前的人群。而只要 genetics 与为什么这个人群取代另一个人群有关，为什么这不应该算入我们所理解的过去 10,000 年中的 selection 呢？

它可以算，也可能算，而且在某些方面也许应该算。但也有可能，这种 population replacement 是由某种 cultural phenomenon 导致的，比如其中一个群体拥有某种 technology，而其他群体没有。也许有 genetic mutations 对此有贡献，谁知道呢？这是可能的。但你看到的是整个 genome 的 shift。所以我们想看的，是 DNA 中是否有某一个位置以不同于 genome 其他部分的方式驱动了变化。

从统计角度看，在这些 migration 发生的时候，频率会出现巨大波动，而这些时期对于寻找和检测 natural selection 来说信息量极低。检测 natural selection 的最佳时刻，是几百年内没有发生 migrations 和 population admixtures 的时候。在这些时期，你实际上可以看到某个 mutation 由于 selection 而缓慢地朝一个方向移动。

我们理解 Europe 和 Middle East 历史的方式，以及在这项研究中使用的理解方式，是把它看作一个由许多小型人群构成的 archipelago，这些人群分布在空间和时间中，彼此相当隔离。比如 Britain 的一个小人群隔离几百年，Hungary 的一个小人群在大型 migration 和 mixture 事件之间隔离几百年。在这些自然的小实验中，我们可以问：这个 mutation 的频率是否略有上升？同一个 mutation 的频率是否也略有上升？如果所有箭头都指向同一个方向，我们就能判断。它们在告诉我们 natural selection 正在发生。

例如，4,500 年前的 Europe，几乎所有 mutations 都经历了巨大的频率变化。这不是因为 natural selection，而是因为来自 Black Sea 和 Caspian Sea 以北 steppe 的 steppe migration。DNA 中有 40%、50%、80% 变成了来自 steppe pastoralists 的 Yamnaya 成分。他们的 mutation 频率不同，不一定是因为 selection，而只是因为他们在不同地方演化了数千年、数万年。然后如果你看这些后代人群，就会看到频率发生巨大变化。你需要做的是判断：natural selection 是否解释了一个超过随机预期的 shift？

好，在下一部分里，David 会解释这篇论文方法论中的细节。说实话，这部分有点技术性，我想先让你们了解结果，所以我把那一段移到了后面。如果你想理解方法论，可以继续听完整期节目。好，你找到了这些看起来处在 selection 之下的位置。还有一个澄清性问题。你说有 3,800 个位置，你们有 50% 的把握认为它们在过去 10,000 年里处在 selection 之下。

是 7,200 个，我们有 50% 的把握。

抱歉。

所以我认为我们在 DNA 中找到了大约 7,200 个位置，它们有 50% 的可信度是真实的。

对。

所以这些里面只有一半是真的？

我明白了。

也就是 3,600 个，但不知道具体是哪些。

对，其中 3,600 个是真的。

好的。那么，这是否也意味着，在这 7,200 个位置之外，你们可以确定 genome 中其他位置没有受到 selection？

不能。

好的。

如果你看 25% 概率这个 cutoff，会有数万个位置，其中也会有很多是真的。事实上，我们做的多项分析表明，Genome 一直在受到 natural selection 的影响，里面存在各种更弱的 effect。如果研究规模比我们现在做的还要大，这些 effect 也会被检测出来。实际上，DNA 中几乎每一个位置都与某个位置相关，并且在被 natural selection 朝某个方向牵引。natural selection 并不是静止的，而是无处不在。虽然它只占频率变化的 2%，但它在各处都把这些位置往某个方向拉。

所以我们分析了这些已经识别出来的位置，也就是几百个位点中我们非常有把握的那些，想看看它们在 DNA 中是随机分布的，还是存在某种 pattern。我们的做法是查看大约 100 个 trait，这些 trait 之前都有 genome-wide association studies，涵盖各种不同 trait，比如与 immunity 或 autoimmunity 相关的，或者 behavior、metabolism 相关的，以及其他一些 trait。对于每一种 trait，我们都可以问：从 genome-wide association studies 已知会影响这些 trait 的 genetic variants，是否拥有异常多的 genetic selection signals？

我们发现，immune traits 出现了大约 4 到 5 倍的巨大 enrichment。也就是说，selected signals 在 immune traits 中高度集中。同时我们也看到 metabolic traits 有很强的 enrichment，比如可能影响 obesity、fat traits 或 type 2 diabetes 的那些 trait。而对于 behavioral traits，或者 psychiatric traits，就我们能判断的范围来看，几乎没有可检测到的 enrichment。

我确认一下我的理解。这并不是说 behavioral traits、psychiatric traits 或 cognitive traits 没有受到 selection，而只是说，控制这类 trait 的单个位点，并没有特别高的概率出现在你们识别出的那些受到 selection 的位置里。

对，完全正确。从这个分析结果看，可能会让人觉得 immune traits 确实受到了强烈 selection，而在过去 18,000 年里，这个世界区域的 behavior 没有受到 selection。但事实上，这是错误的结论，而且我们有证据表明这是错误的。实际上，也有明确证据显示 behavioral traits 同样受到 selection。

我们认为之所以在 behavioral traits 上看到弱得多的 signal——而且我们有证据支持这一点——原因在于，其他研究和医学研究已经表明，behavioral traits 背后涉及的 gene 数量远多于 immune traits。immune traits 往往由数量相对较少、effect 较强的 gene 支撑；而 behavioral traits 在遗传上由数量非常多、effect 很弱的 gene 共同塑造。我们没有足够的 statistical power 去检测这些非常弱的 signal。

所以当我们做一个分析，只看非常强的 selection signal 时，这组非常强的结果能够非常有效地询问 immune traits，但不能非常有效地询问 behavioural traits。也许 immune traits 仍然是 selection 最强的一类，我猜确实如此；但绝不是说 behavioural traits 没有受到 selection。事实上，我们可以证明并非如此。

所以我们认为，有两个原因可以解释 natural selection 的情况。我们实际上已经能够证明，有两个原因可以把之前的观察与我们的新观察调和起来。记得之前的观察是，natural selection 在几十万年或数万年的时间尺度上似乎是 quiescent 的。原因是什么？因为你看不到 Europeans 和 East Asians 之间有频率差异达到 100% 的 variants。

但现在我们看到，有数百个位置的频率正在快速上升，很多情况下 selection rate 达到 1% 或更高。1% 或更高的 selection rate 意味着，在几十代的时间里频率就会迅速翻倍。那么在 1,500 到 2,000 代的时间尺度上，也就是 Europeans 和 East Asians 分化所对应的时间尺度，难道不应该看到很多 genetic variants 在不同 population 之间出现 100% 的频率差异吗？

我们能够表明，这至少由两个因素解释。其中一个是，在世界的这个区域，也就是 Europe 和 Middle East，我们实际上正处在 natural selection 加速的时期。观察这一点的一种方式，是看我们发现的 enrichment pattern：immune traits 与这些 selection signals 存在异常强的关联。我们可以把我们时间段中的最后 5,000 年，也就是所谓 Bronze Age 及之后，与此前 5,000 年进行比较。我们看到的是，围绕 immune traits 的 selection 强化，以及类似地围绕 metabolic traits 的强化，在这个时间段内加速了。

所以，natural selection 并不是在所有地点和所有时期都保持同样的速率。事实上，在我们分析的这个时间段里，它在增强。因此，整个这个时期相对于更早时期来说，selection 很可能都增强了。也就是说，我们处在一个 intensified selection 的时期。这并不难理解，因为这个 population 经历了巨大的冲击，涉及人们的生活方式和 culture。

我们分析的几乎所有人都是 farmers，或者以某种方式进行 food production 的人。farming 最早是在 11,000 或 12,000 年前的 Middle East 被发明的。发明 farming 的人群在 8,500 年前之后进入 Europe，并在 Europe 扩散和迅速扩张。到了 Bronze Age，人们的生活方式进一步强化，population density 大幅提高，人们越来越多地与动物生活在一起，感染动物的 diseases，也在彼此之间和与动物之间交换 diseases。

所以，这是一个人类生活方式快速变化的时期，导致这个 population 出现了不同的 biological needs。因此，在这些剧烈变化的背景下，population 的 biology 可能并不处在理想适应状态，这也许并不奇怪。也就是说，可能存在一些人所说的 evolutionary mismatch：一种在 hunter-gatherers 中演化出来的 genetic variation，被放进 farmers 或 pastoralists 的生活环境里，就不再完全合适。

所以你看到的是，这个 population 的 DNA——他们仅仅在 10,000 年前还源自 hunter-gatherers——正在对被转移到 agricultural、Bronze Age、高 population density 和 urban environment 中所带来的冲击作出反应。一个 hypothesis 是，我们看到的正是由此产生的 adaptation。

有意思。

好的，也许可以这样展开：在论文中，你们给出了很多 Bronze Age 前后 selection 强化的例子。你可以按自己的方式来讲，不过逐一讨论其中一些具体例子可能会有帮助。

所以我们看——

我们在这项工作中做的一件事，是仔细查看 DNA 中大量这样的位点。我们实际上有一个可以查看的网页浏览器，叫 Aegis Browser，是 Ali 和他的一位同事，也是我们论文的共同作者搭建的。它允许你查询这 1000 万个位点中的每一个，查看每个位点上的变化轨迹，以及自然选择的证据。我们看到的一点是，虽然总体上我们检测到的自然选择信号，大多符合随时间持续稳定的自然选择，但在少数位点上，我们能看到自然选择发生过逆转，或者出现过剧烈变化。而这种情况非常常发生在 5000 年到 2000 年前之间，也就是青铜时代和铁器时代。这是一个人口快速增长、许多技术被密集使用并迅速扩散的时期，而此前这些技术并不是以这种方式被使用的。一个例子是 TIK2 genetic variant，它是严重结核病的一个主要风险因素。结核病是当今世界上最主要的传染病，也是最重要的传染病致死原因。如果你看这个结核病的主要风险因素，这个 variant 在 8000 年或 6000 年前到这个地区大约 9% 或 10% 的频率之间迅速上升，随后在过去 3000 年里又迅速下降。两种情况下都有非常明确的自然选择证据。第一次是推动其频率上升，随后则是推动其频率下降。一个可能的原因是，结核病也许在 2000 年或 3000 年前开始在人群中成为地方性流行病。这可能与 pathogen sequence data 以及其他证据相一致。也许这个 variant 在那之前保护人们免受某种东西影响，但在那之后结核病变得重要，而且影响非常严重，于是选择压力转向了相反方向。不过这还是推测。

有意思。它之前所防护的东西，可能也是另一种疾病？

可能是。

为了准备这一期节目，我需要做一次完整的文献综述。我得弄清楚，为什么其他方法没能找到过去 10000 年中自然选择的证据。Reich 和 Ikbari 到底做了什么不同的事？老实说，这一点相当微妙，因为最重要的要点分散在很多不同论文里。和 LLMs 讨论这件事也让人有些挫败，因为它们总是会混淆。其中一个模型会没能理解某个关键点，于是我换到另一个模型，而那个模型又会在下一个问题上出错。最后我用 Cursor 同时启动了几个模型，然后比较它们的结果。我可以让一个模型批评另一个模型的回答。这非常有用，因为虽然我不是遗传学家，但我有足够的判断力，能说出：这个答案说得通，那些不行。我还让 Cursor 把这些工作转成 flashcards，这样我能记住所学到的内容。Cursor 最初是一个编程工具，但我发现它非常适合这种研究工作。没有其他 interface 能让我一边在同一个屏幕上阅读相关论文，一边从多个独立的 LLMs 得到答案。可以去 cursor.com/thorkesh 试用。

这篇论文给我的一个重要启发是，青铜时代发生了一些奇怪的事。就像你说的，我们看到一个又一个 trait，在青铜时代 selection 都增强了。对某些东西来说，这很好理解。比如为什么我们会看到 lactase persistence，也就是成年人能够消化牛奶？为什么它在这个时期增强？这说得通。因为这个时候，我们开始不只是为了肉而使用牛，还开始利用牛奶、羊毛和其他 secondary products。所以 lactose 为什么重要，或者说 lactase persistence 为什么变得更重要，是能理解的。但还有一些东西似乎从农业出现之初就应该很相关。我忘了那个 allele 的确切名字，是 FADS1 吗？对，它有助于把植物 fatty acids 转化成身体需要的 long-chain fatty acids。当你从 hunter-gatherer 以肉类为主的饮食转向以谷物为主的饮食时，这显然很相关。但为什么？为什么这个也是你们发现的，在大约 5000 年、3000 年前受到特殊 selection，或者特别强 selection 的对象？所以这里到底发生了什么？为什么青铜时代在你们观察到的这些不同 traits 上都这么特别？

对，FADS1/2 这个 variant，可以说是一种素食/肉食适应。事实上，在这项工作之前，Ian Matheson，也就是 2015 年和我一起工作过的前同事，就已经把它识别为一个受到很强 selection 的 variant。而且它其实很古老。你在 archaic humans 中也能看到它的拷贝。我们论文的一个发现是 ABO blood system。你知道，你的血型是 A、B 或 O。B variant 以 A 为代价，增加到了 10%。但之前的研究表明，A 和 B 在人类和长臂猿的共同祖先中就已经存在，也就是其他 apes 的祖先中。所以这些 mutations 中有一些，在不同历史时期一直来回变化、上下波动。但我们现在讨论的是青铜时代的变化。这个与结核病风险相关的 TIK2 variant、multiple sclerosis risk variant，在青铜时代之前发生拐点并增加频率，然后在 2000 或 3000 年前，也就是那个时期，又发生了逆转。而且北欧和南欧之间存在差异。在北欧，这个过程非常强，正向 selection 很强，负向 selection 也很强；而在南欧，幅度只有一点，而且负向 selection 甚至也不是很强。对于 hemochromatosis，也就是在欧洲造成问题的致病性铁积累，它同样在这一时期前后发生了逆转。在一些 complex traits 上，也许我们之后会谈到，这些 traits 也有自然选择增强的时期。比如 depigmentation，也就是欧洲人在过去 10000 年中 depigmented，肤色变浅。你可以在我们的数据中看到这一点。pigmentation 变化最强的时期大约在 4000 年到 2000 年前之间，此后就弱得多。所以这似乎是一个影响很大、事件很多、非常重要的时期，我们看到的许多过程都在这个时期变得非常强。

而且从基本原理上看，这很出乎意料。

在看到这些 genetic data 之前，你可能会以为最大的变化是人类开始种植植物，也可能开始饲养农场动物。这发生在 Neolithic，大约从 10000、11000 或 12000 年前开始，并在 8500 年前之后扩散到欧洲。但实际上，增强发生在大约 5000 年前、4000 年前。所以这个观察非常有意思：它是一个关键点，一个拐点。它告诉我们，至少在世界的这一部分，人类是在什么时候被拖入一种生活方式的，这种生活方式与 hunter-gatherer 祖先的生活方式差异如此之大，以至于生物体必须进行非常强的适应。也许进入青铜时代的这种剧烈转变，在性质上比最初过渡到种植植物时发生的那种转变程度更大。这很意外，因为我们通常的简化图景是，最大的转变是农业。但 genetic data，也就是 biological readout，告诉我们，我们的 genome 对 5000 年前发生的这些事件反应要强烈得多。

你在 2014 年和 Batya 以及许多其他同事做过一些研究。你们观察的是今天 20,000 或 30,000 个 African American genomes，然后说，这里大概有一定比例，比如 80% West African DNA，以及 20% European DNA。那么我们能不能看他们今天的 genomes，看看他们的 allele frequencies 是否明显不同于仅按这种 admixture 所预期的结果？你们发现——如果我说错了请纠正我——你们发现并没有明显不同。也就是说，在 200、300 年极其剧烈的环境变化中，比如从动产奴隶制，到一个完全新的环境，并没有自然选择的影响。所以我们会看到一些这样的例子，看不到自然选择；但 Bronze Age 似乎一定产生了更强的影响，那里的环境变化甚至比非洲人从非洲被迁移到 New World、并在奴隶制下生活所经历的变化还要强。

可能是这样。也可能是那段时间太短了，看不到太多影响。在 Batya et al. 那篇论文里，我们研究了大约 30,000 名 African Americans，想看的是，他们平均大约有 80% West African ancestry，但在 DNA 的某些位置是否显著高于 80%，在另一些位置是否显著低于 80%；如果存在来自 Europeans 或 Africans 的某个 genetic variant 受到自然选择，这就是你会预期看到的情况。我们没有在 DNA 中看到任何位置显著偏离随机预期。因此，一个可能的解释就是，只有很少几代人，也许 5 代，自然选择能发挥作用的时间太短。所以即使 selection 每代是 2%，最终也可能只看到大约 10% 的复合效应，而时间不足以让我们检测到它。但 Bronze Age 不是 300 年，而是 3,000 年。这就是复利的力量，有足够时间开始看到强烈影响。而从 human history 的角度看，这确实似乎是一个影响非常大的时期，而且你可以在我们的 complex traits 中看到这一点。比如 pigmentation，这是我们数据集中 complex trait 受到 selection 的最强信号。你观察已知会影响 pigmentation 的 genetic mutations，把它们在整个 DNA 中的效应加总起来，可能有几十个或几百个，然后看自然选择在哪个时期最强。这个时期确实是大约 2,000 到 4,000 年前。对其他一些 traits 也是如此，你同样会看到 selection 最强的时期是在 2,000、4,000 年前。比如，如果你看影响 cognitive performance 指标的 genetic variants，例如今天 white British people 在 intelligence 测试上的表现。当然，用这个 trait 去衡量过去是很奇怪的，因为过去没有 intelligence tests，也没有学校，但它在今天是一个 predictor，你可以看它在过去如何变化。我们看到，这组 genetic variants 受到了很强的自然选择；它们可以预测人们在 IQ tests 上的表现，也与预测受教育年限或 household wealth 的 predictor 高度相关。放在过去看，这些 trait 都很奇怪，因为过去没有今天意义上的 wealth，也没有学校。但如果你看今天的 predictors，会发现它们沿着一个系统性的方向发生了强烈移动，效应很大，按现代 variation 的尺度大约是一个 standard deviation。然后我们可以做一个技巧，看看自然选择在某些时期是否更强或更弱。我们的做法是在数据中拖动一个 2,000 年的窗口，重复整个分析；不是在 18,000 年上分析，而是在一个较短的 2,000 年窗口上分析。这样我们就可以测量每个 2,000 年窗口中的 selection 强度。当你看 intelligence 时，会发现它在 Bronze Age 达到峰值，大约在 5,000、4,000、3,000、2,000 年前之间，而最近 2,000 年的影响几乎为零。完全没有自然选择的证据。你一开始可能会有一种偏见，我也许也会有：如果这个 trait 上存在任何自然选择信号，那它可能会在最近 2,000 年异常强。也许这是工业化时期，也许这个时期对这种 particular trait 的需求更大。但实际上，最近 2,000 年完全没有自然选择的证据。相反，在 2,000 到 4,000 年前有非常强的证据；在那里，不是 1 个 standard deviation 的 selection 强度，而是 2 个 standard deviation 的强度，是在这段时期内平均出来的。

这里的 standard deviation 指的是这个 trait 本身的 polygenic score 移动了多少，还是指 polygenic score trait 在 10,000 年期间移动了多少。明白了。

是在 ancestry 保持不变的人群内部。因为我们实际做的是，在数据集中观察一组相当 heterogeneous 的人群：有 Southern Europeans、Northern Europeans、hunter-gatherers 和 farmers，而且在过去不同时期，这些群体的代表性有多有少。所以 Ali Akbari 开发的方法论的核心优势，就是它能校正随时间变化的 ancestry。正如我之前提到的，这里真正要问的是：我们把整个数据集划分成一个由许多小 population 组成的群岛，这些 population 分布在不同的空间和时间位置。然后我们问，在每一个空间和时间位置，比如 4,000 年前到 3,500 年前 Britain 的一小群人，Hungary 的一小群人，2,000 年前到 1,500 年前 Italy 的一小群人，在这些地方，ancestry 相对相似，而且在这段短时间内没有被 migrations 过度扰动，我们观察 genetic changes 是否朝同一个方向移动。我们这里做的，就是在校正已经发生的大规模 population changes 之后，测量每个时间点的 selection 强度。

好，所以这里的效应其实非常大。因为如果你说一个 standard deviation，那么高于 median 一个 standard deviation 的人，大概是在第 85 百分位。也就是说，selection 的影响强到这种程度：和 10,000 年前相比，今天的 median 已经移动到了当时的第 85 百分位。对于 intelligence 这样的东西，或者预测 household income 之类的东西来说，这在过去 10,000 年里是一个非常大的效应。而且尤其考虑到，这只占 Neanderthal frequencies 变化的 2%，另外 98% 来自 migration。那么想到 migration 的影响就会觉得很惊人。也就是说，仅这个因素就能解释，或者说正在驱动这些 qualities 出现一个 standard deviation 的变化，至少是在我们今天世界上所见 variation 的范围内。

数据里能看到的一点是，migration 的影响非常大。比如，如果你看 cognitive performance 的某些指标，比如今天 white British people 的 intelligence tests 分数，但你观察古代人的这个 predictor，那么对 European hunter-gatherers 的估计大约比现代 mean 低 3 个 standard deviations。

对。

所以差异非常大。

是的。

然后你会看到，从他们到那些处在平均值、也就是零附近的农民之间，有一个很大的跃升，这就是迁徙。

是的。

所以你看到的是，这两个群体在这些 trait（性状）上的 set point（设定点）不同。然后 Steppe Pastoralists（草原牧民）在这个 trait 上的设定值更低。因此，你会看到这个 trait 的 predictor（预测指标）随时间出现大幅波动。这并不能证明 selection（选择）。它只是告诉你发生了 migration（迁徙）。但我们的 test（检验）要说明的是，除了这些由 migration 导致的波动之外，是否还存在一个 consistent effect（一致效应）：natural selection（自然选择）是否在所有地点、所有时期总体上把这个 trait 推向同一个方向？这就是我们检测到的东西。

是的。

有这样一个人提出了一个理论，叫 Collective Intelligence Hypothesis（集体智能假说）。这个观点认为，对我们的 intelligence（智力）的 selection 实际上一直朝着相反方向发生：随着 society（社会）发展，specialization（专业化）越来越强。如果专业化更强，每个人只需要理解世界中越来越小的一部分，因此古人其实比我们聪明得多，而我们在智力上某种程度是退化了。你们的结果似乎指向相反方向：虽然在过去 2,000 年里，随着社会变得更复杂，并没有发生这种 selection，但至少在社会刚开始形成的时候，对于今天能预测 intelligence 的那类东西，需求变得更强。令人意外的是，如果你考虑 hunter-gatherers（狩猎采集者），比如读你同事 Joseph Hendrickx 的书会看到，他们需要掌握并评估的信息量非常大，从如何处理食物，到如何建造 shelter（庇护所）、生火等等。相比之下，我的世界里只需要知道怎么架设麦克风、怎么提问。看起来，在 ancestral environment（祖先环境）中，对 intelligence 的要求应该高得多。所以文明的开端反而增加了对 intelligence 的 selection，这就很出人意料，对吧？

这就是 data（数据）的力量。比如，如果在这项工作之前你问 Joe，hunter-gatherers 面临的 selection 会是什么，以及他们在这个特定 trait 上的 set point 会在哪里，我想他可能不会做出很强的预测，但他会说，也许你会预期这个 trait 的 predicted value（预测值）比较高，因为这些人确实需要做很多事、搞清楚很多东西。也许一旦社会更复杂，就会出现更多 collective brain（集体大脑），也许就会出现对这个 trait 的反向 selection。实际上，在某些方面结果正好相反。所以这就是 data 的力量。它不一定符合你的预期。看过这些 data 之后，data 的价值就在于帮助我们理解这些问题。很有意思的是，intelligence 的 genetic predictor（遗传预测指标）有很多令人困惑的地方，所以确实值得谈谈。或者说 years of schooling（受教育年限）的 genetic predictor，它和 intelligence 高度相关，而且测量得更好。如果你看受教育年限的 genetic predictor，2017 年还有一项来自 Iceland（冰岛）团队的很出色研究，考察了冰岛过去 100 年里的这个指标。研究比较了老年人和年轻人，也就是在冰岛较近时期出生的人。估计结果显示，在一个世纪内，冰岛 intelligence 的 genetic predictor 下降了 0.1 个 standard deviation（标准差），这在很短时间内是一个非常大的 effect（效应）。这是对 years of schooling 的反向 selection。如果我刚才说成 intelligence，那不是我的本意。它是对受教育年限的 genetic predictors 的反向 selection。对此有一种比较粗略的解释是：这里实际测量到的，可能并不是对受教育年限的 selection，也不是对真实 intelligence 的 selection，而是另一个与二者都相关的 trait。比如，受教育年限的 predictor 与女性生育第一个孩子的年龄高度相关。如果在分析受教育年限时控制这个因素，所有关于 years of schooling 的 signal（信号）都会消失。所以也许你测到的是女性关于何时生育的决定。你如果更早生孩子，上学时间就更少；如果晚一些生孩子，上学时间就更多。也许这测量的是某种延迟满足、推迟事情、或者规划能力。同一个 trait 还与 body mass index（身体质量指数）、obesity（肥胖）或 walking pace（步速）相关。那么，这真的像我们理解的那样是 intelligence 吗？还是说它其实是别的东西，只是在过去的不同时期以不同方式表现出来？

是的。也就是说，像 years of schooling 这样的 trait，在过去显然本身并不是一个有意义的东西。而它背后的那些因素似乎经历了很强的 selection。因此，genome（基因组）中那些能够预测 years of schooling 的东西，似乎经历了很强的 selection。我们应该怎么理解这一点？也就是说，genome 中真正发生变化的东西到底是什么？

是的，我认为这里有两件事需要考虑。第一，受教育年限在遗传层面上和很多其他东西相关。如果你看受教育年限的 genetic predictor（遗传预测因子），这个 trait 现在已经在数百万人身上测量过，它实际上和一些非常出人意料的东西相关。它和女性生第一个孩子的年龄相关，和人的肥胖程度相关，和人的步行速度相关，和家庭财富相关，也和许多看起来相当不同的其他 trait 相关。所以，如果你以为自己测量的真的是 intelligence 的遗传预测，或者真正用功程度之类的东西，那就需要重新想一想，因为它相关的东西太多了。这里似乎有某种更一般的 trait，也许你可以把它理解为 executive function（执行功能），或者延迟满足的倾向，或者别的什么——我只是在概括地说——它受到 selection，并且会把所有这些 trait 朝同一个方向推动，不管是正向还是反向。在过去的不同时期，它可能有利，也可能不利。

但当我们发现受教育年限增加的这个信号，也就是今天白人英国人身上表现出来的、更倾向于上更多年学的遗传倾向时，我们其实有点不敢相信。怎么会这样？会不会是哪里出了问题？所以我们做了几个测试，想弄清楚这是不是一个真实信号。其中一个测试是，我们找了一项研究，它不是在欧洲人中测量受教育年限，而是在中国的中国人中测量。我们考察了许多 variants 对中国人受教育年限的 effect size，然后看这些相同的 genetic variants 在过去 10,000 年里欧洲人中的轨迹，是否与之存在关系，也就是 correlation。

这是世界上两个地区，人口基本上是完全断开的。按理说，过去 10,000 年欧洲人中这些 variants 的轨迹，不可能凭偶然和今天中国人的受教育年限效应有什么关系。但实际上存在一个很强的统计相关性，是 5 或 6 个 standard deviation 的 correlation：今天中国人中 variants 对受教育年限的 effect size，和欧洲人中的轨迹之间有相关，而且它的强度实际上和欧洲人中 variants 对受教育年限的 effect size 与欧洲人自身轨迹之间的关系一样强。所以我们看不出这怎么可能是偶然发生的。看到这一点后，我们确实相当相信这是一个真实信号，也就是说，确实以某种方式存在过 natural selection，增加了那些今天表现为更多受教育年限、预测更多受教育年限的 genetic changes。

好，我确认一下我有没有理解对。你的意思是，你们在看欧洲的 ancient DNA，然后发现它似乎可以预测现代欧洲人的受教育年限，或者至少是对这些 ancient DNA 的 selection——这些 ancient DNA 似乎预测了现代欧洲更高的受教育年限。然后你们还发现，它也能预测同样这些 variants 在中国的中国人中如何预测更高的受教育年限。

是的。

所以这不只是欧洲这些 GWAS 的做法造成的某种奇怪 artifact。genome 的这些部分似乎能够稳健地预测某种确实会导致更多受教育年限的东西，至少在今天的人群中是这样。

没错。

Jane Street 相当低调，但我确实了解到一个内部机制，它说明了他们的文化有多么 high-trust，又有多么特别。研究员不会被分配固定的 compute allocations。相反，Jane Streeters 使用一种叫 Hive Bucks 的内部货币，在实时拍卖中竞价 compute。每个人都可以花任意数量的 Hive Bucks，但你出价 Hive $5，理论上代表的是你想运行的实验的真实美元价值。值得注意的是，在拍卖过程中，任何人都可以修改任何其他人的出价；拍卖结束后，人们甚至可以 kill 掉彼此的 jobs。大家只是信任彼此会以有利于整个公司的方式这么做。因此，Jane Street 的 allocations 反映了关于 compute 最高优先级用途的近乎实时的共识。

正如他们的一位 ML 工程师 Axel 所说，我认为 Jane Street 在某种程度上非常 bottom-up：我们有很多不同的研究员，都在训练自己的 models、sequence models，以及各种其他奇怪但有意思的东西。

顺便说一句，随着他们新的 compute deal，他们刚刚向内部经济注入了 $6 billion 的 Hive Buck 刺激。Jane Street 正在招聘研究员、工程师和实习生。请访问 janestreet.com/thorcash 了解更多。

好，退一步说，我想理解的是：这告诉我们，过去 18,000 年里我们的环境到底发生了什么变化？我们刚才稍微谈了一下 Bronze Age 之后发生了什么。我想理解的是，这让我感到意外。我们是在 collective intelligence 这一部分谈这个问题，但让我惊讶的是，像 intelligence，或者没有 schizophrenia 之类，看起来似乎就是稳健地好的东西，在 Bronze Age 之前并没有达到上限。事实上，不同人群之间的差异非常大，以至于 European hunter-gatherers 的预测值低了 3 个 standard deviations，也就是如果当时有 intelligence tests，他们可能会得到的分数。但他们生活在真实世界中，在一个 intelligence 很重要的环境里。那么怎么会这样？这并不是一个真正的……你只要看人体或任何动物，就会觉得 evolution 一直在强烈作用于它，使它具备功能，完成它需要完成的事情。而这件看起来如此相关，尤其对人类 hunter-gatherers 需要做的事情如此相关的东西，在 Mesolithic、Paleolithic 或那些时期，似乎并没有受到那么强的 selection，这是怎么回事？

我觉得这是一个很好的问题。正如我们之前谈到的，human adaptation 是非常有效的。如果某个特定环境中某个方向是 adaptive 的，它可以在几百年或几千年内把某些 trait 的 mean value 朝一个方向或另一个方向推动。所以你可能会想，intelligence 难道不是在所有语境、所有时间地点都好吗？我认为有几种方式可以思考这个问题。

首先，我认为我们是从一个极度重视这个特定 trait 的社会视角出发，也就是很会在 IQ tests 或类似测试中得高分、能长期上学，或者不管它具体是什么。我认为我们生活在这样一个时代，这在人类历史上是前所未有的。如果你看 Hebrew and Christian Bible，看看 intelligence 被重视到什么程度，基本上几乎没有。

等等，但 Bible 被写出来的时候，尤其是 Old Testament，恰好就是 selection for intelligence 显然达到历史最高点的时候。

是的，没错。

但它更多是关于力量、勇气、宗教虔诚之类的东西，对吧？这些才是价值，对吧？或者你读 Homer，或者其他宗教的文本，里面强调的并不是 intelligence，而是美、以及其他东西。所以，这种高度聚焦于“聪明”的价值体系，显然并不是过去常见的 trait value。你可能会认为，在某些社群中，某些更接近于受教育年限的东西会被看重。但从很广的范围来看，它并不是人群中的高价值特征。

不过显然，我们这里说的并不是 IQ test 上的直接表现，尤其是在过去。至少我更想理解的是这个：更广义的 intelligence 是什么？也许 IQ test intelligence 和另一件事并没有那么相关：你被放到一个新的环境里，要在那里弄清楚怎么处理食物、搭建住所，以及做其他所有事情。你的同事，比如 Joseph Henricher，谈过这些问题：现代人低估了一个小群体要完成这些事有多难。总之，我想说的是，也许这并不是 IQ test intelligence，所以我们才没有看到它有那么强的 selection effect。但直觉上，不管价值体系是什么，把这个 trait 拉满似乎都非常有价值。

我接下来会非常 speculative。

嗯。

我可以给你两个例子，说明我脑子里是怎么想这件事的。当然，我并不是这些问题上特别权威的人。但正如我刚才提到的，很多差异很大的 traits 彼此高度相关。肥胖、受教育年限、步行速度、IQ test 表现、家庭财富，所有这些看起来很不相干的 traits，似乎在相当程度上都受同一组 genetic variants 的共同组合影响。我们不妨想想这可能意味着什么。在 Iceland 过去 100 年里，selection 一直在反对这组 variants。一个可能的解释是，它基本上是在两种对子女投资方式之间进行 selection：要很多孩子，但对每个孩子投入不多；或者要少数孩子，但对每个孩子投入更多。如果你选择推迟生育、积累更多财富和资源，并把更多投入到每个孩子身上，你的 fertility 就会更低，孩子也会更少。fertility 更低，但这些孩子可能存活得更多，在社会中也表现得更好。相反，你也可以尽可能多生孩子，而对每个孩子投入较少。单个孩子的结果可能没那么好，但在一个资源充裕的时期——20 世纪的 Iceland 可能就是这样——多生孩子、少投入，可能是合理的。所以这里存在一个切换：更多孩子、更少投入；或者更少孩子、更多投入，让他们在不同方面更出色，诸如此类。你可以想象，在不同时间、不同地点、不同 ecology 中，资源条件不同，就会有不同策略。比如 mammals 往往在怀孕和少量后代身上投入很多，而 fish 会一次产下大量后代到河里，其中绝大多数会被吃掉。但在某些条件下，那也是一种有效的繁殖方式。所以根据环境条件，会在两种策略之间来回切换：大量后代、较少投入；或者少量后代、更多投入。也许我们看到的只是这种策略在不同地点和时间中的来回移动。

同样地，schizophrenia 和 bipolar disease 怎么可能有优势呢？但也许我们在这些疾病中看到的，是某种 traits 光谱的 readout，而这种光谱在某些语境下可能是有利的。也许焦虑、有想象力、neurotic，在 shamanistic tradition 中会有帮助；在重视 visions 的 religious tradition 中，或者重视创造力的传统中，也可能有帮助。也许这些是 schizophrenia 或 bipolar disease 的 subclinical 版本，在某些时期可能有利，在另一些时期可能不利。也许你看到的只是对不同类型的创造力或其他思维方式的 selection，而它们在不同情境中可能有价值。我这里是在做很多推测，但我的感觉是，这些 complex traits 并没有一直朝一个方向推进，因为它们所在的 spectrum 两端都可能有优势，而且这些不同 traits 的影响是 multi-dimensional 的。

Julian Jaynes 在 The Origins of Consciousness in the Bicameral Mind 里有个著名理论——我可能会说得不准确，但我基本理解是，到 Homer 之前，几乎每个人在某种意义上都是 schizophrenic，也就是说，人们真的认为 gods 或其他存在是真实的人，你可以和他们交流。他的说法是，古代文本似乎显示人们就是以这种方式行动，或者文本要求你相信 visions。对，正是这样。

而且即使在今天，我觉得有些 religious communities 仍然重视这些事情，比如与 God 交流、拥有 visions、进行 supernatural communions。

所以，我也不知道。是的，但我觉得想象这一点很有意思——

去问为什么某些 traits 并不总是 advantageous，这个问题很有意思。对于 schizophrenia 和 bipolar disease，从某种意义上说，大多数 mutations 都是不利的。我们可以从 variation 的模式中看到这一点：那些作为 risk factors 的 variants 往往 frequency 很低，而且 effect size 往往很小。

你们发现的另一个处于 selection 之下的 trait 是，远离 body fat 的趋势。是的，从 agricultural religion 以来就是这样。为什么会这样？

所以你看到的是，一组会让人更容易肥胖、body mass index 升高的 genetic mutations 组合在减少；与之类似且高度相关的，还有更高的 fat mass、更高的 waist-to-hip ratio，以及更高的 type 2 diabetes 风险。也就是说，对于这些 traits，在现代变异尺度上，大约有一个 standard deviation 的明确 selection；在世界这一区域，过去 10,000 年里这种组合减少了大约 10,000。那么这里可能发生了什么？为什么此前没有对这组 traits 进行 selection？有一个长期存在的观点叫 Thrifty Genes Hypothesis。它的意思是，一旦 hunter-gatherer 人群进入食物充足的农业环境，就不再同等程度地需要积累 body fat，以便在压力时期生存，因为食物储备更加稳定。因此，一旦进入农业环境和食物相对充足的时期，body fat 就会受到 natural selection 的负向作用。也许你看到的是，过去 10,000 年里，欧洲和中东的这群人进入了一个食物相对更稳定的时期，积累脂肪储备不再那么有利，于是这组 traits 受到了 selection 的抑制。实际上，与世界上一些其他人群相比，欧洲人在遗传上对 type 2 diabetes 的保护相对更强，比如 African Americans 和 Native Americans；这些人群接触农业的时间可能没有那么长。所以你看到的，可能是更长时间接触更稳定食物可得性的影响。

这也是数据与一个常见叙事相反的地方。那个常见叙事是，hunter-gatherers 的饮食其实更稳定，因为他们的食物来源更多样。所以他们不会依赖单一谷物或单一作物来获得热量。如果某一种猎物消失了，他们还有其他东西可以寻找。他们也更容易迁移地点，因为没有被土地绑定。因此他们的食物更稳定。但实际上，如果对 body fat 储存存在负向 selection，这就说明，尽管农业社会的 famine 可能很不稳定、也很常见，但至少还是比 hunter-gatherers 所面对的情况更稳定。

我觉得这里有一个时间尺度的问题。你说得完全对。按我的理解，我不是 anthropologist，但我的理解是，在一些传统社会或狩猎社群中，一次狩猎之后，人们常常会大量进食，吃下很多东西，建立一种临时的脂肪储备，然后连续多天不吃肉，有时一直到下一次狩猎。所以他们获得高价值营养的方式有这种 boom-bust 的节奏，而农业社群在同等程度上并不是这样。另一方面，我认为这些长期的 famine 更常发生在农业社会，但它们的时间尺度和节奏与狩猎节奏很不一样。也许每 3 年会有一次 famine。事实上，如果你观察农民的骨骼，至少在一些社群中，可以看到更多压力痕迹，可能是因为每 3 年一次 famine，或每 5 年一次 famine。但 selection 未必作用在这个 3 年的时间段上。你最近一次狩猎积累的脂肪储备，不可能支撑你熬到 3 年后的 famine。所以在 famine 中存活是一回事，为了能在 2 周后活下来而积累 body fat 是另一回事。

我有一个有点随机的问题。你刚才提到，相比其他那些在 fitness 和祖先环境中更重要的东西，比如 immune system，尤其是在 Bronze Age 之后，所有这些东西都比 intelligence 更重要。因此它们承受的 selective pressure 比 intelligence 大得多，对吧？这会让人想知道，intelligence 的上限是否还有更大空间。也就是说，如果人类曾经被特别针对 intelligence 进行 selection，他们是不是本可以聪明得多。这个问题之所以相关，是因为我们现在正在构建 AI systems，并试图让它们尽可能聪明。事实上，training process 的唯一目标就是 intelligence。我们不必同时担心还要让它们的 immune systems 强大。

而且我们有很多 energy 可以投入进去，对吧？

同时也不必确保它们不会得 schizophrenia。我想我们某种程度上也会担心这个。不过，如果在过去 10,000 年、20,000 年、100,000 年里，intelligence 并不是人类 selection 下的主导 trait，这是否意味着这个 trait 的上限还有更多空间？

我认为很多 traits 的上限都有更多空间。我认为可以把 height 朝一个方向推到比今天极端得多的程度。也可以把这些 traits 中任何一个朝另一个方向推得极端得多。这样做很可能会有非常强的负面影响。

你很可能是在牺牲其他东西。

我也认为这里可能存在 trade-offs，但我觉得很可能，如果 natural selection 把这些 traits 中任何一个朝某个方向推得比现在更远，均值会……所以，Out of Africa 之后的所有这些 evolution，都是作用在一些 alleles 上，而这些 alleles 已经存在于最初那一批人类变异的 pool 里，也就是我们上次谈到的那群大约 10,000 人，他们从 Africa 扩散出来。那么，跨越这么多不同 traits，从 cognitive profiles，到对不同疾病的 resistance，到 height，再到其他任何东西，那一批人的 pool 里竟然包含了这么多潜在 variation，能够提供足够的延展性来适应你们现在研究的所有这些不同 traits，这件事令人意外吗？

这是一个很丰富的问题。我认为在人类群体内部，复杂性状存在大量变异。所以在人类群体中，有大量影响身高的变异，也有大量影响 body mass index 的变异。如果你把所有这些 mutations 都设成增加身高的 variant，一个人会非常高，像高楼一样高。当然，这永远不会发生。但如果你把所有影响 schizophrenia 风险的 variants 都朝同一个方向推，它们就会带来 schizophrenia 的极高风险，或者极强保护。所以对于复杂性状，也就是由许多 mutations 支撑的性状，群体中已经存在足够的变异，可以把群体推向另一个适应性 set point，使其在所处环境中达到最优。也就是说，如果你把一个群体推入新环境，在数百年或数千年内，这个群体就可以迅速移动到新的适应性 set point。也有一些不寻常的性状，比如消化牛奶的能力，或者对 sickle cell anemia 的保护，它们需要一个非常重要的单一 mutation，而这个 mutation 可能还不存在于群体中。那你就必须等这个 mutation 在某些人身上出现。当群体相对较小，比如只有 10,000 人时，可能要等几十代或几百代才会出现这个 mutation。但当群体很大时，就不再受 mutation 限制了。每一种可能发生的 mutation 都会发生。世界上有 8 billion 人，每一代可能有 30 个新的 mutations。所以这相当于每一代有 240 billion 个新的点 mutations。genome 中只有 3 billion 个 DNA bases，因此每一种可能发生的 mutation 每一代都会发生大约 100 次，我们已经不再受 mutation 限制。所以并不是说那些 mutations 不会再次出现。它们确实会再次出现，但当群体只有 10,000 人时，有时就必须等几十代或几百代，新的 mutation 才会发生。

那么，Bronze Age 发生变化的原因，仅仅是人类群体已经足够大，这种可能性有多高？也就是说，到 3,000 BC，人口大概到了 50 million 左右？人口已经足够大，而且不同地区之间的 gene flow 也足够高，于是那些 selection coefficient 不是压倒性的、并非被 evolution 极强偏好的东西，终于能够被 selection 看见。

我觉得这不太可能是真的，但这是一个非常有意思的问题。我的看法是，当群体规模达到大约一百万量级时，每一种可能发生的 mutation 都会在几代之内发生。这远早于 Bronze Age。即便只看 Europe 这样的地方，或者其他地方的群体，也是如此。也许是在 Bronze Age 开端，或者 farming period。你问的问题也许是：当群体很小时，natural selection 是否不能有效发挥作用。

对。

关于 natural selection，人们常想到的一点，而且这是对的，就是在小群体中，selection 不能有效发挥作用。原因是，在小群体中，mutations 的频率会在一代又一代之间随机地大幅波动。所以如果一个群体规模是 1,000，mutations 每一代的频率波动大约是 1/1,000。如果 selection coefficient 小于这个值，它就会被 genetic drift 导致的随机频率波动淹没。但对于一个 1,000 人的群体来说，0.1% 的 selection coefficient 已经非常弱了。我们谈的是 1% 的效应，那就要强得多——

非常强。

即使在规模为 1,000 的群体中，它也会非常有效。如果你讨论的是那类只会在大群体中开始上升、而不会在小群体中上升的 mutations，那么它们的 selection coefficient 大概是 1/10,000 或 1/100,000 这个量级。而这些 mutations 要花 10,000 或 100,000 代才能在频率上上升，也就是几十万年或几百万年。所以在我们讨论的时间尺度上，它们不会产生什么作用。这里存在一个时间尺度问题。所以在这项研究中，我们讨论的是强且可测量的 selection coefficients，大约是 0.5% 或更高。所有这些在小群体或大群体中都会起作用，不会受到群体规模影响。

有意思。但你更一般地说，一旦达到某个人口阈值，主导因素就是时间跨度，对吗？人口规模，对。好，有意思。

这非常有意思，而且实际上并没有被广泛理解。

好，说到数据与你原本可能的假设相矛盾，你之前发给我的一篇论文 Malik 2016 发现，50,000 年前现代人类和 archaic humans 之间没有固定差异。当然我们知道，这一时期正是所谓 cognitive revolution 发生、现代性开始出现的时期，人们开始创作 art 之类的东西。这是否意味着，并没有什么 biological 变化让现代人类变成现代人，真正发生的是某种 cultural change？我们该如何理解这些数据告诉我们的东西？

对。大约 50,000 年前，或者也许是 100,000 到 50,000 年前，culture 的变化速度加快了。你会看到最早的大规模 representational art，比如珠饰项链、墙上的绘画等等。同时 innovation 的速度也迅速提高，人们使用的工具类型也发生变化。所以一种想法可能是，群体中发生了某种 genetic switch，某种重要的 genetic change，并且它扫到很高频率，突然间所有人都有了，或者很快都有了，于是让人们能够做这些事。也许是某些 genes 让人们拥有 complex language，比如 representational language。于是我们在 2016 年 Shott-Malick 及同事的这篇论文中做的一件事，就是在 DNA 中寻找可能呈现这种模式的位置：今天所有人，或者几乎所有今天的人，在这些位置共享一个共同祖先，时间可能是 100,000 或 200,000 年前。我们非常仔细地寻找，在所有能查看的 DNA 范围内，都找不到任何比 400,000 或 500,000 年前更近的东西。这是一个很夸张的结果，因为看起来，在这个作为今天所有人共同祖先的时期，并没有发生关键的 selective sweeps。我们之前谈到，Europeans 和 East Asians 之间没有 selective sweeps，但在这个非常重要的时期，也就是 material culture 记录中出现大量证据的时期，甚至似乎也没有所有人类共享的 selective sweeps。所以这一时期可能存在 biological adaptation，但它是 polygenic 的。许多 mutations 都朝同一个方向移动，帮助群体走向新的 set point，但在这一时期没有关键的 biological change 上升到高频率。

而这个 50,000 年前的群体，是所有走出 Africa 的人的祖先，还是也包括一些 Africans？

所以这是 100,000 到 50,000 年前的事。这个群体是西非人大多数、东非人大多数以及所有非非洲人的祖先群体。非洲还有一些群体，其相当一部分祖源来自分化更早的群体。例如，南部非洲的 Khoisan，或中非雨林 hunter-gatherers（狩猎采集者），其祖源中有相当比例来自大约 200,000 年前就与其他谱系分化的群体。但今天所有这些群体都能够上大学，能够做其他人能做的一切。所以，没有证据表明某些群体缺少某个关键 mutation（突变），而其他群体拥有它。

所以，我们在不同人群之间看到的差异，尤其是如果这个 50,000 到 100,000 年前的人群规模非常小——我记得上次我们讨论时说大概是 10,000 人量级。

对。

基本上，世界上所有人，或者几乎所有人，今天不同人类之间看到的 variation（变异）都潜伏在这个群体之中。这一点似乎……我理解你的意思，也就是说，如果你把 genome（基因组）中不同位置上的不同因素叠加起来，叠加后的确会产生很大影响。但有意思的是，今天世界上有这么多不同群体，而所有这些 diversity（多样性）都来自一个非常小的人群。

我想，人类 genetics（遗传学）领域的很多人会认为，我们的人群内部包含了塑造几乎任何 trait（性状）所需的“材料”。根据环境条件或 selection（选择）条件的不同，这些性状的平均值会朝不同方向移动。这里有一个 empirical（经验性）问题，也是真实的问题：在不同人类群体中，随着时间推移到底发生了多少 selection。我们参与的一项新工作正在显示，至少在世界这个地区，在过去 18,000 年、10,000 年、5,000 年中，至少有少数重要性状确实发生了显著移动。

我们研究了 500 多个 traits。

其中大约 100 个 complex traits（复杂性状）在这段时间里呈现出系统方向上的显著移动。所以看起来确实存在一种对人们所处环境的 response（响应），而且这种响应在这一时期发生了，并且可能比更早时期更强。

Crusoe 有一支很强的 ML infra 团队，他们不断找到巧妙的方法，从硬件中挤出更多性能。

例如，tokenization 已经成为 Agentic workloads 的一个真实瓶颈。Agentic prompts 往往非常长。它们通常有很高的 KV cache hit rates，这会缩小 GPU 的 prefill 工作量。这意味着传统上顺序执行的 tokenization 步骤，在 time to first token 中占据了更大比例。为了解决这个问题，Crusoe 构建了 FastTokens，这是一个开源、基于 Rust 的 tokenizer，它通过并行化来利用现代 CPU 上的所有 cores。Crusoe 在这里必须采用更有创造性的做法，因为朴素方法行不通。例如，在 pre-tokenization 阶段，你不能只是把文本切成 chunks 然后运行 regex，因为一旦某个词横跨切分边界，就会出问题。Crusoe 的解决办法是给每个 thread 一个 authority zone，同时允许它读取自身边界外 1 kilobyte 的内容。这个 1 kilobyte buffer 保证你不会错误处理 token，而 authority zone 保证不会产生重复。无需跨 thread 协调。Crusoe 将这项优化与其他几项聪明的调整结合起来，使真实 production workloads 上的 time to first token 最多提升 40%。想了解更多，请访问 crusoe.ai/thorcache。

我们前面谈到过，50,000 年前的人类和今天的人类之间没有固定差异。所以，如果让人类拥有更多 symbolic representation（符号表征）、发展农业等等的那类能力没有遗传基础，我想我上次跟你聊时也问过这个问题，但在这个语境下尤其值得问：为什么 Ice Age 之前没有农业？从 genetics 上说，我们已经具备条件了。

这是个非常有意思的问题。对，从 genetics 上说，我们已经具备条件。50,000 年前的共同祖先群体已经拥有农业所需的所有要素。而这些人分布到世界不同地区，比如 Americas 大概 15,000 年前，或者不管准确时间是多少；New Guinea 40,000 年前；East Asia、Europe、West Africa，但在 12,000 或 11,000 年前之前都没有农业出现。农业只在过去 12,000 年里发展出来，也就是被称为 Holocene 的时期，大致是 Ice Age 的结束阶段。如果你和 climate scientists、archaeologists 交流，我每次遇到这方面专家都会问这个问题：农业怎么会在这些地方都发展出来？我们真的生活在如此不同寻常的时期吗？人们告诉我，确实如此，从 2 million 年的尺度来看，我们生活在一个非常不同寻常的时期。也就是说，12,000 年前，我们进入了一个不仅温暖而且 climate stability（气候稳定）的时期，而这确实是真的。我们很难相信自己生活在这么特殊的时期，但如果你看一些数据，比如池塘底部的数据，可以用 isotopic signatures（同位素特征）测量温度波动，显然我们所处的时期，年与年之间、10 年与 10 年之间、100 年与 100 年之间的波动都小得多。这就是一个相对稳定的时期，而我们近乎偶然地生活在其中。当这个相对稳定的时期出现时，不知怎么地，多个群体就独立转向了 agriculture（农业），尽管他们的 genetic complement（遗传组成）是一样的，而这种遗传组成在 50,000、100,000、200,000、300,000 年前就已经出现了。这是一个有点疯狂但被人们接受的观察结果，可它确实让人难以置信。

所以你把时间范围扩大了。你说 100,000、200,000、300,000 年前。根据现代人与现代人之间的遗传差异，以及现代人与甚至 300,000 年前人群之间的遗传差异，你基本上认为，300,000 年前他们就已经是现代人了吗？

我不知道。我现在一直在想这件事。事实上，这正是我现在在认真思考的问题。300,000、400,000 年前，人类文化发生了一次重大转变，也就是 Levallois technology 的发明：能够从石核上制作石器。这被称为 Middle Stone Age Revolution，或者在非洲和欧亚大陆语境下叫 Middle Paleolithic Revolution。它是一场革命，一种新的石器制作方式，为 Neanderthals 和现代人类所共享，但并未在 East Asia 或 South Asia 出现。这是一个重大变化，而且大概需要某种认知变化，才能制造出这类技术。随后又有一次向 Upper Paleolithic、Later Stone Age 的转变，时间可能在 100,000 到 50,000 年前，当时出现了第二次工具制作方式的转变，但没有前一次那么革命性。所以认知飞跃到底发生在什么时候并不清楚。通向今天人群的谱系分化，比如 Khoisan Southern Africans 和雨林狩猎采集者，大致发生在 300,000 或 200,000 年这个时间尺度上。而这些人都能够上大学，也能做各种事情。所以并不明显的是，所有工具包——认知工具包、行为工具包、遗传能力——是否在 200,000 或 300,000 年前就已经全部具备，甚至 Neanderthals 也已经具备。因此不能明显排除这种可能。我就是不知道。你可以想象，这些人是从 200,000、300,000 年前发生的那次分化中延续下来的，他们被分布到世界不同地区。然后，砰，12,000 年前之后，农业开始在不同地方出现。这可以说是人类历史中一个非常突出的谜题。我觉得难以相信的是，我们生活的这个时期在气候上竟然在 2 million 年尺度上如此独特，但我的同事告诉我这是真的。

关于气候的解释听起来有点意外，因为农业是在许多非常不同的环境中独立发展出来的。我理解不同环境之间的波动可能下降了，但如果它只是在某一个地方、某一个时间发生，我还能接受这个解释。可事实是 New World 有人种 maize，Old World 有 cereals，等等，而且是在非常不同的环境中，这就让人觉得意外。

这确实非常、非常意外。我觉得我们接受了这个事实，但这其实是一个很反常的观察，只是大多数普通人没有意识到。基本上所有人都接受的一点是，除了雨林狩猎采集者和 Khoisan 之外，世界上几乎所有人的共同祖先人群大约生活在 70,000 年前；而且所有人也都接受，这些人已经具备了农业革命以及建立国家社会所必需的认知、行为和智力要素。因为这些人的后裔后来分布到 West Africa、East Africa、Americas、Europe、South Asia、East Asia、New Guinea 等地之后，他们的后代都独立地、半独立地、完全独立地，或者可以证明为完全独立地，在这些不同地区做出了这些事情。所以完成这些事所需的认知资源必然早已具备，但这是一根很长的引信。祖先人群分裂之后，在所有这些不同地方，它延迟了 40,000 年、60,000 年，然后才点燃，变成农业以及之后的各种东西。这是一个有点离奇的主张。然后你还可以争论真正的引信是不是长达 300,000 年，也就是从 Neanderthals 分离，或者从现存现代人类不同谱系分离开始算。这也说得通。所以我们被要求相信的是一整套相当奇特的事情。

有没有可能农业曾经存在过，但他们没有现代冶金，或者说没有某种让人口从 5000 BC、Bronze Age 开始爆发式增长的东西？因为从人口上看，10,000 BC 到 5000 BC，也就是早期 Neolithic，似乎并没有发生太多事情。也许他们有农业，但没有 copper，没有 tin；而要发展出文明，我猜你需要去 Middle East 才能获得这些。也就是一种能够大规模利用 bronze 的文明。所以这些农业社会最后只是从历史记录中消失了？

我认为我们会在考古记录中看到它们。而且 Americas 的那些非凡发展完全属于 Stone Age，如果它们后来彻底消失了，我们今天也会看到遗迹。是的，比如说，我们应该去 Mexico 的 Teotihuacán 走一趟。那里非常壮观。我 20 岁去那里的时候，感觉它完全不逊于 ancient Egypt。它规模巨大，非常宏伟，而且没有金属。

而且它更让人震撼，因为它不仅没有金属，还没有役用动物，也没有轮子，这很不可思议。奇迹就在于那些东西是在没有轮子的情况下搬运的，对吧？

对。随便找一个有 Old World 优越感的人，把他带到这些地方，他就不会再有这种感觉了。这些地方的遗存非同寻常。而这些人的祖先至少在 20,000 年前就和 East Asians 的祖先分开了，40,000 年前就和 West Eurasians 的祖先分开了。从那之后，他们拥有同样的 biological、cultural 共享工具包，但中间就是有一根很长的引信，延迟了很久，直到这些事情全部发生。这其实是一件很了不起的事，而我们却很少质疑它。

你还有哪些问题？也就是说，你现在正在研究，或者想要研究的，还有哪些关于人类历史大图景的问题？

我觉得我——

我是说，我很困惑。

我不确定我们之前是否谈过这个，但我一直对 archaic humans（古人类）和 modern humans（现代人类）之间的关系非常困惑。我们现在已经有了生活在欧洲、西欧亚和中欧亚的 archaic humans 的 genome sequences（基因组序列），也就是 Neanderthals。我们也有来自这些神秘 Denisovans 的 archaic sequences；自从我们上次谈话之后，现在已经有了他们的骨骼。现在有一个 skull 被证明属于 Denisovan。我们还有大量 modern humans 的数据，而这些群体之间的关系仍然存在很大的谜团。从遗传学上看，Denisovans 和 Neanderthals 是姐妹群体。它们来自 500,000 或 600,000 年前的同一个祖先群体。而这个群体又在更早几百千年，也就是 700,000 或 800,000 年前，从 modern humans 的共同祖先中分化出来。所以从全基因组数据来看，Neanderthals 和 Denisovans 是来自同一个 archaic 祖先群体的 archaic humans。但 Neanderthals 和 modern humans 之间共享了很多东西，而这些东西似乎并没有与东亚人共享。它们都使用 Middle Stone Age 石器、Levallois technology，这是一种在认知上很独特的石器制作方式，而这种方式在东亚没有被使用。它们还拥有相同的 mitochondrial DNA 和 Y chromosome sequence。所以 Neanderthals 的 Y chromosome sequence、Neanderthals 的 mitochondrial DNA，其实是 modern human 的。这是 200,000 或 300,000 年前通过 interbreeding（杂交）进入的，随后频率迅速上升到 100%。而且 Neanderthals 和 modern humans 都是 300,000 或 200,000 年前 archaic humans 与 modern humans 之间 mixture events（混合事件）的产物，这一点可以通过 ancient DNA 和 modern DNA 中的 variation patterns 明确证明。因此感觉上，Neanderthals 和 modern humans 之间似乎共享了某种东西，而这种东西没有与 Denisovans 共享，尽管全基因组投票的结果显示 Denisovans 和 Neanderthals 关系更近。所以人们会想，是否存在某种将 Neanderthals 和 modern humans 联系起来、但不同于 Denisovans 的东西，尽管从 genome-wide 的角度看，Denisovans 和 Neanderthals 聚在一起。

所以我现在一直在想这个问题，而这种联系可能是 interbreeding events，或者是它们曾经在同一时间、同一地点出现，只是我们漏掉了。

已知有一次 interbreeding event，是从通向 modern humans 的谱系进入 Neanderthals，但据说只占 5%。所以我感兴趣的是，这 5% 实际上是不是某种影响更深的迹象。也就是说，Neanderthals 在某种意义上、某些方面其实非常 modern，尽管它们被 archaic genes 淹没，但不知为何，它们实际上受到的 modern 影响比我们想象的更大；而它们与 modern humans 共享的 Middle Stone Age，以及你可以称作 Middle Paleolithic revolution 的东西，在某种意义上可能比我们以为的更根本地构成了它们自身的一部分。

有意思。抱歉，这次 interbreeding event 是什么时候？

300,000 到 200,000 年前。

所以 Neanderthals 和今天大多数活着的人之间的 common ancestor，可能比今天所有活着的人之间的 common ancestor 更近。

当然。

是的，这很离奇。

是的，不过，所有 archaic humans，包括 Denisovans，与我们的 divergence，其实都在人类 variation 的范围之内。

好，可是，等等，什么？

是的。任意两个人类基因追溯到 common ancestor 的平均时间，是 1 或 2 million 年前。比如你看你从母亲那里得到的 DNA 的任意一段，再看同一条染色体上同一段 DNA，也就是你从母亲那里得到的 chromosome 3 的拷贝，以及你从父亲那里得到的 chromosome 3 的拷贝，它们共享 common ancestor 的典型时间是 1 或 2 million 年前。这早于 Neanderthals 和 Denisovans 的分化。所以在你的 DNA 中有很多位置，你在母系一侧与某个 Neanderthal 的关系，比你与你父亲的关系更近。

我相信这里有一个简单解释，但这是怎么回事？

这和一个道理类似：如果你有一个姐妹，在你 DNA 的某些位置上，你和她的关系比和我的关系更近，因为你们共享父母。但在另一些位置上，你和我的关系可能比你和你姐妹的关系更近，因为你们碰巧没有从父母那里继承到同样的 DNA。这是一个过程。只是我们从共同祖先群体那里继承来的 DNA，本身就已经相当多样。

我明白了。

500,000 年前、700,000 年前、1 million 年前就是如此。我们中的一些人来自其中某些祖先，另一些人来自另一些祖先。而 Neanderthals 与我们谱系的分化，在人类演化时间尺度上非常接近，以至于在我们 DNA 的某些位置上，我们与 Neanderthals 的关系比我们彼此之间的关系更近。

有意思。还有哪些大问题？

我想这是我最近思考最多的主要问题。除此之外，我仍然非常关注人类群体在世界各地扩散的问题，并试图用 ancient DNA 来重建这个过程。

录制结束后，David 在房间里的白板上自发开始解释他正在研究的一个关于 Neanderthal Saul Genetik 的新理论，我最后用 iPhone 录了下来。因为是白板内容，我想切换到 YouTube 或 Spotify 这样的视频平台可能会更有帮助；但如果不方便，只听音频也完全可以。

我最近一直在想一件事：也许我们对 archaic humans 和 modern humans 之间关系的理解方式并不正确。标准模型大致是这样的：Denisovans，这些通过 ancient DNA 发现的 archaic humans，以及 Neanderthals，大约在 500,000 或 600,000 年前来自一个共同的祖先群体；而它们与 modern humans，也就是我们这类人的祖先，可能更早一些，在 700,000 到 800,000 年前就分开了。这是 2010 年以来许多研究得出的重要结果。但也有证据显示，在大约 200,000 到 300,000 年前发生过 interbreeding 事件，而且实际上导致 modern humans 向 Neanderthals 的祖先贡献了 DNA。所以 Neanderthals 的 DNA 中可能有 5% 来自这次 interbreeding 事件。很多研究都显示了这一点。我对此很感兴趣，因为从考古记录来看，Neanderthals 和 modern humans 其实看起来相当相似，彼此之间的相似度远高于它们与 Denisovans，也就是东亚这些 archaic humans 的相似度。长期以来，人们认为 Neanderthals 是我们的姊妹群；但在 2010 年，Denisovan genome 的测序非常清楚地表明，平均而言，Denisovans 与 Neanderthals 的关系比与 modern humans 更近。这是一个很让人困惑的结果。现在大多数人认为，Neanderthals 和 Denisovans 来自一个共同祖先群体，而这个群体更早与 modern humans 的祖先分开。所以我感兴趣的是另一种可能性：也许理解 Neanderthals 的正确方式，是把它们看作某种意义上的文化上的 modern humans，尽管从遗传上说，它们大体上更接近 Denisovans。我在思考的这个模型，受到一个考古现象的启发，也就是所谓的 Middle Stone Age Revolution。假设这里是非洲，这里是欧洲，我们知道，一种新的石器制作方式在 300,000 或 400,000 年前开始出现，最早见于高加索，比如今天的 Georgia，或者东非。这种方式使用的石核经过非常仔细的处理，原料从远离使用地点的地方开采而来，采用 flint 这类高质量石材。这种石器制作方式相当具有变革性，在欧洲被称为 Middle Paleolithic，在非洲被称为 Middle Stone Age，并且与更广泛地使用火、以及比过去更远距离地移动石材有关。我感兴趣的是，这可能是非洲——

是 modern humans 和 Neanderthals 之间共享的东西。

这似乎是某种共同的文化特征，在东亚缺失；它可能与遗传数据中的某些现象有关，也以某种方式与这 5% 的 DNA 有关。我感兴趣的想法是：这里可能存在一个人群，他们发明了 Middle Stone Age 和 Middle Paleolithic，有时也叫 Levallois technology；这个人群中的一些人扩张到欧洲，并与当地的 archaic humans 混合。而这就是那次 5% 的 interbreeding 事件。它发生在 200,000 到 300,000 年前，并产生了一个群体。这个群体在欧洲这片区域扩张时，主要吸收了当地 DNA，在遗传上变得以 archaic 为主，但保留了 modern human culture，也就是制作石器的方式以及其中一些传统。

这里一个非常有意思的地方是，如果你看遗传学数据，看 whole genome，Neanderthals 和 Denisovans 会聚在一起。但如果你看 mitochondrial DNA，也就是人们从母亲那里继承、母亲又从她的母亲那里继承的 DNA，Neanderthals 和 modern humans 会聚在一起。所以如果看 mitochondrial DNA，Denisovans 和 modern humans 的共同祖先超过 700,000 或 800,000 年前，这符合我们对历史的预期。如果看来自父亲的 Y chromosome，Denisovans 和 modern humans 的共同祖先也超过 700,000 或 800,000 年前，这同样与这段历史一致。但如果看 Neanderthal 的 mitochondrial DNA，时间只有 300,000 到 450,000 年。如果看 Y chromosome，也只有 300,000 到 450,000 年。

因此，当前的遗传学研究实际上要求我们相信：尽管这只占 whole genome 的 5%，它却重新引入了 mitochondrial DNA 和 Y chromosomes，而且它们的频率上升到了 100%。这是一个有点夸张的说法，因为这种事情随机发生的概率很低，也许是 5% 乘以 5%，所以是一个非常小的数字。某种程度上，这也是我们现在都相信的解释，但它确实是一个很出人意料的事件。整个文献中的所有发现似乎都逐渐围绕这个解释累积起来，让我们说服自己相信它。但从基本原理上看，只有 5% 的贡献却同时引入 Y chromosome 和 mitochondrial DNA，似乎不太可能。

而实际情况看起来确实像这样。西班牙有一个地点提供了很好的数据，年代大约是 200,000 到 400,000 年前，更准确地说是在 300,000 到 400,000 年前，地点叫 Sima de los Huesos。他们有一个 nuclear genome，看起来像 Neanderthal，也就是 genome 的大部分如此，但他们的 mitochondrial DNA 和 Y chromosome 却像 Denisovan。所以这看起来很像是：有一个与 modern humans 相关的人群进入了类似 Sima de los Huesos 的人群，替换了它的 mitochondrial DNA 和 Y chromosome，但保留了其 genome 的其余部分。因此，这确实像是发生过类似的事情。

我现在在思考的想法——当然，也可能是错的，谁知道——是存在这样一片区域。它也许是欧洲，你可以把它分成大约 100 个 deme，也就是小区域；modern humans 从右下角进入，比如从 Middle East 一带，然后向欧洲扩散。随着这个人群扩散，会形成一个扩张的 wavefront，他们与当地的 archaic humans 互动。即便 interbreeding 的量很小，许多研究、simulation，以及对哺乳动物、鸟类等不同物种的大量研究所形成的理论都显示：当一个群体入侵或扩张进入另一个群体占据的领地时，只要存在少量 interbreeding，就会出现大量 local genes 的 introgression。也就是说，wavefront 上的这些先驱者有时会与当地人群 interbreed。由于周围当地人太多，他们的 DNA 会被当地群体淹没。所以等他们抵达另一侧时，他们在很大程度上已经变成当地人了。

因此，也许我们看到的正是这一过程。比如有一个 modern human population，它可能是 matrilineal 的，也就是说，以这种方式制作石器的知识是从母亲传给孩子的，因此他们保留了 mitochondrial DNA。但等他们到达欧洲另一端时，他们在遗传上已经主要是 archaic，主要是当地的 archaic。所以最终出现的是 95% 的 population replacement。这样就可以解释为什么 Neanderthals 和 modern humans 共享 mitochondrial DNA，也可以解释为什么混合比例只有 5%。

但真正有意思的是，来自 modern humans 研究的其他证据显示，modern humans 其实也是 admixed。正确的理解方式可能是：modern humans 是两个群体的混合，也许它们在 1.5 million 年前分化，并在 200,000 到 300,000 年前重新汇合，其中大约有 20% ancestry 来自这个 archaic African group，80% ancestry 来自这个 early modern lineage。然后同一个群体又与 Neanderthals 混合，在这里是 5% modern、95% local。也就是说，实际上存在一个关键人群，创造了 Middle Stone Age，或者说 Levallois technology；这个人群出现在这里，并在 200,000 到 300,000 年前向各个方向扩张：向欧洲这里扩张，向非洲这里扩张，带来了这项技术，带来了这些新想法，也可能带来了一些遗传适应。

它扩张进入欧洲的 archaic humans，与当地人群混合。它有 95% 被替换，但仍然保留了自己的文化特征，也可能保留了一些遗传特征。它也向非洲扩张。在这里，它没有被替换 95%，而只是被替换了 20%。原因很可能是，这个群体分化得更深得多。它是 archaic，而且 archaic 程度更高；它的分化时间是 1.5 million 年，而不是 700,000 到 800,000 年。因此，在遗传上存在更多不相容，也有更多 gene flow 的障碍，但仍然有相当多的混合，也许是 20%，而且我们有证据表明这里发生过一次大规模混合。

所以你实际看到的是一次 modern human expansion，同时进入欧洲和非洲。在一个地方，它形成了 Neanderthals；在另一个地方，它形成了今天所有人的祖先。但所有这些群体都源自这里发生的这个关键的、某种意义上具有转折性的事件。我们经常谈论 50,000 到 100,000 年前的那些转折性事件，比如更具象征性的行为等等，它们似乎最早出现在非洲和 Middle East，然后向外扩散。但也存在这个更早的事件，而且这个事件大致与今天非洲内部不同群体的分化同时发生，比如 Khoisan Southern Africans 和 Central African rainforest hunter-gatherers。所以人们会想，这是否也是一个同样重要的形成性事件。

如果这是真的，它也会让你以不同方式看待 Neanderthals：他们实际上在某种意义上是我们的 cousins。他们共享我们的 Y chromosome，共享 mitochondrial DNA，共享这个 200,000 或 300,000 年前事件的形成过程，也共享 toolkit。所以，尽管 genome 告诉我们，他们是 Neanderthal-Denisovan 这一支的 cousins，但也许在一个重要意义上，真正正确的理解方式是把他们看作 modern humans 的亲缘者，或者 close cousins。

我有太多问题了。你还有 15 分钟吗？有。

好的。

首先，1.5 million 年前这个 archaic Africans 群体到底是怎么回事？他们在非洲的什么地方？那些没有形成 modern humans 的部分后来怎么样了？他们存活下来了吗？

遗传数据表明——这不是对任何古代 DNA 的分析，而只是对不同人群的现代 DNA 的分析，主要是在非洲人群中，也包括非非洲人群。多项研究——

至少有 3 项，也许有 4 或 5 项我知道的研究——

研究了当今人群中的变异模式，并认为现代人群的数据，包括非洲人群在内，并不符合一个同质人群的模型。它看起来像是一个在一百多万年前分裂成多个群体的人群——至少 2 个，也可能是很多个——然后在几十万年前发生了一次重要的汇合。不同论文拟合的模型不一样，但都有这个特征：一百多万年前发生分裂，大约几十万年前又发生汇合和重新混合事件，形成了解剖学意义上的现代人的祖先。

这也包括 Khoisan 以及其他那些群体吗？

是的。

好，明白。

所有这些群体都有这种情况。也许比例略有不同。所以你会问，这些人当时住在哪里？谁知道呢，对吧？在这个情景里，80% 来自 Caucasus 或 Northeast Africa，那里出现了这种 Middle Stone Age 形式——来自形成 Middle Stone Age 的这个人群。Middle Stone Age，然后他们和本地群体混合。他们在哪里，谁也不知道。Southern Africa、Western Africa、Central Africa、Eastern Africa。我们没有任何 ancient DNA，但这是一个非常丰富的环境。

人类在那里生活了至少大约 7 million 年。

各地都会有不同的人群。可能不只是两个群体，可能有更多群体。我认为这里的重要主题是，有证据显示一百多万年前就已经存在群体内部结构；而这个地方会是一片充满 archaic humans 的景观，他们与这些扩张中的人群有不同程度的亲缘关系，并且当这些人群经过时，会与他们发生 admixture。

好，所以 Neanderthals 第一次，大约 300,000 年前，我们的祖先和他们共享文化，分享 Middle Stone Age 技术，但并没有替代那个人群。基本上是技术通过文化传播开来。

不过，它也通过基因传播。如果你看印度的 Yamnaya，印度几乎没有 Yamnaya。

什么？

我的意思是，它只是不断被稀释、稀释、再稀释。

当 Yamnaya 扩张到 Central Asia，就像扩张到 Europe，并形成 corded ware，会有 25% 的稀释；它又回到 Central Asia，穿过 Hindu Kush，进入 northern South Asia，又与当地人进一步混合。到今天，你在印度能看到的最高 Yamnaya ancestry 也就是 20% 或 10%，多数人低于 10% 或 5%。

明白了。

这一路上发生了大量混合，但它是 tracer dye，对吧？它追踪的是 Indo-European languages，而 Indo-European culture 的重要方面是通过 Yamnaya 传过来的。所以如果你知道该看哪里，这个 tracer dye 只有 10%，只有 5%，在某些群体里只有 2%，但它对应的是人们所说的语言，也对应着重要的文化共享元素，把他们和 Indo-European-speaking world 另一端的人连接起来。所以这 5% 不能轻视，对吧？它追踪的是重要的东西。而在这个模型中。

我还理解到，如果事物更多是通过女性传播，那么其实——抱歉，我往回说一下。我不明白为什么 maternal DNA、mitochondrial DNA 和 Y chromosome 在传播过程中会特别占优势。你能解释一下吗？

我之所以谈这些 matrilineal 或 patrilineal expansions，是因为有一个事实一直让我很困扰，已经困扰了很多年，大概 15 年，尤其是过去 3 或 4 年：mitochondrial DNA 和 Y chromosome 会把 Neanderthals 和 modern humans 聚在一起，但基因组的其他部分会把 Neanderthals 和 Denisovans 聚在一起。这是一个非常反常的结果，在其他物种中看不到这种模式。所以我很感兴趣的是，什么样的模式可以解释它。如果你提出并假设存在某种 matrilineal 或 patrilineal expansion，两者都可能，在 modern humans 扩张穿过 Europe 景观时，他们沿着其中一条谱系保留了自己的身份。比如，如果你吸纳一个本地的——

如果是 matrilineal，当他们吸纳本地社群中的男性时，这些男性被带入社群，孩子由——

按照母亲的文化之类的方式抚养。或者如果是 patrilineal expansion，他们吸纳社群中的女性，这些女性被纳入进来，孩子某种程度上按照父亲的文化抚养。如果发生这种情况，就能保证基因组中这两个部分之一呈现出我们看到的样子，因为这是 modern human expansion。

如果是 patrilineal，就会保留 Y chromosome。

如果是 matrilineal，就会保留 mitochondrial DNA。所以它会解决两个问题中的一个。

但不能同时解决两个。

解决不了另一个。所以你还需要解决另一个。另一个可以通过 natural selection 来解决，也可以通过 social selection 来解决。顺便说一句，在人类社群中，patrilineality 和 matrilineality 是常态，而不是例外。社群通常会沿男性或女性谱系保持连续性。通常是 patrilineality，有时是 matrilineality。所以也可能有 social selection 这类现象。也就是说，可能一旦某人的孩子来自，比如父亲来自外部社群，那么这些孩子中的男性——通常在大多数社群里，女性都会繁殖。

这在今天也很典型。

通常女性只要可以就会生育，但在传统社会中，男性的繁殖成功率差异很大。很大一部分男性从未有孩子。然后有一小部分男性会有很多孩子。

是的。

和很多女性。

所以男性之间存在生育竞争。在这种男性争夺接触女性机会的背景下，女性择偶开始成为一个重要过程。于是就可能出现这样一种现象——

如果你是——

如果你的父亲是 archaic male，那么你在争夺本地女性时，可能就不会像父亲是 non-archaic male 那样成功。像这样简单的社会现象就能解释这些数据。我们实际上也在人类社会中看到过这种情况。比如，如果我没记错，在 Central African rainforest hunter-gatherers 中，男孩和女孩会因其父亲或母亲属于这个群体还是另一个群体而受到不同对待。

我想我还是不明白 maternal 的部分。比如说，一个群体扩张，到了下一个前沿地带。

是的。

然后他们生孩子，其中一些孩子是，好吧，来自刚进入这里的那群人，也就是 humans，他们的孩子会从这些 humans 那里获得 maternal DNA、mitochondrial DNA。

是的。

但来自原有人群的孩子，会带有 archaic humans 的 mitochondrial DNA。

是的。

那为什么带有 archaic mitochondrial DNA 的人没有存活下来？

所以这是一个问题。可能有多种解释。

但解释这一点，比同时解释 mitochondrial DNA 和 Y chromosome 要容易得多。

一种可能是 mitochondrial DNA 在生物适应度上较低。另一种可能是，人们会根据父母是 archaic 还是 modern 而受到社会性歧视。

有意思。

我觉得放在人类社会的语境里，这一点完全不意外。怎么了？

好，那 Neanderthals——

这是这个论证里最薄弱的一环。这个论证很可能是错的，我只是告诉你我正在想什么。

好，那 Neanderthals……也就是说，300,000 年前，我们这一支系和他们发生互动，但主要是他们的支系存续下来，并且发生了文化扩散等等，也有基因扩散。然后是在 70,000 年前我们再次互动吗？

是的。

然后他们没有存续下来。

genetic ancestry 没有存续下来。

genetic ancestry 没有存续下来。可以推测，在 300,000 年前到 70,000 年前之间也有其他接触。

很可能。

是的。

但问题是——

但这些是我们目前能检测到的。

是不是可以说，其实没有真正的答案，只是偶然性：为什么有一次会发生这种扩散，archaic genome 大部分存续下来，而另一次却是完全替换？

我觉得在这个语境下，这完全不意外。比如，如果你看这个模型，或者想想这个模型，这是 700,000 或 800,000 年前。这是 300,000 年前。

——对吧？

所以中间大约相隔 400,000 年。你之前跟我谈到 Batya 那篇论文。那是两个相隔 70,000 年的群体。West Africans 和 Europeans 之间没有生物学不相容，也不存在针对生物学不相容的 natural selection。所以我们知道，当 Neanderthals 和 modern humans 相遇并混合时，确实存在生物学不相容。那是在 700,000 年前。因此，随着群体之间的距离拉大，生物学不相容会很快发展起来，可能与分离距离的平方成正比，因为你需要成对相互作用的基因，所以是分离距离的平方。这里，这个支系和这个支系之间可能只相隔 400,000 年。这里则大概是 1.2 million 年。差别很大。所以这些群体已经接近无法生育后代的边缘了。因此这是相当不同的人群。实际上，这些之间的距离比这些近 3 倍。你知道，如果看今天人类的混合，在今天的 Southern Africa 就有一些混合，群体之间的距离大约是这个的一半。比如看 Southern Africa 的 Khoisan 和 Bantu 人群混合，像 Xhosa，也就是比如 Nelson Mandela 所属的群体，这些群体相隔将近 200,000 年，是这个的一半，但完全兼容。也就是说，你看到的是一个在遗传上完全可渗透，或者几乎完全可渗透的群体。而这一组几乎肯定存在相当大的生物学不相容，因为在 300,000 年之后，200,000 或 300,000 年之后，我们看到 Neanderthals 和 modern humans 之间，或者 Denisovans 和 modern humans 之间发生杂交。到那个时候已经有明确的不相容证据了。有意思。但这里的差异会更大。

所以你预期会看到的是，随着这个群体扩散，他们会进入一个充满 archaic humans 的区域，会发生一些杂交，但孩子的适应度不高，会死亡，会有大量不育。

因此 gene flow 的障碍，或者说——

以及杂交的障碍会更大。

所以在我看来，这个群体进入 Eurasia 时，这里是 Eurasian archaics，也就是 Denisovans 的祖先，他们和这边这些人只分化了 400,000 年。而这里是 African archaics，他们分化了大约 1.2 million 年。所以他们就没有那么多杂交。因此你不会得到那么多、那么多、那么多的 gene flow。但关键是，这发生在同一时间。也就是说，它真的很像是来自某一地点的人群爆发式扩张的信号，他们在这里与人群互动，在那里与人群互动。同一种 cultural revolution 或 technological revolution 影响了这个地方，也影响了那个地方，并形成了某种都受到这场 cultural revolution 影响的群体；我们知道情况如此，因为他们共享同一套 toolkit。所以有些人认为 level 1 technology 是独立发明的，但这会是一种……也就是说，它们非常相似，而这可以解释它们为什么有同一个起源。有意思。于是有一条共享的文化线索，就是这套共享的 toolkit。还有一条 mitochondrial DNA、Y chromosome 的线索。然后还有一条时间上的共享线索，也就是它们都是通过混合形成的。

因为否则你就得相信 Neanderthals 独立发展出了 Stone Age tools。

是的，这并非不可想象，但有点像相信 farming 在世界多个地区独立发展出来一样，对吧？

但确实如此。确实是。是的。

所以正如我说的，这很可能是错的。我只是想告诉你，我们其实并不了解自己所处的世界。

是的。

而且，这并不是明显错误的。事实上，对我来说，它比我们目前通常写下来的那个模型要合理得多。它可能是错的，但它确实合理得多，能解释更多事情，而且并不更复杂。

有意思。你要不要重新概括一下你刚才说的那个类比，关于 Ptolemy 和 epicycles 的部分挺有意思的。

是的，我认为，我们共同建立起来的关于古人类与现代人类之间关系的模型，是随着时间逐步累积形成的。最初有一种看法，认为现代人类是独立的，而 Neanderthals 和 Denisovans 像是彼此的姐妹群。后来，我们陆续发现了更多混合事件，比如现代人类进入 Neanderthal 的基因流；还有一些我刚才甚至没有谈到，比如一个高度分化的谱系进入 Denisovans，以及其他各种情况。可我们仍然会说，整个基因组显示 Neanderthals 和 Denisovans 是姐妹群，所以这就是真相。于是我们把所有东西都拼接起来，让它们能够说得通。然后你看 mitochondrial DNA 和 Y chromosome，会发现它们呈现出一种奇怪的模式，虽然概率很低，但如果引入 natural selection 之类的因素，也能让它成立。所以你不断打补丁，构造出这些东西。这有点让人想到古代曾经发生过的事：当时有一种观念认为太阳围绕地球转，但它并不能很好解释行星的运动。为了让行星运动看起来正确，Ptolemaic 天文学家就提出了 epicycles，也就是一些额外的特殊旋转和运动，用来让一切大致符合观察。那是一个非常复杂的模型。后来 Copernicus 及其同事提出，其实发生的是万物围绕太阳运行，这就简化了问题，让事情变得简单得多。当时的情况是，随着天文信息不断积累，它不断与 Standard Model 相矛盾，但每一次都可以通过再增加一个复杂设定、再增加一个复杂设定、再增加一个复杂设定来让它勉强成立。这里的情况并不像提出万物围绕太阳而不是地球那样夸张，但它要简单得多。

而且实际上，它解释了很多很多事情。这个替代模型中，有什么地方是反直觉的、出乎意料的，或者让人难以接受的？人们在把它采纳为——

我不知道。现在没有人在思考这个模型。所以我也说不清。我只是觉得，对我来说，它显然是一个很自然的模型。

这里有一个类似之处。古希腊的 Aristarchus 提出过 heliocentric theory，因为他做了大量观察，关于地球到太阳有多远——或者说推导出了地球到太阳的距离，也注意到了其他现象。但这个理论没有被接受，因为他的雅典同胞会说：看，如果我们相信地球围绕太阳转，而我们又看不到恒星相对于地球的相对运动，那么唯一可能的解释就是恒星离我们远到难以理解、也不可信的程度。因此 heliocentric theory 被否定了。我想问的是，在这里，对应于“恒星必须远到不可想象”的那一点是什么？也就是说，事实上恒星确实非常远，也许我们应该接受这个理论所带来的那个看似不可信的推论。

这是个很好的问题。我认为，我们必须假定这个时期非洲和 Eurasia 的文化转型之间存在关联。而这并不是学界真正把它和 genetic data 放在一起考虑过的事情。所以我觉得，genetics 里有一条关于 Africans 内部 substructure 的线索，而另一方面又有一个基于 ancient DNA 的完整研究领域，但二者从来没有被放在一起。也就是说，没有人把如今已经相当丰富的现代人类 substructure 研究，与同样已经相当丰富的、基于 ancient DNA 的古人类和现代人类关系研究结合起来。如果你把它们放在一起，就会意识到它们在 substructuring 的时间上是对得上的。所以我不知道这算不算不可信；在我看来，它其实是更简约的解释。

是的，是的。

而且同样显得重要的是，在这个时期，不同人类群体都有能力采用 Stone Age technology。是的。一旦某个群体弄明白了，不同人类谱系之间的 genetic difference 并没有大到让你无法教会别人使用 stone tools。

这谁知道呢？我的意思是，它其实可能是由遗传驱动的。比如，我们之前谈过人类基因共同祖先的时间，在 100,000 年或 150,000 年这个时间点，并没有什么特别多的信号，但在 400,000 或 500,000 年前有很多。如果事情是这样：在 Caucasus，或者 Middle East 某地，或者 Northeast Africa，出现了某个 mutation，并且存在一些关键的 genetic mutations，使人们能够做到这件事；随后这个 population 扩张。当它进入 Europe 时，会被当地基因大量稀释，但这些基因可能因为 selection 而在扩张过程中被保留下来。所以也许你真正看到的是，确实发生了一些 genetic developments。关于这一点，大多数讨论一直集中在 50,000 到 100,000 年前的事件上，这被视为 anatomically modern human behavior。但我的很多 archaeologists 同事认为，在很多方面，这个事件至少同样重要，甚至可能更加重要。为什么这不应该是我们讨论的那个事件呢？

那么，我们知道你刚才谈到，现代人类和 200,000 年前的人类之间没有 fixed differences。50,000 年前也是如此。那么我们是否知道，50,000 年前的人群和 300,000 年前的人群之间，是否存在任何 fixed differences？

我认为，除了这些明显的 interbreedings 之外，我们现在谈的正是这个问题。也就是说，如果你看 300,000 或 400,000 年前的 genetic variation，那么确实会开始出现一些位置，在这些位置上，所有现代人类都共享 300,000 或 400,000 年前的共同祖先。

换句话说，也就是开始出现 fixed differences。

在这个时间深度上。

所以在那里，你开始看到可能存在 fixed differences 的证据。

基本情况是，如果每个人都共享一个 400,000 或 500,000 年前的共同祖先，那么在那个时间点就有一个单一祖先。如果你把它和另一个 population 比较，比如这些人，他们会来自另一个不同的 lineage。那么，发生在那个单一祖先之前的任何 mutation，都会成为一个 fixed difference。

是的。

所以，这就是你开始能够看到 fixed differences 的时间点。

但是 anatomically modern、cognitively modern 的现代人类，在 Middle Stone Age 开始时就已经存在了，而且那是在我们与这个古老的 Africans 群体发生繁殖，或者与 Neanderthals 发生繁殖之前吗？

Anatomically modern humans 正是在这里出现的。

是同一个时刻。

他们就是在这个时候出现的。那些骨骼特征像我们一样的人，以及 Neanderthals，正是在这个时候出现的。一切都是在这个时候发生的。所以这里存在一个断裂：一方面是 anatomically modern humans 的记录，另一方面是 behaviorally modern humans，后者是在 50,000 到 100,000 年前。但 anatomically modern humans 是在这个时期出现的，而且可识别的 Neanderthals 大致也是在这个时期出现的。

有意思，有意思。但我们并不知道，在 200,000 年前到 50,000 年前之间，究竟发生了什么，如果确实发生了什么的话，使得人类从单纯的 anatomical modernity 转向 behavioral modernity。

我的理解是，不知道。

你知道，考古记录里开始出现一些变化。在此之前，他们像 Neanderthals 一样，忙着制作 Levallois stone tools，持续了 200,000 年，而且从任何方面看都不比 Neanderthals 更突出。很有意思。至少按我的理解，在任何明显方面都是如此。然后，考古记录中开始出现某种加速：一些行为特征开始更快地出现。这些特征可能完全不是 genetic，也可能是 genetic。关于这一点有很多争论。人们很执着于这些东西，就像我们前面谈话里执着于 intelligence 一样；人们也执着于 art，以及那些在我们看来重要的东西。

但到底什么才重要，谁知道呢？是的，很有意思。

好的，谢谢你这段延伸说明。

我参与的研究一再表明，我带着偏见进入研究时往往是错的，这件事对我几乎有点创伤性。一次又一次，我带着对数据会显示什么的某种猜测进入一个项目，结果数据并不支持那个猜测。比如，当我参与 Neanderthal Genome Project，帮助分析 archaic Neanderthals 与 modern humans 的关系时，我所在的一组科学家此前已经确认：non-Africans 只是 African variation 的一个简单子集，没有任何证据表明 Neanderthal interbreeding 进入了 modern humans 的祖先，也没有其他 archaic interbreeding 的证据。我和更多其他人做过的不同分析都显示，non-African variation 只是 Africa 内部 variation 的一个子集、一个小样本，而且这足以完全解释数据。所以当我参与分析 Neanderthal DNA sequences 时，我发现了非常强的证据，表明 Neanderthals 与 non-Africans 的关系比与 Africans 更近。这非常出乎意料，我觉得这一定是个错误。我当时很难相信，认为它不太可能是真的，因为此前发现的其他证据似乎指向相反方向。因此，我花了几年时间试图让这些结果消失，我的同事们也是如此，但我们就是无法让这些结果消失。

它们反而不断变得更强。研究 natural selection 的经历也是一样。

我们当时的感觉是，或者说我们确信的是，在过去几百千年里，natural selection 在我们这个 species 中相当平静。因此，如果我们观察今天 non-African people 的 variation patterns，或者今天任何人群的 variation patterns，应该看不到太多 selection 正在发生。事实上，最早的 ancient DNA 研究也是如此，从 2015 年我们与 Ian Matheson 及同事参与的那篇论文开始，这些论文似乎确实显示，只有相对少数 genetic positions 与 natural selection 有关。2015 年，我们分析了大约 200 名 Europeans 和 Middle Easterners 的数据，试图理解 allele frequency 随时间的变化。我们把这些作为现代 Europeans 来源的古代人群与今天的 Europe 人群进行比较，观察那些频率差异大到不能用随机性解释的位置。我们很兴奋地发现了 12 个 positions，我们确信它们在今天 Europeans 中的 frequency 与根据我们和其他人识别出的、连接现代与古代 Europeans 的历史所预期的 frequency 之间存在高度差异。其中一些是已知的，另一些此前未知，这非常令人兴奋。我们希望随着样本数量增加、分辨率提高，我们能够更好地理解频率随时间的差异，也希望这会让我们能够检测到更多位置。但在随后十年里，令人相当失望的是，这并没有发生。比如，2024 年 Copenhagen 一个团队做了这类研究中规模最大的一项，分析了比我们 2015 年好得多的数据，但只发现了 21 个在时间尺度上 frequency 高度不同的 positions。虽然这也令人兴奋，几乎是我们 2015 年发现数量的两倍，但从很多方面看也令人失望，因为样本量和数据质量都提高了很多，最后却只发现了这些。这提示我们可能正在接近一个 asymptote，可能无法超越当前水平；而这种了解 biology 的方法在理论上很有前景，但实际产出可能并不高。也许 natural selection 确实很平静，我们之所以只看到这么少的变化，是因为 adaptive directional selection 实际上并不多。这就是我们几年前之前所处的局面，直到我们研究组由 Ali Akbari 领导开展了这项研究。

我们做的是引入几项创新或改变，试图提高检测 natural selection 的能力。其中之一就是向系统中加入大量数据。我们把数据量增加了大约 14 倍。这项研究的主要内容是报告约 10,000 个 individuals 的新数据。因此，相比文献中已有数据，这是一个非常大的增量。整个数据集包含约 16,000 名 ancient individuals，时间分布在过去 18,000 年。这是一个大型数据集，比以前可行的数据规模大得多。当你有更多数据时，就能更细致地估计 frequency changes。这些数据只来自世界的一个区域，也就是 Europe 和 Middle East。它并不比世界其他地方更重要，但由于历史原因，迄今 ancient DNA 文献中大概 70% 或 80% 的数据都来自这里。它为我们提供了一个 natural laboratory，让我们可以看到在同一个地方、随着环境变化，genome 随时间发生了什么。想象在世界其他地区做这种分析也非常有意思，comparative analyses 非常重要，也很有趣。但这项研究目前关注的是世界上这个数据尤其出色的地区。

我们做的另一件事，是开发了一套此前没有在这个领域使用过的全新 methodology。这套 methodology 基于一种在 medical studies 中用于寻找 disease risk factors 的技术。一个简单的解释是：我们询问，如何根据一个人与其他人的 relatedness pattern 来预测这个人的 genetic type。我们有一个约 16,000 名 ancient people 的数据集；如果把 ancient 和 modern people 都包括进来，总共有 22,000 人。然后我们观察这 22,000 人中每个人彼此之间的 relatedness，并根据与其他 22,000 人的 relatedness pattern，在 DNA 的 10 million 个 positions 上预测每个位置的 genetic type。接着我们问：如果假设 natural selection 在所有 geographic places、所有 times 都以同一个方向推动某个 mutation 的 frequency，这是否比只知道数据库中所有其他样本的 relatedness 更能稍微好一点地预测数据。也就是说，我们提出的 alternative hypothesis 是，selection 在所有时间都朝同一个方向作用；我们只是问，这是否能更好地解释数据。当然，这是一个很粗糙的假设，因为真实情况必然是 natural selection 的 frequency effect 会随时间变化。但我们问的是最简单的问题：假设 selection rate 恒定，是否比不作这个假设更能解释数据。

简单总结一下，确保我理解正确：你们是在尝试构建一个模型，用来预测 allele frequency 随时间的变化，对吗？这个模型有两个不同的部分，对吧？一部分是 genetic relatedness matrix，它捕捉不同 genome 之间有多相似。它应该能够捕捉不同 bottleneck、drift、population admixture 等因素的影响，也就是那些会影响整个 genome 的因素。对。另一部分则是：如果我们看具体位置，能不能说这个位置在一段时间内受到了某个 selection coefficient 的选择？如果我们加入某个 coefficient，它并不会比仅仅根据另一个 artifact 更容易预测 allele frequency 的变化；那个 artifact 只是看整个 genome，比如这些个体是不是属于同一类群，是否经历过相同的 bottleneck，是否经历过相同的 drift，等等。

完全正确。

好，那我们学到了什么？

当我们用这种方式分析数据时，我们查看了 DNA 中 1000 万个位点。在这 22,000 个人里，有 16,000 人是古代个体。我们想看的是，随时间推移，某个方向上的一致变化是否超过了偶然情况下的预期。分析数据后，我们发现 DNA 中有很多很多、数以百计的位置，它们随时间变化得太多，而且方向过于一致，无法用偶然来解释。这里有一个统计问题：要弄清楚到底有多少个这样的位点并不容易，因为它们分布得很密，彼此距离很近，会相互干扰。但如果我们尝试把它们拆开来看，比如在 DNA 的每个位置只计一个，屏蔽掉其他相邻信号，我们发现至少大约有 479 个位置在独立地朝同一个方向推动。这些位置我们有 99% 的置信度认为是真实的。按照另一种标准，也就是超过 50% 置信度认为是真实，我们认为大约有 3,800 个位置都在朝同一个方向推动。所以，考虑到我们此前的工作以及其他人的工作中，单次 scan 最多也只能发现几十个结果，这个数量可以说非常高。刚得到这个结果时，我们非常惊讶，觉得它一定是错的。接下来几年里，我们一直试图让这些结果消失，但它们反而变得越来越强。

因此，我们想寻找某种独立类型的证据，来判断这些位点是否真实。我们偶然发现了一个在这方面非常有力的办法，而此前还没有人以这种方式使用它。这个办法依赖于一个事实：我们有非常大量的发现，比如数百个甚至数千个。我们所做的是拿一个完全独立的数据集，也就是 genome-wide association studies 的语料库。这些研究是在几十万人中开展的，用来观察某些 genetic mutation 是否在高血压人群中比低血压人群中更常见，或者类似的问题。

我们使用了 UK Biobank，其中大约有 500,000 名来自英国的人，他们被测量了数百种 trait。这些人的 whole genome 都已经被测序。对于每一种 trait，我们都可以查看这 1000 万个位点中的每一个，是否以某种令人信服的方式与该 trait 相关。在这 1000 万个位点中，大约 15%，也就是 DNA 中约 150 万个位点，可以预测这数百种 trait 中的至少一种。

然后我们就可以提出一个问题：我们的 natural selection 信号，也就是我们的 statistic，是否与某个 mutation 会导致高血压或其他 trait 有关？于是我们把 natural selection 的 statistic 从低往高滑动，比如取值为 1、2、3、4、5。随着 statistic 提高，影响 trait 的 genetic mutation 的富集程度也越来越高。也就是说，在不使用我们的 selection statistic 时，比例只有 15%；而当我们要求 selection statistic 高于大约 5 时，会看到导致 trait 的 mutation 大约有 5 倍富集。

抱歉，这里的 selection statistic 是什么？这是我们用来衡量一个 mutation 是否随时间以显著的、非零的方式发生变化的 statistic。它可以近似理解为一个服从 normal distribution 的 statistic，也就是 Gaussian statistic，表示统计值距离 0 有多少个 standard deviation；其中 0 表示没有 natural selection。它并不完全等同于这个定义，但很接近。因此，如果这个 statistic 高于 5，我们会看到影响某个 trait 的 mutation 大约有 5 倍富集。也就是说，随机情况下影响 trait 的 mutation 约占 15%；而当我们把 statistic 往上调时，影响 trait 的比例会达到大约 60% 或 70%。这就提供了完全独立的证据，说明这些位点是真实的。而当 statistic 超过 5 后，就不会再有更多富集了。

我们对这些结果的解释是——我们也通过对整个过程进行 computer simulation 来验证并说明这些解释是合理的——一旦 statistic 高于 5，基本上所有 natural selection 信号都是真实的。

好。

为了确保我理解正确，你的意思是：为了判断哪些 allele 曾经受到 selection，你们的模型会给出某种 statistic，比如说，为了解释为什么这个 allele 具有特定的 frequency，我们给它一个 selection statistic。与此同时，我们独立地在现代人群中做这些研究，比如看身高、眼睛颜色、intelligence 或其他任何 trait，看看 genome 中哪些部分与该 trait 相关。你们研究中为了把 allele frequency 随时间变化解释为 selection 结果而赋予的 statistic 越高、统计显著性越强，那么 genome 中那个区域与某些可测量的 functional trait 相关的概率也就越高。

完全正确。这是 Ali 提出的一个很聪明的想法，而且——

这实际上放弃了传统做法，也就是给导致某种 trait 的 mutation 分配统计显著性；因为我们只是使用一个外部信息来源，也就是与用完全不同方式测量的 trait 之间的 correlation，来读出这些 mutation 为真实信号的概率。所以我们可以问：在给定某个 selection statistic 的情况下，真实信号的 enrichment 有多少？如果它达到 plateau 的一半，那么我们能够证明，正确解释是：50% 的 mutation 确实受到了 selection。如果它达到 plateau 的 3/4，那么这个 mutation 为真实信号的概率就是 3/4。如果它达到 plateau 的 99%，那它为真实信号的概率就是 99%。这就给了我们一个经过校准的估计：某个特定位置确实处于 natural selection 之下的概率有多大。这里一个主要担忧是，我们看到的其实并不是这些 mutation 真的处于 selection 之下，而是 disease association 和我们的 selection signal 都源于某个第三因素，这个因素同时导致了二者。那是一种 selection，但不是我们想研究的那种——不是为了适应新环境的 selection，而是所谓的 background selection，也就是针对新出现的有害 mutation 的 selection，这些 mutation 会被从群体中清除，而且往往集中在 gene 里。Gene 也正是 genome 中更容易与 trait 发生 association 的部分。因此，这个共同过程既导致了 trait signal 的 enrichment，也导致了我们观察到的 selection signal 的 enrichment。这就是问题所在。我们对此非常担心。所以我们做的是，把 enrichment analysis 在 DNA 的不同切片中重复了一遍，而这些切片都在同等程度上受到 background selection 的影响，也就是受到这种轻微有害 mutation 持续“降落”的影响；结果我们得到的 pattern 完全相同。我们又重复了这个实验，只使用频率相同的 mutation，因为在不同频率下检测这些 signal 的统计功效不同。我们看到的仍然是同样的 pattern：当 selection statistic 的值高于大约 5 时，就会出现这个 plateau。

所以，让你们能够把生成的 sequence 数量提高两个数量级的变化，只是你们用来识别哪一部分是 human DNA 的统计方法吗？还是说 2014 年到底发生了什么变化？2014 年以及之后呢？

这里其实有一系列改进。

我认为最重要的几个因素包括 sequencing 成本的大幅下降，这首先让生成 ancient DNA 成为可能。自 2000 年代末以来，成本下降了大约一百万倍；从 2010 年到今天，又大概下降了 1 到 2 个数量级。这是一个重大变化。另一个变化是 solution enrichment。也就是说，有一种方法可以处理 human DNA 占比很低的样本，但随后通过一个过程，使得研究者分析的大多数 sequence 都能用于分析。我们采用的方法是，取我们已有的 DNA 样本，其中大多数 human DNA 的比例都很低，低于 10%，经常低于 1%。这个比例太低了，以当时可用的技术，如果只是用 brute force sequencing 去测序，成本会高到难以承受。所以我们把这些样本放到一组人工合成的短 DNA fragment 上清洗，这些 fragment 靶向的是我们感兴趣、想要分析的 DNA 位置。这里包含超过一百万个位点，它们在人群中高度可变，而且我们选择其中很多位点，是因为它们在生物学上有意义。我们有一整套已知的 biological target，这些 target 会影响 genome-wide association studies 中的 trait。Genome-wide association studies 是人们用来观察现代人中是否存在特定 genetic variant，并判断这些 variant 是否对 phenotype 和 trait 有特定影响的方法。于是我们用这组人工合成的 DNA fragment 去“清洗” ancient sample，它们会结合我们靶向的 DNA 部分。最终生成的 sequence 对 genome 中那些能够提供历史信息的部分高度 enriched。即使只有 10% 或 1% 的 DNA 是 human DNA，最后也有很大一部分来自我们感兴趣的 genome 区域，于是这样做在经济上就变得划算了。

抱歉，那另外 99% 的 DNA 是什么？

主要是 microbial，也就是来自在人死后定植到人体上的 bacteria 和 fungi。根据死亡方式不同，这些 bacteria 和 fungi 的多少也会不同。所以通常从一个人身上 sequence DNA 时，里面会充满 microbial sequence。有时 microbial sequence 本身非常有意思，可能是导致这个人死亡的 pathogen。比如，关于 malaria、Black Death、hepatitis B 等不同瘟疫的研究就很出色，研究者通过死者牙齿和身体其他部位中的这些 pathogen sequence 获得了相关信息。但我们这里关注的是 human DNA。所以我们做的事情改变了可产生数据的规模，从每年几十个样本变成每年几百个样本。之后我们进一步把流程机器人化和工业化，使其达到每年数百个甚至数千个样本。仅在我们自己的实验室，我们每年就从超过 5,000 个个体生成 genome-scale data。我知道现在世界上其他几个实验室也是如此。数据量的这种巨大跃升，这种在某些情况下近似指数级、甚至超指数级的跃升，使得提出并回答问题成为可能。2010 年时，human genome sequence 的数量大概只有 10 个左右；而今年，已报告的 sequence 数量已经超过 20,000。因此这是几个数量级的增长。我们在 2014 年能够提出的问题，和今天能够提出的问题已经完全不同。

很好。太好了。David，谢谢你抽时间。

谢谢。

谢谢你，Dwarkesh。