Interconnects · Nathan Lambert

中国AI实验室内部笔记

Notes from inside China's AI labs

二〇二六年五月十二日 · 英文原文

摘要

从杭州到上海的高速列车上，作者观察中国AI生态系统。中国实验室在构建LLM时，文化上倾向于团队协作、减少自我意识，学生和工程师更愿意从事不显眼的工作以优化整体模型。与美国相比，中国研究者较少关注哲学性讨论，专注于技术实现。中国公司如美团、小米等自建通用LLM，拥有技术所有权心态。数据产业不发达，依赖内部构建。政府援助存在但细节不明。所有实验室渴望更多英伟达芯片。

从杭州到上海的新型高速列车上，我凝视窗外，欣赏着壮丽的山脊线，上面点缀着风力发电机，在夕阳的映衬下形成剪影。群山为广阔的田野和密集的摩天大楼提供了背景。我怀着极大的谦逊从中国归来。去一个如此陌生的地方却受到如此热烈的欢迎，这是一种非常温暖、人性化的体验。我有幸见到了许多在AI生态系统中素未谋面的人，他们以灿烂的笑容和欢呼迎接我，提醒我我的工作和AI生态系统是多么全球化。

Interconnects AI 是一份由读者支持的出版物。考虑成为订阅者。

中国研究者的心态

构建语言模型的中国公司，其定位是这项技术的完美快速追随者，这建立在长期存在的教育和工作文化传统之上，同时采用了略有不同的技术公司构建方法。当你审视输出结果、支持智能体工作流的最新最大模型，以及其构成要素——优秀的科学家、大规模数据和加速计算——时，中国和美国的实验室看起来大体相似。持久的差异体现在这些要素如何被组织和调节上。

我一直认为，中国实验室如此擅长追赶并保持前沿的原因之一是，他们在文化上与这项任务契合，但在没有直接与人交谈之前，我觉得自己没有资格将重大影响归因于这种直觉。与领先中国实验室中许多出色、谦逊且开放的科学家交谈后，我的许多信念得以明确。如今构建最佳LLM的很大一部分工作归结为对整个技术栈的细致工作，从数据到架构细节再到RL算法实现。模型的每个点都能带来一些改进，而将它们整合在一起是一个复杂的过程，其中一些杰出个人的工作可能需要被搁置，以利于整体模型最大化多目标优化。

美国的研究者显然也擅长解决各个组件问题，但在美国，为自己发声的文化更为浓厚。作为一名科学家，当你为自己的工作发声时会更成功，而现代文化正在推动成为"领先AI科学家"的新成名之路。这导致了直接冲突。有大量传言称，Llama 组织在将这些利益嵌入层级组织的政治压力下崩溃了。我听说其他实验室表示，有时需要花钱安抚一位顶级研究者，让他们停止抱怨自己的想法未能进入最终模型。无论这是否完全属实，其核心思想是明确的。自我意识和职业发展欲望确实会妨碍构建最佳模型。

中美之间这种文化上的微小方向性转变，可能对最终产出产生有意义的影响。这在一定程度上与谁在中国构建模型有关。所有实验室都面临一个现实：核心贡献者中有很大一部分是在校学生。这些实验室相当年轻，这让我想起我们在 Ai2 的架构，那里学生被视为同行，并直接融入LLM团队。这与美国的顶级实验室截然不同，像 OpenAI、Anthropic、Cursor 等公司根本不提供实习机会。其他公司如 Google 名义上有与 Gemini 相关的实习，但很多人担心你的实习会被隔离，接触不到任何实质内容。

总结一下文化的微小变化如何提升构建模型的能力：

更愿意为了改进最终模型而从事不显眼的工作，
新加入AI构建领域的人可以不受之前AI炒作周期的影响，从而更快地适应现代新技术（事实上，我交谈过的一位中国科学家非常积极地认同这一优势），
较少的自我意识使得组织架构图能够略微扩展，因为系统内的博弈行为减少了，
拥有大量适合解决已有概念验证问题的优秀人才，等等。

这种对构建当今语言模型所需技能的轻微倾向，与一个众所周知的刻板印象形成对比，即中国研究者往往产出较少的创造性、开创性、从0到1的学术风格研究。在我们此行访问的更具学术性的实验室中，许多领导者都在谈论培养这种更具雄心的研究文化。同时，我们交谈过的一些技术领导者对此表示怀疑，认为在短期内不太可能实现这种科学方法的重新布线，因为这需要重新设计教育和激励体系，其规模之大在当前的经济平衡中无法实现。

这种文化似乎在培养擅长LLM构建游戏的学生和工程师。当然，他们还有极其充裕的数量。这些学生告诉我，中国也发生了类似美国的人才流失，许多以前考虑学术道路的人现在打算留在工业界。最有趣的引述来自一位研究者，他原本有兴趣成为教授以接近教育体系，但评论说教育已经被LLM解决了——"学生为什么要跟我说话！"

学生们以全新的眼光看待LLM，这使他们受益。在过去几年里，我们看到LLM的关键范式从扩展MoE，到扩展RL，再到支持智能体。要做好其中任何一项，都需要快速吸收大量背景信息，既包括更广泛的文献，也包括你公司的技术栈。学生们习惯于这样做，并且乐于谦逊地放弃所有关于什么应该有效的预设。他们全身心投入，奉献自己的生命以获得改进模型的机会。

这些学生还如此神奇地直率，不受那些可能分散科学家注意力的哲学性闲聊的影响。当被问及他们对模型的经济性或长期社会风险的看法时，很少有中国研究者有复杂的观点和影响这方面的动力。他们的角色是构建最好的模型。这种差异很微妙，容易被否认，但当你与一位优雅、杰出的研究者进行长时间对话时，最能感受到这一点。这位研究者能用英语清晰交流，但当被问及AI更哲学层面的基本问题时，他会带着简单的困惑陷入沉默。对他们来说，这是一个范畴错误。一位研究者甚至在探讨这些领域时引用了著名的 Dan Wang 前提，即中国由工程师管理，而美国由律师管理，以强调他们构建的愿望。

中国没有像 Dwarkesh 或 Lex 这样的主流大型播客那样，能够系统性地培养中国科学家明星力量的轨道。试图让中国科学家评论由AI推动的即将到来的经济不确定性、超越简单AGI能力的问题，或关于模型应如何行为的道德辩论，都捕捉到了这些科学家的成长背景和教育经历（编辑注1）。他们非常专注于自己的工作，但在一个不鼓励对社会结构和变革进行辩论和发表意见的体系中长大。

放眼全局——北京尤其感觉像湾区，一个竞争激烈的实验室就在步行或打车短距离内。我下飞机后，在去酒店的路上顺便去了阿里巴巴的北京园区。然后，在36小时内，我们访问了智谱AI、月之暗面、清华大学、美团、小米和零一万物。用滴滴出行很方便，如果你在中国选择XL车型，通常会配到带有按摩座椅的电动小型货车。

我们向研究者询问了人才争夺战，他们说这与我们在美国经历的情况非常相似。研究者跳槽很常见，人们选择去哪里很大程度上取决于当前的最佳氛围。在中国，LLM社区感觉更像一个生态系统，而不是相互争斗的部落。在许多非公开的对话中，只有对同行的尊重。所有中国实验室都害怕字节跳动及其流行的豆包模型，这是中国唯一一个封闭的前沿实验室。同时，所有实验室都极其尊重 DeepSeek，认为它是执行层面研究品味最佳的实验室。当你与美国实验室成员进行非公开会面时，火花很快就会迸发。

中国研究者谦逊最引人注目的地方在于，他们在商业方面也常常耸耸肩，说那不是他们的问题，而在美国，似乎每个人都痴迷于各种生态系统层面的行业趋势，从数据销售商到计算资源或融资。

中国AI产业与西方实验室的差异（与相似之处）

如今构建AI模型之所以如此有趣，是因为它不仅仅是把一群优秀的研究者聚集在一栋楼里，创造出一个工程奇迹。过去可能是这样，但为了维持AI业务，LLM正变得集构建、部署、融资和推广于一体。领先的AI公司存在于复杂的生态系统中，这些生态系统提供资金、计算资源、数据等，以推动前沿发展。对于西方生态系统，以 Anthropic 和 OpenAI 为代表，这些创建和维持LLM的各种输入的整合已被很好地概念化和映射。因此，发现中国实验室思考方式的巨大差异，指出了不同公司可能对未来做出截然不同的押注。当然，这些未来可能受到资金和/或计算资源限制的严重影响。

我记录了与这些实验室交谈后得出的最重要的"AI产业"层面结论：

国内AI需求的早期迹象。 有一个广为流传的假设，认为中国AI市场会更小，因为中国公司往往不为软件付费——因此，永远不会解锁一个支持实验室的巨大推理市场。这只适用于映射到SaaS生态系统的软件支出，而SaaS在中国历史上规模很小，但另一方面，中国显然仍然有一个庞大的云市场。一个关键且未解答的问题——也是中国实验室自己争论的问题——是企业AI支出是跟随SaaS市场（小）还是云市场（基础性）。总的来说，感觉AI正趋向于云，没有人积极担心围绕新工具的市场增长。
大多数开发者是Claude的拥趸。 中国的AI开发者大多痴迷于Claude及其如何改变了他们构建软件的方式，尽管Claude名义上在中国被禁止。仅仅因为中国历史上对购买软件犹豫不决，并没有给我留下推理需求不会激增的印象。中国的技术人员如此务实、谦逊且积极主动——这一事实似乎比任何不花钱的旧习惯都更有力。一些中国研究者提到使用自己的工具进行构建，例如 Kimi 或 GLM 的 CLI，但所有人都提到使用 Claude 进行构建。令人惊讶的是，很少有人提到 Codex，而它在湾区显然越来越受欢迎。
中国公司拥有技术所有权心态。 中国文化正与蓬勃发展的经济引擎相结合，产生不可预测的结果。我始终有一种感觉，众多的AI模型反映了这里许多科技企业务实、当前的平衡状态。没有总体规划。这个行业的特点是尊重字节跳动和阿里巴巴，这些现有巨头凭借其雄厚资源有望赢得所有市场的很大份额。DeepSeek 是受人尊敬的技术领导者，但远非市场领导者。他们设定了方向，但并未在经济上做好准备去获胜。这使得像美团或蚂蚁集团这样的公司——西方人可能会惊讶于它们也在构建这些模型。实际上，它们显然将LLM视为未来技术产品的核心，因此需要一个强大的基础。当他们微调强大的通用模型时，这强化了他们的技术栈，以便从开放社区获得反馈，并且他们可以为自己的产品保留内部的微调版本。行业中"开放优先"的心态很大程度上是由实用性定义的——它有助于让他们的模型获得强有力的反馈，回馈开源社区，并赋能他们的使命。
政府援助是真实的，但规模尚不清楚。 人们经常断言中国政府正在积极帮助开放LLM竞赛。这是一个权力分散在多个层级的政府，每个层级对于自己具体做什么都没有明确的行动手册。北京的各个街区竞相吸引科技公司入驻。提供给这些公司的"帮助"几乎肯定涉及消除官僚障碍，如许可证，但能走多远？各级政府能帮助吸引人才吗？能帮助走私芯片吗？在整个访问过程中，多次提到政府的兴趣或帮助，但细节太少，无法断言或形成关于政府如何改变中国AI发展轨迹的自信世界观。当然，没有任何迹象表明中国政府高层影响了模型中的任何技术决策。
数据产业远不发达。 听到很多关于 Anthropic 或 OpenAI 为单个环境花费超过1000万美元，每年累计支出数亿美元以推动RL前沿的消息后，我们很想知道中国实验室是否从美国公司购买相同的环境，或者是否有镜像的国内生态系统支持。答案并不完全是没有数据产业，而是他们的经验是数据产业质量相对较差，通常最好内部构建环境或数据。研究者自己花费大量时间制作RL训练环境，而像字节跳动和阿里巴巴这样的一些大公司可以有内部数据标注团队来支持这一点。这一切都反映了前一点中"构建而非购买"的心态。
对更多英伟达芯片的渴望。 英伟达的计算资源是训练的黄金标准，每个人都因没有更多而受到进展限制。如果供应充足，很明显他们会购买。其他加速器，包括但不限于华为，在推理方面受到好评。无数实验室可以使用华为芯片。

这些点描绘了一幅截然不同的AI生态系统图景，快速将西方实验室的运作方式映射到中国同行身上往往会导致范畴错误。关键问题是，这些不同的生态系统是否会产生截然不同的模型类型，或者中国模型是否总是被解释为类似于3-9个月前美国的前沿模型。

立即订阅

结论：全球平衡

我在去中国之前对它知之甚少，回来后感觉才刚刚开始学习。中国不是一个可以用规则或配方来表达的地方，而是一个具有非常不同动态和化学反应的地方。文化如此古老、深厚，并且仍然与国内技术的构建方式完全交织在一起。我还有很多东西要学。

目前美国许多权力结构将其对中国的现有世界观作为决策的关键思维工具。在与中国几乎所有领先AI实验室进行过正式或非正式的面对面交谈后，我发现中国有很多品质和本能，很难用西方的决策模式来建模。即使直接询问这些实验室为何公开发布其顶级模型，所有权心态与真正的生态系统支持之间的交集也很难让我理清头绪。这里的实验室很务实，不一定是开源绝对主义者——并非他们构建的每个模型都会公开发布——但在支持开发者、支持生态系统以及将其用作了解自身模型的方式方面，有着深刻的意图。

几乎每一家中国主要科技公司都在构建自己的通用LLM，正如我们看到美团（配送服务）和小米（广泛的消费科技公司）发布开放权重模型。美国类似的公司只会购买服务。这些公司构建LLM并非出于追逐热门新事物的竞赛，而是出于一种深层次的根本渴望：控制自己的技术栈并开发当今最重要的技术。

当我从笔记本电脑上抬起头，总能看到地平线上成群的起重机，这显然符合中国更广泛的建筑文化和能量。中国研究者的人性、魅力和真诚的温暖非常人性化。在个人层面上，我们在美国习惯的那种残酷的地缘政治对话完全没有渗透到他们身上。这个世界可以更多一些这种简单的积极性。

作为AI社区的一员，我目前更担心的是成员和群体之间因国籍标签而出现的裂痕。如果我说我不希望美国实验室在AI技术栈的每个部分都保持明确的领先地位——尤其是在我投入时间的开放模型方面——那我是在撒谎。我是美国人，这是一个诚实的偏好。与此同时，我希望开放生态系统本身能在全球蓬勃发展，因为这可以为世界创造更安全、更易获取、更有用的AI，而现在的问题是，美国实验室是否会采取措施来占据这一领导地位。在完成这篇文章时，更多关于行政命令影响开放模型的传言正在流传，这可能会进一步复杂化美国领导力与全球生态系统之间的协同作用——这并没有让我充满信心。

感谢所有我在月之暗面、智谱、美团、小米、通义千问、蚂蚁灵境、零一万物等处有幸交谈的出色人士。每个人都如此热情好客，慷慨地付出时间。随着我的想法逐渐清晰，我将继续分享我对中国的看法，包括广义的文化和具体的AI领域。显然，这些知识将与AI发展前沿正在展开的故事直接相关。

1 编辑于05/07：在原文的这一段中，我错误地将不愿谈论更广泛问题归因于谦逊，这当然可能是一个因素，但这种习惯也受到他们成长和受教育的体系的影响，这是一个他们成功且善于驾驭的体系。我删除了：……捕捉了这些科学家成长背景和教育经历中极度的谦逊。这不仅仅是专注于工作，而是他们不想对自己不了解的问题发表评论。……

译自 Interconnects · Nathan Lambert · 录于二〇二六年五月十二日