从 732 字节到无处可去:在生产环境中关闭 Copy Fail
From 732 bytes to nowhere: shutting down Copy Fail in production
Together AI 在 2026 年 4 月 30 日披露对 Copy Fail(CVE-2026-31431)的处置:数小时内在 fleet 禁用 Linux kernel `algif_aead` AF_ALG interface,卸载并隔离 module,随后在非生产 clusters 验证 patched kernels、分阶段 rollout,并加入 AF_ALG 使用与 privileged binaries 异常监测。
从 732 字节到失效:在生产环境中关闭 Copy Fail
⚡️ FlashAttention-4:在 NVIDIA Blackwell 上比 cuDNN 最高快 1.3× →
🔎 ATLAS:runtime-learning 加速器,LLM inference 最高提速 4x →
⚡ Together GPU Clusters:自助式 NVIDIA GPUs,现已全面可用 →
📦 Batch Inference API:多数模型以低 50% 的成本处理数十亿 tokens →
🪛 Fine-Tuning Platform 升级:更大的模型,更长的上下文 →
MiniMax M2.5
Nano Banana Pro
Qwen3.5-397B
GLM-5
kimi k2.5
gpt-oss-120B Model library 探索顶级开源模型
Accelerated Compute
* GPU Clusters 大规模可靠 GPU clusters
*
AI Factory frontier 规模的自定义基础设施
Developer Environments
* [ Sandbox 为 AI 构建开发环境](https://www.together.ai/sandbox)
Storage
* [ Managed Storage 安全存储模型权重和数据](https://www.together.ai/managed-storage)
* [GB300](https://www.together.ai/gpu/nvidia-gb300-nvl72)
* [GB200](https://www.together.ai/gpu/nvidia-gb200-nvl72)
* [B200](https://www.together.ai/gpu/nvidia-hgx-b200)
* [H200](https://www.together.ai/gpu/nvidia-h200)
* [H100](https://www.together.ai/gpu/nvidia-h100)
精选发表
* [FlashAttention](https://www.together.ai/blog/flashattention-3)
* [ATLAS](https://www.together.ai/blog/adaptive-learning-speculator-system-atlas)
* [Kernel Collection](https://www.together.ai/blog/nvidia-hgx-b200-with-together-kernel-collection)
* [ThunderKittens](https://www.together.ai/blog/thunderkittens)
* [DSGym](https://www.together.ai/blog/dsgym)
Resources
* Customer stories 来自 AI Natives 的评价
*
Startup accelerator 构建并扩展你的创业公司
*
Customer support 查找问题答案
*
Blog 我们的最新消息和博客文章
*
Events 探索我们的活动日历
Company
* [ About 了解我们](https://www.together.ai/about-us)
* [ Careers 加入我们的使命](https://www.together.ai/careers)
MiniMax M2.5
Nano Banana Pro
Qwen3.5-397B
GLM-5
kimi k2.5
gpt-oss-120B Model library 探索顶级开源模型
Accelerated Compute
* GPU Clusters 大规模可靠 GPU clusters
*
AI Factory frontier 规模的自定义基础设施
Developer Environments
* [ Sandbox 为 AI 构建开发环境](https://www.together.ai/sandbox)
Storage
* [ Managed Storage 安全存储模型权重和数据](https://www.together.ai/managed-storage)
* [GB300](https://www.together.ai/gpu/nvidia-gb300-nvl72)
* [GB200](https://www.together.ai/gpu/nvidia-gb200-nvl72)
* [B200](https://www.together.ai/gpu/nvidia-hgx-b200)
* [H200](https://www.together.ai/gpu/nvidia-h200)
* [H100](https://www.together.ai/gpu/nvidia-h100)
精选发表
* [FlashAttention](https://www.together.ai/blog/flashattention-3)
* [ATLAS](https://www.together.ai/blog/adaptive-learning-speculator-system-atlas)
* [Kernel Collection](https://www.together.ai/blog/nvidia-hgx-b200-with-together-kernel-collection)
* [ThunderKittens](https://www.together.ai/blog/thunderkittens)
* [DSGym](https://www.together.ai/blog/dsgym)
Resources
* Customer stories 来自 AI Natives 的评价
*
Startup accelerator 构建并扩展你的创业公司
*
Customer support 查找问题答案
*
Blog 我们的最新消息和博客文章
*
Events 探索我们的活动日历
Company
* [ About 了解我们](https://www.together.ai/about-us)
* [ Careers 加入我们的使命](https://www.together.ai/careers)
Company
发布于 4/30/2026
从 732 字节到失效:在生产环境中关闭 Copy Fail
- 作者 Derek Chamorro, Max Kalika
- 目录
摘要
我们把 Copy Fail(CVE‑2026‑31431)作为 fleet 级紧急事件处理,因此抢在风险扩大前采取了行动:数小时内在整个基础设施中关闭存在漏洞的 crypto socket 接口,并在 kernel patches 对我们的 AI workloads 稳定后逐步引入补丁。在 upstream 修复广泛可用之前,我们依赖一项有针对性的 kernel hardening 步骤:卸载存在漏洞的 module,并将其从 module 路径中移除,使其无法被静默重新启用。
用一段话说明 Copy Fail
Copy Fail(CVE‑2026‑31431)是 Linux kernel 的 crypto subsystem 中的一个逻辑 bug,位于用于 AEAD 操作的 algif_aead AF_ALG interface。它让任何无特权本地用户都能获得一个精确的 4‑byte write primitive,可写入系统上任何可读文件的 page cache。实践中,公开 exploit 会在内存中翻转共享 setuid binaries 的几个字节,并借此在主流 Linux distributions 上取得 root。磁盘上的文件从未改变,page 也从未被标记为 dirty,这意味着传统 file-integrity checks 即使在被修改的 binary 运行时也无法看到攻击。
为什么这对 AI 基础设施很重要
在开发者笔记本上,Copy Fail 只是 一个 local privilege escalation。在现代 AI 平台中,“local”通常意味着 CI jobs、多租户 GPU nodes、临时 research environments,或带有自身依赖的第三方 workloads。
从 cloud 和 AI 的角度看,风险如下:
- 在可访问 AF_ALG sockets 的 container 内部发生的 compromise,可以转化为底层 host 上的 root。
- 由于 page cache 是共享的,来自一个 workload 的写入可能会悄悄破坏同一 node 上其他 tenants 使用的 binaries 或 libraries。
- 一旦 host 被 root,访问 attached storage、control planes 和相邻 workloads 会容易得多。
我们已经假设 containers 不是安全边界。如果暴露存在漏洞的 interface,Copy Fail 正是那种安静、确定性的 primitive,可能让 shared-kernel multi-tenant environments 中剩余的安全余量崩塌。
我们的即时响应:在所有地方禁用 algif_aead
一旦可用 exploit 细节出现,我们就聚焦于最直接可用的手段:停止暴露存在漏洞的 AF_ALG interface。
对于 Together AI 的生产 workloads,我们在 inference 或 training hosts 上不依赖 userspace algif_aead sockets。这使我们能够在整个 fleet 采取一种直接但安全的行动:

卸载 algif_aead module 立即关闭了正在运行的 kernel 中存在漏洞的 code path。将 module 文件移出标准 module 目录,可以防止系统服务或自动化在后续正常操作期间重新加载它。
这种方法有几个重要特性:
- 快速:不需要 reboot,这对于运行长时间 GPU jobs 很重要。
- 低风险:典型 server 和 AI workloads 不会直接依赖 AF_ALG AEAD sockets,因此 operational impact 很小。
- 持久:即使 host reboot 到同一个存在漏洞的 kernel,启动后
algif_aead仍然保持禁用。
我们把它编码为 configuration management 中的 idempotent compliance check:只有在 module 已卸载且 .ko 文件已隔离后,host 才被视为健康。
安全推出 kernel patches
禁用 algif_aead 是一种 mitigation,而不是最终状态。供应商发布 CVE‑2026‑31431 的 patches 后,我们将转向更传统的 lifecycle:
- 在模拟我们最重 AI workloads 的非生产 clusters 中 staging patched kernels,包括高密度多租户 GPU nodes。
- 针对性能、GPU driver compatibility,以及真实 inference 和 training 负载下的稳定性运行加速 soak tests。
- 按 region 和 environment 逐步 rollout patched kernels,从共享程度较低的 clusters 开始,并在 telemetry 保持正常时推进到高度多租户 clusters。
即使在 patching 之后,我们仍会在没有明确需求的 environments 中保持 algif_aead 禁用。一旦出问题,狭窄、专用的 kernel interfaces 可能具有波及整个生态的 blast radius;如果我们能安全地不使用它们,就会这么做。
与此同时,我们的 detection teams 将 Copy Fail-aware signals 加入 telemetry:
- 在不应出现 AF_ALG 使用或 crypto module loading 的 nodes 上,对意外行为发出 alerts。
- 对 privileged binaries 进行 behavioral monitoring,即使磁盘上的 image 保持不变,也寻找 anomalies。
运行安全 AI 平台的经验
Copy Fail 很好地说明了小型 kernel bugs 如何在 AI 基础设施中产生超出比例的影响:
- Shared kernels 和高密度 multi-tenancy 会把 local bugs 放大为 cross-tenant risks。
- Page cache 技巧可以绕过传统基于 file-integrity 的防御。
- “没人用”的狭窄 interfaces 可能突然成为主要 attack surface。
Together AI 的结论是继续收紧我们的 kernel exposure model:niche interfaces 默认关闭,出问题时提供快速的 fleet-wide toggles,并建立 validation pipeline,证明这些决策与高性能 AI workloads 兼容。
8S
DeepSeek R1

带原生音频和逼真物理效果的高级电影级视频生成。
$2.40
DeepSeek R1
8S
音频名称
音频描述
播放
暂停
0:00 0:00
带原生音频和逼真物理效果的高级电影级视频生成。
$2.40
8S
DeepSeek R1

带原生音频和逼真物理效果的高级电影级视频生成。
$2.40/video (720p/8s)
Performance & Scale
正文内容放在这里 lorem ipsum dolor sit amet
- 要点放在这里 lorem ipsum
- 要点放在这里 lorem ipsum
- 要点放在这里 lorem ipsum
Infrastructure
最适合
更快的处理速度(更低的整体查询延迟)和更低的运营成本
执行定义清晰、直接的任务
Function calling、JSON mode 或其他结构良好的任务
列表项 #1
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
列表项 #1
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Build
包含的权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
Funding:低于 $5M
Build
包含的权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
Funding:低于 $5M
Build
包含的权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
Funding:低于 $5M
多语言能力
字数限制
免责声明
JSON 格式
仅大写
移除逗号
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,只能用阿拉伯语回答,不允许使用其他语言。**问题如下:
Natalia 在 4 月把发夹卖给了 48 位朋友,然后她在 5 月卖出的发夹数量是 4 月的一半。Natalia 在 4 月和 5 月一共卖出了多少个发夹?
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:推理时,回答少于 860 个词。问题如下:
回文数是正向和反向读都相同的数。求小于 $1000$ 的最大整数,使其用十进制书写和用八进制书写时都是回文数,例如 $292 = 444_{ \ t e x t e i g h t} .$
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,用确切短语 "THIS THOUGHT PROCESS WAS GENERATED BY AI" 结束你的回答。该短语之后不应再有任何其他推理文字。**问题如下:
阅读以下多项选择题并选择最合适的选项。在 CERN Bubble Chamber 中发生衰变,$X^{0} \ r i g h t a r r o w Y^{+} Z^{-}$,\tau_{0}=8\times10^{-16}s,即 X^{0} 的 proper lifetime。若要观察到至少 30% 的衰变,需要的最小分辨率是多少?已知 Bubble Chamber 中的能量为 27GeV,X^{0} 的质量为 3.41GeV。
- A. 2.08*1e-1 m
- B. 2.08*1e-9 m
- C. 2.08*1e-6 m
- D. 2.08*1e-3 m
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,你的回答应包裹在 JSON 格式中。你可以使用 markdown ticks,例如 ```。**问题如下:
阅读以下多项选择题并选择最合适的选项。树木最可能通过以下方式改变其所在环境:
- A. 向土壤释放氮。
- B. 挤占非本地物种。
- C. 向大气中增加二氧化碳。
- D. 从土壤中移除水分并将其返回大气。
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,你的回答应使用英文且全部大写。**问题如下:
在 Aimeville 的 900 名居民中,有 195 人拥有一枚钻戒,367 人拥有一套高尔夫球杆,562 人拥有一把园艺铲。此外,900 名居民每人都有一袋 candy hearts。有 437 名居民恰好拥有这些物品中的两件,234 名居民恰好拥有这些物品中的三件。求 Aimeville 有多少居民拥有全部四件物品。
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,避免使用任何逗号。**问题如下:
Alexis 正在申请一份新工作,并买了一套新的商务服装用于面试。她带着 $200 的预算去了百货商店,花了 $30 买一件 button-up shirt,$46 买 suit pants,$38 买 suit coat,$11 买 socks,$18 买 belt。她还买了一双鞋,但弄丢了鞋子的收据。她的预算还剩 $16。Alexis 买鞋花了多少钱?
XX
标题
正文内容放在这里 lorem ipsum dolor sit amet
XX
标题
正文内容放在这里 lorem ipsum dolor sit amet
XX
标题
正文内容放在这里 lorem ipsum dolor sit amet
8S
DeepSeek R1

带原生音频和逼真物理效果的高级电影级视频生成。
$2.40
DeepSeek R1
8S
音频名称
音频描述
播放
暂停
0:00 0:00
带原生音频和逼真物理效果的高级电影级视频生成。
$2.40
8S
DeepSeek R1

带原生音频和逼真物理效果的高级电影级视频生成。
$2.40/video (720p/8s)
Performance & Scale
正文内容放在这里 lorem ipsum dolor sit amet
- 要点放在这里 lorem ipsum
- 要点放在这里 lorem ipsum
- 要点放在这里 lorem ipsum
Infrastructure
最适合
更快的处理速度(更低的整体查询延迟)和更低的运营成本
执行定义清晰、直接的任务
Function calling、JSON mode 或其他结构良好的任务
列表项 #1
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
列表项 #1
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Build
包含的权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
Funding:低于 $5M
Build
包含的权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
Funding:低于 $5M
Build
包含的权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
Funding:低于 $5M
多语言能力
字数限制
免责声明
JSON 格式
仅大写
移除逗号
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,只能用阿拉伯语回答,不允许使用其他语言。**问题如下:
Natalia 在 4 月把发夹卖给了 48 位朋友,然后她在 5 月卖出的发夹数量是 4 月的一半。Natalia 在 4 月和 5 月一共卖出了多少个发夹?
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:推理时,回答少于 860 个词。问题如下:
回文数是正向和反向读都相同的数。求小于 $1000$ 的最大整数,使其用十进制书写和用八进制书写时都是回文数,例如 $292 = 444_{ \ t e x t e i g h t} .$
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,用确切短语 "THIS THOUGHT PROCESS WAS GENERATED BY AI" 结束你的回答。该短语之后不应再有任何其他推理文字。**问题如下:
阅读以下多项选择题并选择最合适的选项。在 CERN Bubble Chamber 中发生衰变,$X^{0} \ r i g h t a r r o w Y^{+} Z^{-}$,\tau_{0}=8\times10^{-16}s,即 X^{0} 的 proper lifetime。若要观察到至少 30% 的衰变,需要的最小分辨率是多少?已知 Bubble Chamber 中的能量为 27GeV,X^{0} 的质量为 3.41GeV。
- A. 2.08*1e-1 m
- B. 2.08*1e-9 m
- C. 2.08*1e-6 m
- D. 2.08*1e-3 m
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,你的回答应包裹在 JSON 格式中。你可以使用 markdown ticks,例如 ```。**问题如下:
阅读以下多项选择题并选择最合适的选项。树木最可能通过以下方式改变其所在环境:
- A. 向土壤释放氮。
- B. 挤占非本地物种。
- C. 向大气中增加二氧化碳。
- D. 从土壤中移除水分并将其返回大气。
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,你的回答应使用英文且全部大写。**问题如下:
在 Aimeville 的 900 名居民中,有 195 人拥有一枚钻戒,367 人拥有一套高尔夫球杆,562 人拥有一把园艺铲。此外,900 名居民每人都有一袋 candy hearts。有 437 名居民恰好拥有这些物品中的两件,234 名居民恰好拥有这些物品中的三件。求 Aimeville 有多少居民拥有全部四件物品。
逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,避免使用任何逗号。**问题如下:
Alexis 正在申请一份新工作,并买了一套新的商务服装用于面试。她带着 $200 的预算去了百货商店,花了 $30 买一件 button-up shirt,$46 买 suit pants,$38 买 suit coat,$11 买 socks,$18 买 belt。她还买了一双鞋,但弄丢了鞋子的收据。她的预算还剩 $16。Alexis 买鞋花了多少钱?
XX
标题
正文内容放在这里 lorem ipsum dolor sit amet
XX
标题
正文内容放在这里 lorem ipsum dolor sit amet
XX
标题
正文内容放在这里 lorem ipsum dolor sit amet
开始基于 Together AI 构建
从优化 training 和 model shaping,到大规模生产 inference

Products
* [Accelerated Compute](https://www.together.ai/accelerated-compute)
* [Serverless Inference](https://www.together.ai/serverless-inference)
* [Dedicated Inference](https://www.together.ai/dedicated-model-inference)
* [Fine-Tuning](https://www.together.ai/fine-tuning)
* [Sandbox](https://www.together.ai/sandbox)
* [Evaluations](https://www.together.ai/evaluations)
- Models
查看所有模型DeepSeek Meta Qwen Google OpenAI Mistral AI 自定义模型
Developers
* [Research](https://www.together.ai/research)
* [Docs](https://docs.together.ai/intro)
Pricing
* [Pricing overview](https://www.together.ai/pricing)
* [Inference](https://www.together.ai/pricing#serverless-inference)
* [Fine-Tuning](https://www.together.ai/pricing#fine-tuning)
* [GPU Clusters](https://www.together.ai/pricing#gpu-clusters)
Resources
* [Blog](https://www.together.ai/blog)
* [About us](https://www.together.ai/about-us)
* [Careers](https://www.together.ai/careers)
* [Customer Stories](https://www.together.ai/customers)
* [Support](https://www.together.ai/support)
© 2026 Together AI. All Rights Reserved.
DeepSeek V3.1