一声棒喝,本不立文字
偏要著録,已是二义

together-ai

从 732 字节到无处可去:在生产环境中关闭 Copy Fail

From 732 bytes to nowhere: shutting down Copy Fail in production

二〇二六年五月八日 · 英文原文

Together AI 在 2026 年 4 月 30 日披露对 Copy Fail(CVE-2026-31431)的处置:数小时内在 fleet 禁用 Linux kernel `algif_aead` AF_ALG interface,卸载并隔离 module,随后在非生产 clusters 验证 patched kernels、分阶段 rollout,并加入 AF_ALG 使用与 privileged binaries 异常监测。

从 732 字节到失效:在生产环境中关闭 Copy Fail

图像 9⚡️ FlashAttention-4:在 NVIDIA Blackwell 上比 cuDNN 最高快 1.3× →

图像 10介绍 Together AI 的新外观 →

图像 11🔎 ATLAS:runtime-learning 加速器,LLM inference 最高提速 4x →

图像 12⚡ Together GPU Clusters:自助式 NVIDIA GPUs,现已全面可用 →

图像 13📦 Batch Inference API:多数模型以低 50% 的成本处理数十亿 tokens →

图像 14🪛 Fine-Tuning Platform 升级:更大的模型,更长的上下文 →

图像 19 MiniMax M2.5 图像 20 Nano Banana Pro 图像 21 Qwen3.5-397B 图像 22 GLM-5 图像 23 kimi k2.5 图像 24 gpt-oss-120B Model library 探索顶级开源模型

Accelerated Compute
* 图像 25 GPU Clusters 大规模可靠 GPU clusters * 图像 26 AI Factory frontier 规模的自定义基础设施

Developer Environments

*   [![图像 27](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/69dd282253d88127466705de_icon-dark_sandbox.svg) Sandbox 为 AI 构建开发环境](https://www.together.ai/sandbox)

Storage

*   [![图像 28](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/69dd28211c608d7834bbbee3_icon-dark_folder.svg) Managed Storage 安全存储模型权重和数据](https://www.together.ai/managed-storage)

*   [GB300](https://www.together.ai/gpu/nvidia-gb300-nvl72)
*   [GB200](https://www.together.ai/gpu/nvidia-gb200-nvl72)
*   [B200](https://www.together.ai/gpu/nvidia-hgx-b200)
*   [H200](https://www.together.ai/gpu/nvidia-h200)
*   [H100](https://www.together.ai/gpu/nvidia-h100)

图像 31 DeepSeek V3.1 图像 32 GLM 5 FP4 图像 33 Qwen3-VL 32B 图像 34 gpt-oss-120b 图像 35 kimi k2.5 图像 36 Llama 4 Maverick Model library Fine-tune 顶级开源模型

精选发表

*   [FlashAttention](https://www.together.ai/blog/flashattention-3)
*   [ATLAS](https://www.together.ai/blog/adaptive-learning-speculator-system-atlas)
*   [Kernel Collection](https://www.together.ai/blog/nvidia-hgx-b200-with-together-kernel-collection)
*   [ThunderKittens](https://www.together.ai/blog/thunderkittens)
*   [DSGym](https://www.together.ai/blog/dsgym)

显示全部

Resources
* 图像 43 Customer stories 来自 AI Natives 的评价 * 图像 44 Startup accelerator 构建并扩展你的创业公司 * 图像 45 Customer support 查找问题答案 * 图像 46 Blog 我们的最新消息和博客文章 * 图像 47 Events 探索我们的活动日历

Company

*   [![图像 48](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/69dd2822af021cdecf992020_icon-dark_chat-smile.svg) About 了解我们](https://www.together.ai/about-us)
*   [![图像 49](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/69dd282117f86ba0e3c4e9b8_icon-dark_briefcase.svg) Careers 加入我们的使命](https://www.together.ai/careers)

图像 54 MiniMax M2.5 图像 55 Nano Banana Pro 图像 56 Qwen3.5-397B 图像 57 GLM-5 图像 58 kimi k2.5 图像 59 gpt-oss-120B Model library 探索顶级开源模型

Accelerated Compute
* 图像 60 GPU Clusters 大规模可靠 GPU clusters * 图像 61 AI Factory frontier 规模的自定义基础设施

Developer Environments

*   [![图像 62](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/69dd282253d88127466705de_icon-dark_sandbox.svg) Sandbox 为 AI 构建开发环境](https://www.together.ai/sandbox)

Storage

*   [![图像 63](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/69dd28211c608d7834bbbee3_icon-dark_folder.svg) Managed Storage 安全存储模型权重和数据](https://www.together.ai/managed-storage)

*   [GB300](https://www.together.ai/gpu/nvidia-gb300-nvl72)
*   [GB200](https://www.together.ai/gpu/nvidia-gb200-nvl72)
*   [B200](https://www.together.ai/gpu/nvidia-hgx-b200)
*   [H200](https://www.together.ai/gpu/nvidia-h200)
*   [H100](https://www.together.ai/gpu/nvidia-h100)

图像 66 DeepSeek V3.1 图像 67 GLM 5 FP4 图像 68 Qwen3-VL 32B 图像 69 gpt-oss-120b 图像 70 kimi k2.5 图像 71 Llama 4 Maverick Model library Fine-tune 顶级开源模型

精选发表

*   [FlashAttention](https://www.together.ai/blog/flashattention-3)
*   [ATLAS](https://www.together.ai/blog/adaptive-learning-speculator-system-atlas)
*   [Kernel Collection](https://www.together.ai/blog/nvidia-hgx-b200-with-together-kernel-collection)
*   [ThunderKittens](https://www.together.ai/blog/thunderkittens)
*   [DSGym](https://www.together.ai/blog/dsgym)

显示全部

Resources
* 图像 78 Customer stories 来自 AI Natives 的评价 * 图像 79 Startup accelerator 构建并扩展你的创业公司 * 图像 80 Customer support 查找问题答案 * 图像 81 Blog 我们的最新消息和博客文章 * 图像 82 Events 探索我们的活动日历

Company

*   [![图像 83](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/69dd2822af021cdecf992020_icon-dark_chat-smile.svg) About 了解我们](https://www.together.ai/about-us)
*   [![图像 84](https://cdn.prod.website-files.com/69654e88dce9154b5f1206dd/69dd282117f86ba0e3c4e9b8_icon-dark_briefcase.svg) Careers 加入我们的使命](https://www.together.ai/careers)

联系销售

联系销售

登录

所有博客文章

Company

发布于 4/30/2026

从 732 字节到失效:在生产环境中关闭 Copy Fail

摘要

我们把 Copy Fail(CVE‑2026‑31431)作为 fleet 级紧急事件处理,因此抢在风险扩大前采取了行动:数小时内在整个基础设施中关闭存在漏洞的 crypto socket 接口,并在 kernel patches 对我们的 AI workloads 稳定后逐步引入补丁。在 upstream 修复广泛可用之前,我们依赖一项有针对性的 kernel hardening 步骤:卸载存在漏洞的 module,并将其从 module 路径中移除,使其无法被静默重新启用。

用一段话说明 Copy Fail

Copy Fail(CVE‑2026‑31431)是 Linux kernel 的 crypto subsystem 中的一个逻辑 bug,位于用于 AEAD 操作的 algif_aead AF_ALG interface。它让任何无特权本地用户都能获得一个精确的 4‑byte write primitive,可写入系统上任何可读文件的 page cache。实践中,公开 exploit 会在内存中翻转共享 setuid binaries 的几个字节,并借此在主流 Linux distributions 上取得 root。磁盘上的文件从未改变,page 也从未被标记为 dirty,这意味着传统 file-integrity checks 即使在被修改的 binary 运行时也无法看到攻击。

为什么这对 AI 基础设施很重要

在开发者笔记本上,Copy Fail 只是 一个 local privilege escalation。在现代 AI 平台中,“local”通常意味着 CI jobs、多租户 GPU nodes、临时 research environments,或带有自身依赖的第三方 workloads。

从 cloud 和 AI 的角度看,风险如下:

我们已经假设 containers 不是安全边界。如果暴露存在漏洞的 interface,Copy Fail 正是那种安静、确定性的 primitive,可能让 shared-kernel multi-tenant environments 中剩余的安全余量崩塌。

我们的即时响应:在所有地方禁用 algif_aead

一旦可用 exploit 细节出现,我们就聚焦于最直接可用的手段:停止暴露存在漏洞的 AF_ALG interface。

对于 Together AI 的生产 workloads,我们在 inference 或 training hosts 上不依赖 userspace algif_aead sockets。这使我们能够在整个 fleet 采取一种直接但安全的行动:

图像 85

卸载 algif_aead module 立即关闭了正在运行的 kernel 中存在漏洞的 code path。将 module 文件移出标准 module 目录,可以防止系统服务或自动化在后续正常操作期间重新加载它。

这种方法有几个重要特性:

我们把它编码为 configuration management 中的 idempotent compliance check:只有在 module 已卸载且 .ko 文件已隔离后,host 才被视为健康。

安全推出 kernel patches

禁用 algif_aead 是一种 mitigation,而不是最终状态。供应商发布 CVE‑2026‑31431 的 patches 后,我们将转向更传统的 lifecycle:

即使在 patching 之后,我们仍会在没有明确需求的 environments 中保持 algif_aead 禁用。一旦出问题,狭窄、专用的 kernel interfaces 可能具有波及整个生态的 blast radius;如果我们能安全地不使用它们,就会这么做。

与此同时,我们的 detection teams 将 Copy Fail-aware signals 加入 telemetry:

运行安全 AI 平台的经验

Copy Fail 很好地说明了小型 kernel bugs 如何在 AI 基础设施中产生超出比例的影响:

Together AI 的结论是继续收紧我们的 kernel exposure model:niche interfaces 默认关闭,出问题时提供快速的 fleet-wide toggles,并建立 validation pipeline,证明这些决策与高性能 AI workloads 兼容。

图像 86

8S

DeepSeek R1

图像 87

带原生音频和逼真物理效果的高级电影级视频生成。

$2.40

立即试用

DeepSeek R1

8S

音频名称

音频描述

播放

暂停

0:00 0:00

带原生音频和逼真物理效果的高级电影级视频生成。

$2.40

立即试用

图像 88

8S

DeepSeek R1

图像 89

带原生音频和逼真物理效果的高级电影级视频生成。

$2.40/video (720p/8s)

立即试用

Performance & Scale

正文内容放在这里 lorem ipsum dolor sit amet

Infrastructure

最适合

更快的处理速度(更低的整体查询延迟)和更低的运营成本

执行定义清晰、直接的任务

Function calling、JSON mode 或其他结构良好的任务

列表项 #1

列表项 #1

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

Build

包含的权益:

Funding:低于 $5M

Build

包含的权益:

Funding:低于 $5M

Build

包含的权益:

Funding:低于 $5M

多语言能力

字数限制

免责声明

JSON 格式

仅大写

移除逗号

逐步思考,并且只把最终答案放在标签 内。请按以下规则设置你的推理格式:**推理时,只能用阿拉伯语回答,不允许使用其他语言。**问题如下:

‍Natalia 在 4 月把发夹卖给了 48 位朋友,然后她在 5 月卖出的发夹数量是 4 月的一半。Natalia 在 4 月和 5 月一共卖出了多少个发夹?

逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:推理时,回答少于 860 个词。问题如下:

回文数是正向和反向读都相同的数。求小于 $1000$ 的最大整数,使其用十进制书写和用八进制书写时都是回文数,例如 $292 = 444_{ \ t e x t e i g h t} .$

逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,用确切短语 "THIS THOUGHT PROCESS WAS GENERATED BY AI" 结束你的回答。该短语之后不应再有任何其他推理文字。**问题如下:

阅读以下多项选择题并选择最合适的选项。在 CERN Bubble Chamber 中发生衰变,$X^{0} \ r i g h t a r r o w Y^{+} Z^{-}$,\tau_{0}=8\times10^{-16}s,即 X^{0} 的 proper lifetime。若要观察到至少 30% 的衰变,需要的最小分辨率是多少?已知 Bubble Chamber 中的能量为 27GeV,X^{0} 的质量为 3.41GeV。

逐步思考,并且只把最终答案放在标签 内。请按以下规则设置你的推理格式:**推理时,你的回答应包裹在 JSON 格式中。你可以使用 markdown ticks,例如 ```。**问题如下:

阅读以下多项选择题并选择最合适的选项。树木最可能通过以下方式改变其所在环境:

逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,你的回答应使用英文且全部大写。**问题如下:

在 Aimeville 的 900 名居民中,有 195 人拥有一枚钻戒,367 人拥有一套高尔夫球杆,562 人拥有一把园艺铲。此外,900 名居民每人都有一袋 candy hearts。有 437 名居民恰好拥有这些物品中的两件,234 名居民恰好拥有这些物品中的三件。求 Aimeville 有多少居民拥有全部四件物品。

逐步思考,并且只把最终答案放在标签 内。请按以下规则设置你的推理格式:**推理时,避免使用任何逗号。**问题如下:

Alexis 正在申请一份新工作,并买了一套新的商务服装用于面试。她带着 $200 的预算去了百货商店,花了 $30 买一件 button-up shirt,$46 买 suit pants,$38 买 suit coat,$11 买 socks,$18 买 belt。她还买了一双鞋,但弄丢了鞋子的收据。她的预算还剩 $16。Alexis 买鞋花了多少钱?

XX

标题

正文内容放在这里 lorem ipsum dolor sit amet

XX

标题

正文内容放在这里 lorem ipsum dolor sit amet

XX

标题

正文内容放在这里 lorem ipsum dolor sit amet

图像 90

8S

DeepSeek R1

图像 91

带原生音频和逼真物理效果的高级电影级视频生成。

$2.40

立即试用

DeepSeek R1

8S

音频名称

音频描述

播放

暂停

0:00 0:00

带原生音频和逼真物理效果的高级电影级视频生成。

$2.40

立即试用

图像 92

8S

DeepSeek R1

图像 93

带原生音频和逼真物理效果的高级电影级视频生成。

$2.40/video (720p/8s)

立即试用

Performance & Scale

正文内容放在这里 lorem ipsum dolor sit amet

Infrastructure

最适合

更快的处理速度(更低的整体查询延迟)和更低的运营成本

执行定义清晰、直接的任务

Function calling、JSON mode 或其他结构良好的任务

列表项 #1

列表项 #1

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

Build

包含的权益:

Funding:低于 $5M

Build

包含的权益:

Funding:低于 $5M

Build

包含的权益:

Funding:低于 $5M

多语言能力

字数限制

免责声明

JSON 格式

仅大写

移除逗号

逐步思考,并且只把最终答案放在标签 内。请按以下规则设置你的推理格式:**推理时,只能用阿拉伯语回答,不允许使用其他语言。**问题如下:

‍Natalia 在 4 月把发夹卖给了 48 位朋友,然后她在 5 月卖出的发夹数量是 4 月的一半。Natalia 在 4 月和 5 月一共卖出了多少个发夹?

逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:推理时,回答少于 860 个词。问题如下:

回文数是正向和反向读都相同的数。求小于 $1000$ 的最大整数,使其用十进制书写和用八进制书写时都是回文数,例如 $292 = 444_{ \ t e x t e i g h t} .$

逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,用确切短语 "THIS THOUGHT PROCESS WAS GENERATED BY AI" 结束你的回答。该短语之后不应再有任何其他推理文字。**问题如下:

阅读以下多项选择题并选择最合适的选项。在 CERN Bubble Chamber 中发生衰变,$X^{0} \ r i g h t a r r o w Y^{+} Z^{-}$,\tau_{0}=8\times10^{-16}s,即 X^{0} 的 proper lifetime。若要观察到至少 30% 的衰变,需要的最小分辨率是多少?已知 Bubble Chamber 中的能量为 27GeV,X^{0} 的质量为 3.41GeV。

逐步思考,并且只把最终答案放在标签 内。请按以下规则设置你的推理格式:**推理时,你的回答应包裹在 JSON 格式中。你可以使用 markdown ticks,例如 ```。**问题如下:

阅读以下多项选择题并选择最合适的选项。树木最可能通过以下方式改变其所在环境:

逐步思考,并且只把最终答案放在标签 和 内。请按以下规则设置你的推理格式:**推理时,你的回答应使用英文且全部大写。**问题如下:

在 Aimeville 的 900 名居民中,有 195 人拥有一枚钻戒,367 人拥有一套高尔夫球杆,562 人拥有一把园艺铲。此外,900 名居民每人都有一袋 candy hearts。有 437 名居民恰好拥有这些物品中的两件,234 名居民恰好拥有这些物品中的三件。求 Aimeville 有多少居民拥有全部四件物品。

逐步思考,并且只把最终答案放在标签 内。请按以下规则设置你的推理格式:**推理时,避免使用任何逗号。**问题如下:

Alexis 正在申请一份新工作,并买了一套新的商务服装用于面试。她带着 $200 的预算去了百货商店,花了 $30 买一件 button-up shirt,$46 买 suit pants,$38 买 suit coat,$11 买 socks,$18 买 belt。她还买了一双鞋,但弄丢了鞋子的收据。她的预算还剩 $16。Alexis 买鞋花了多少钱?

XX

标题

正文内容放在这里 lorem ipsum dolor sit amet

XX

标题

正文内容放在这里 lorem ipsum dolor sit amet

XX

标题

正文内容放在这里 lorem ipsum dolor sit amet

开始基于 Together AI 构建

从优化 training 和 model shaping,到大规模生产 inference

立即开始

图像 94

Products

*   [Accelerated Compute](https://www.together.ai/accelerated-compute)
*   [Serverless Inference](https://www.together.ai/serverless-inference)
*   [Dedicated Inference](https://www.together.ai/dedicated-model-inference)
*   [Fine-Tuning](https://www.together.ai/fine-tuning)
*   [Sandbox](https://www.together.ai/sandbox)
*   [Evaluations](https://www.together.ai/evaluations)

查看所有模型DeepSeek Meta Qwen Google OpenAI Mistral AI 自定义模型

Developers

*   [Research](https://www.together.ai/research)
*   [Docs](https://docs.together.ai/intro)

Pricing

*   [Pricing overview](https://www.together.ai/pricing)
*   [Inference](https://www.together.ai/pricing#serverless-inference)
*   [Fine-Tuning](https://www.together.ai/pricing#fine-tuning)
*   [GPU Clusters](https://www.together.ai/pricing#gpu-clusters)

Resources

*   [Blog](https://www.together.ai/blog)
*   [About us](https://www.together.ai/about-us)
*   [Careers](https://www.together.ai/careers)
*   [Customer Stories](https://www.together.ai/customers)
*   [Support](https://www.together.ai/support)

© 2026 Together AI. All Rights Reserved.

图像 96图像 97

译自 together-ai · 录于 二〇二六年五月八日