一声棒喝,本不立文字
偏要著録,已是二义

mistral-ai

Vibe 中的远程 agent,由 Mistral Medium 3.5 驱动

Remote agents in Vibe. Powered by Mistral Medium 3.5.

二〇二六年五月三日 · 英文原文

Mistral 发布公开 preview 的 Mistral Medium 3.5,128B dense model、256k context、open weights,SWE-Bench Verified 77.6%。其成为 Le Chat 和 Vibe CLI 默认 model,支持 cloud remote coding agents、Work mode、API 与 NVIDIA NIM 部署。

Coding agents 过去大多运行在你的笔记本电脑上。今天,我们把它们迁移到 cloud,在那里它们可以自行运行、并行执行,并在完成后通知你。你可以从 Mistral Vibe CLI 启动它们,也可以直接在 Le Chat 中启动,在不离开对话的情况下交给它们一个 coding 任务。

其背后是公开 preview 的 Mistral Medium 3.5,这是 Mistral Vibe 和 Le Chat 的新默认 model,专为长时间执行 coding 和 productivity 工作而构建。Le Chat(Preview)中的新 Work mode 在此基础上扩展,提供一个强大的 agent,用于 research、analysis、跨工具操作等复杂的 multi-step 任务。

亮点。

  1. Mistral Medium 3.5,一个新的旗舰 model,将 instruction-following、reasoning 和 coding 融合到单个 128B dense model 中。以 open weights 形式发布,采用修改版 MIT license。
  2. 在真实场景中表现强劲,并且规模适中,少至四块 GPU 即可 self-host。
  3. 用于 async coding 的 Mistral Vibe remote agents:sessions 在 cloud 中运行,可从 CLI 或 Le Chat 启动,本地 CLI session 也可以 teleport 到 cloud。
  4. 在 Le Chat 中启动 Mistral Vibe coding 任务。Sessions 运行在同一 remote runtime 上,并会在你离开后继续执行。
  5. Le Chat 中的 Work mode 运行在一个新的 agent 上,由 Mistral Medium 3.5 驱动,可处理 multi-step 任务,并行调用工具直到任务完成。

Mistral Medium 3.5。

Mistral Medium 3.5 是我们的第一个旗舰级 merged model,目前提供公开 preview。它是一个 128B dense model,具备 256k context window,用一组 weights 同时处理 instruction-following、reasoning 和 coding。它在真实使用中表现强劲,并且少至四块 GPU 即可 self-host。Reasoning effort 现在可按请求配置,因此同一个 model 既可以回答简短的 chat 回复,也可以完成复杂的 agentic 运行。我们从头训练了 vision encoder,以处理可变的图像尺寸和宽高比。

Mistral Medium 3.5 在 SWE-Bench Verified 上得分 77.6%,领先于 Devstral 2 以及 Qwen3.5 397B A17B 等 models。它也具备强大的 agentic 能力,在 τ³-Telecom 上得分 91.4。

图 1:Frame 2147228534

图 2:Math Instruct Final

图 3:Frame 2147228533

图 4:Frame 2147228532

该 model 面向 long-horizon 任务而构建,能够可靠调用多个工具,并生成下游代码可消费的结构化输出。正是这个 model 让 Vibe 中的 async cloud agents 能够以实用形态发布。

Mistral Medium 3.5 将成为 Le Chat 的默认 model。它也会在我们的 coding agent Vibe CLI 中取代 Devstral 2。

Vibe remote agents。

从今天开始,coding sessions 可以在你离开时继续处理长任务。多个 session 可以并行运行,你不再需要成为 agent 每一步执行中的瓶颈。

你可以从 Mistral Vibe CLI 或 Le Chat 启动 cloud agents。在它们运行时,你可以查看 agent 正在做什么,包括 file diffs、tool calls、progress states,以及过程中提出的问题。当你希望本地 CLI session 持续运行时,可以把它 teleport 到 cloud,session history、task state 和 approvals 都会随之迁移。

图 5:Medium Scheme

Vibe 位于工程团队已经在使用的系统之间,并在需要的地方保留 humans in the loop。它可接入 GitHub 处理代码和 pull requests,接入 Linear 和 Jira 处理 issues,接入 Sentry 处理 incidents,并接入 Slack 或 Teams 等应用进行报告。

每个 coding session 都运行在隔离的 sandbox 中,包括大范围编辑和安装操作。工作完成后,agent 可以在 GitHub 上打开一个 pull request 并通知你,让你审查结果,而不是审查生成它的每一次按键。

它适合那些高频、定义明确、会占用开发者时间但不应消耗其判断力的工作:module refactors、test generation、dependency upgrades、CI investigations,以及 bug fixes。

我们使用在 Mistral Studio 中编排的 Workflows,将 Mistral Vibe 带入 Le Chat。我们最初是为自己的内部 coding 环境构建这项能力,随后用于我们的 enterprise customers。今天,这项能力向所有人开放,用户现在可以从 web 启动 coding 任务。由于不再绑定本地 terminal,开发者可以并行运行多个任务。

你可以直接在 Le Chat 中启动 coding sessions,因此在 chat 中描述的任务会运行在与 CLI 和 web 相同的 remote runtime 上,并在之后以完成的 branch 或 draft PR 形式返回。

Le Chat 中的新 Work mode(Preview)。

Work mode 是 Le Chat 中面向复杂任务的强大新 agentic mode,由新的 harness 和 Mistral Medium 3.5 驱动。agent 会成为 assistant 本身的执行后端,因此 Le Chat 可以读写内容、同时使用多个工具,并持续处理 multi-step projects,直到完成你的请求。

以下是 Work mode 目前可以让你完成的事情。

  1. 跨工具 workflows:在一次运行中跨 email、messages 和 calendar 补齐进展;结合参会者 context、最新新闻,以及从你的来源中提取的 talking points,为会议做准备。
  2. Research 和 synthesis:跨 web、内部 docs 和已连接工具深入研究一个 topic,然后生成可在导出或发送前编辑的结构化 brief 或 report。
  3. Triage 你的 inbox 并起草回复;根据团队和客户讨论在 Jira 中创建 issues;在 Slack 上向团队发送 summary。

Sessions 的持续时间比典型的 chat 回复更长,因此 agent 可以跨多个 turns 持续运行,经历 trial-and-error,并一直推进到完成。在 Work mode 中,connectors 默认开启,而不是手动选择,这让 agent 能够访问 documents、mailboxes、calendars 和其他系统,获取执行正确操作所需的丰富 context。

agent 的每一个 action 都是可见的:你会看到每次 tool call 和 thinking rationale。Le Chat 会根据你的 permissions,在执行发送消息、写入 document 或修改 data 等敏感任务前,要求你明确 approval。

开始使用。

Mistral Medium 3.5 现已在 Mistral VibeLe Chat 中提供,并在 Pro、Team 和 Enterprise plans 中驱动 remote coding agents 和 Le Chat 的 Work mode。

通过 API 使用时,价格为每百万 input tokens $1.5、每百万 output tokens $7.5。Open weights 已在 Hugging Face 上发布,采用修改版 MIT license。

它也可用于 prototyping,托管在 build.nvidia.com 上由 NVIDIA GPU 加速的 endpoints 中,也可作为可扩展的容器化 inference microservice NVIDIA NIM 使用。

和我们一起构建 agentic systems 的未来。

我们正在 research、engineering 和 product 岗位招聘,推动 agentic systems 继续向前发展。查看我们的 开放职位

译自 mistral-ai · 录于 二〇二六年五月三日