Simon Willison · 博客

Gemini 3.5 Flash:更贵,但谷歌计划用它做所有事

Gemini 3.5 Flash: more expensive, but Google plan to use it for everything

二〇二六年五月十九日 · 英文原文

Google 在 Google I/O 大会上发布 Gemini 3.5 Flash 正式版,模型 ID 为 gemini-3.5-flash,知识截止于 2025 年 1 月,支持 1,048,576 输入 token 和 65,536 输出 token,无 computer use 功能。该模型已通过 Gemini 应用、Google 搜索 AI Mode 面向用户,通过 Google Antigravity、AI Studio 及 Android Studio 中的 Gemini API 面向开发者,通过 Gemini Enterprise Agent Platform 面向企业。价格上调至输入 $1.50/百万 token、输出 $9/百万 token,为 Gemini 3 Flash Preview 的 3 倍、3.1 Flash-Lite 的 6 倍。Google 同时推广处于 beta 阶段的 Interactions API。Artificial Analysis 的 benchmark 显示,Gemini 3.5 Flash (high) 运行成本为 $1,551.60,高于 Gemini 3.1 Pro Preview 的 $892.28。

今天在 Google I/O 大会上,Google 发布了 Gemini 3.5 Flash。这次跳过了 -preview 后缀,直接进入正式版(general availability),Google 似乎正在将其用于大量核心产品:3.5 Flash 今天已面向全球数十亿用户可用:通过 Gemini 应用和 Google 搜索中的 AI Mode 面向所有用户;在面向 agent 优先的开发平台 Google Antigravity 以及 Google AI Studio 和 Android Studio 中的 Gemini API 面向开发者;在 Gemini Enterprise Agent Platform 和 Gemini Enterprise 中面向企业。与 Gemini 一贯的风格相同,最有趣的细节藏在 Gemini 3.5 Flash 开发者文档的"新特性"部分。它基本保留了与之前 Gemini 3.x 系列相同的平台功能,不过没有 computer use 功能。模型 ID 为 gemini-3.5-flash。知识截止日期为 2025 年 1 月,支持 1,048,576 个输入 token 和 65,536 个最大输出 token。Google 还在推广一个新的 Interactions API,目前处于 beta 阶段,在我看来这相当于 OpenAI Responses 引入的模式——特别是服务端历史记录管理。

价格已经上涨。Gemini 3.5 Flash 伴随一次显著的价格上调。之前"Flash"系列中的模型是 Gemini 3 Flash Preview 和 Gemini 3.1 Flash-Lite。新的 3.5 Flash 价格是 3 Flash Preview 的 3 倍,是 3.1 Flash-Lite 的 6 倍(价格对比见这里)。输入 $1.50/百万 token、输出 $9/百万 token 的价格,已接近 Google 的 Gemini 3.1 Pro($2 和 $12)。Gemini 团队承诺 3.5 Pro 将在"下个月"推出——价格很可能更高。这符合一个趋势:OpenAI 的 GPT-5.5 价格是 GPT-5.4 的 2 倍,而考虑到新的 tokenizer,Claude Opus 4.7 的价格大约是 4.6 的 1.46 倍。考虑到价格上涨,Google 将其部署到如此多面向消费者的免费产品中,这一点很有意思。感觉三大 AI 实验室都在试探 API 客户的价格承受能力。

Artificial Analysis 发布了运行其专有 benchmark 对模型进行测试的成本,这是一种将 tokenization 和推理 token 数量增加等因素纳入考量的有用方法。一些值得比较的数字:

运行 3.5 Flash (high) 的 benchmark 成本显著高于 3.1 Pro Preview!以下是其他厂商的一些数据:

一只骑自行车的鹈鹕。我针对 Gemini API 运行了"Generate an SVG of a pelican riding a bicycle",得到了这只鹈鹕,内容相当丰富:从代码注释来看:Hacker News 上的 hedgehog:那只鹈鹕看起来像是在迈阿密参加加密货币会议。这花了我 11 个输入 token 和 14,403 个输出 token,总成本不到 13 美分。

标签:google, ai, generative-ai, llms, gemini, llm-pricing, pelican-riding-a-bicycle, llm-release

译自 Simon Willison · 博客 · 录于 二〇二六年五月十九日