Together AI 与 Adaption 建立合作伙伴关系
Announcing Together AI and Adaption Partnership
Together AI 于 2026 年 4 月 30 日宣布与 Adaption 合作,将 Together Fine-Tuning 原生集成进 Adaptive Data。用户可优化 dataset、执行 fine-tuning、查看 win rates、loss、learning rate 和 eval 结果,并部署到 Together AI inference 服务。
宣布 Together AI 与 Adaption 建立合作伙伴关系
⚡️ FlashAttention-4:在 NVIDIA Blackwell 上比 cuDNN 最多快 1.3× →
🔎 ATLAS:runtime-learning 加速器,让 LLM inference 最高提速 4x →
⚡ Together GPU Clusters:自助式 NVIDIA GPU,现已正式可用 →
📦 Batch Inference API:以低 50% 的成本为大多数模型处理数十亿 tokens →
🪛 Fine-Tuning 平台升级:更大的模型,更长的上下文 →
MiniMax M2.5
Nano Banana Pro
Qwen3.5-397B
GLM-5
kimi k2.5
gpt-oss-120B Model library 探索顶级开源模型
Accelerated Compute
* GPU Clusters 大规模可靠 GPU clusters
*
AI Factory 前沿规模的自定义基础设施
Developer Environments
* [ Sandbox 为 AI 构建开发环境](https://www.together.ai/sandbox)
Storage
* [ Managed Storage 安全存储模型权重与数据](https://www.together.ai/managed-storage)
* [GB300](https://www.together.ai/gpu/nvidia-gb300-nvl72)
* [GB200](https://www.together.ai/gpu/nvidia-gb200-nvl72)
* [B200](https://www.together.ai/gpu/nvidia-hgx-b200)
* [H200](https://www.together.ai/gpu/nvidia-h200)
* [H100](https://www.together.ai/gpu/nvidia-h100)
精选出版物
* [FlashAttention](https://www.together.ai/blog/flashattention-3)
* [ATLAS](https://www.together.ai/blog/adaptive-learning-speculator-system-atlas)
* [Kernel Collection](https://www.together.ai/blog/nvidia-hgx-b200-with-together-kernel-collection)
* [ThunderKittens](https://www.together.ai/blog/thunderkittens)
* [DSGym](https://www.together.ai/blog/dsgym)
Resources
* Customer stories 来自 AI Natives 的客户评价
*
Startup accelerator 构建并扩展你的初创公司
*
Customer support 查找问题答案
*
Blog 我们的最新动态与博客文章
*
Events 查看我们的活动日历
Company
* [ About 了解我们](https://www.together.ai/about-us)
* [ Careers 加入我们的使命](https://www.together.ai/careers)
MiniMax M2.5
Nano Banana Pro
Qwen3.5-397B
GLM-5
kimi k2.5
gpt-oss-120B Model library 探索顶级开源模型
Accelerated Compute
* GPU Clusters 大规模可靠 GPU clusters
*
AI Factory 前沿规模的自定义基础设施
Developer Environments
* [ Sandbox 为 AI 构建开发环境](https://www.together.ai/sandbox)
Storage
* [ Managed Storage 安全存储模型权重与数据](https://www.together.ai/managed-storage)
* [GB300](https://www.together.ai/gpu/nvidia-gb300-nvl72)
* [GB200](https://www.together.ai/gpu/nvidia-gb200-nvl72)
* [B200](https://www.together.ai/gpu/nvidia-hgx-b200)
* [H200](https://www.together.ai/gpu/nvidia-h200)
* [H100](https://www.together.ai/gpu/nvidia-h100)
精选出版物
* [FlashAttention](https://www.together.ai/blog/flashattention-3)
* [ATLAS](https://www.together.ai/blog/adaptive-learning-speculator-system-atlas)
* [Kernel Collection](https://www.together.ai/blog/nvidia-hgx-b200-with-together-kernel-collection)
* [ThunderKittens](https://www.together.ai/blog/thunderkittens)
* [DSGym](https://www.together.ai/blog/dsgym)
Resources
* Customer stories 来自 AI Natives 的客户评价
*
Startup accelerator 构建并扩展你的初创公司
*
Customer support 查找问题答案
*
Blog 我们的最新动态与博客文章
*
Events 查看我们的活动日历
Company
* [ About 了解我们](https://www.together.ai/about-us)
* [ Careers 加入我们的使命](https://www.together.ai/careers)
Fine-Tuning
发布于 4/30/2026
宣布 Together AI 与 Adaption 建立合作伙伴关系
Together Fine-Tuning 现已在 Adaption 的 Adaptive Data 中原生可用
- 作者 Max Ryabinin、Jennifer Wu、Will Van Eaton、Sonny Khan
- 目录
我们很高兴与 Adaption 合作,让 Together Fine-Tuning 可在 Adaptive Data 中使用。Adaption 由 Sara Hooker 和 Sudip Roy 联合创立,两人都曾在 Cohere 担任领导职务,也是 Google DeepMind 的资深人士。Adaptive Data 通过帮助团队分析 dataset 结构、调整样本、评估质量,并导出可用于模型的数据,解决现代模型训练中的数据挑战。Adaption 将这组能力描述为把通常只供 frontier labs 使用的数据优化技术带给日常构建者,并报告称在早期部署中,数据质量平均提升 82%。
通过这次集成,Adaption 用户可以连接自己的 Together AI 账户,在无缝的实验工作流中,以最快速度获得高质量的 fine-tuned model。在 Adaption 中,用户优化训练 dataset,然后直接基于这些数据执行 Together fine-tuning,并以优化后的 hyperparameters 作为起点。训练完成后,fine-tuned model 会被部署用于 evaluation,并向用户展示 eval 结果;之后,用户可以在 Together AI 的高性能 inference 服务上部署该模型。
Together Fine-Tuning 为 Adaptive Data 用户提供了基础设施,可将经过塑造的 datasets 转化为更强、更可靠的开放模型。它对 LoRA 和 full fine-tuning、大型开放模型以及实验可见性的支持,帮助我们的用户快速适配、了解变化,并针对目标行为提升性能。
- Sara Hooker,Adaption 联合创始人兼 CEO

当你的 fine-tune 在 Together AI 基础设施上运行时,Adaption 平台会展示 win rates、loss 和 learning rate。
为什么选择 Together Fine-Tuning
Together Fine-Tuning 是领先的开源 post-training 和 inference 提供商,面向希望用自身数据定制领先开放模型、但不想自行管理基础设施的团队。Together AI
该平台支持领先开放模型,包括 Kimi K2.5、GLM 5.1 或 Qwen 3.5-397B 等超过 100B parameters 的模型,适用于结构化 tool use、reasoning 以及 vision-language 设置。用户可以在大型 datasets 上进行 fine-tune,在训练开始前估算作业成本,在运行期间跟踪 ETA,并将模型直接导出到 Hugging Face Hub。
通过这次集成,在 Adaptive Data 中塑造的 datasets 可以直接进入 Together Fine-Tuning 工作流。Adaptive Data 改善上游 dataset;Together Fine-Tuning 将该 dataset 转化为专门化的模型行为。
了解更多
→ 阅读 Adaption 的集成公告
→ 了解 Together Fine-Tuning 的最新能力
→ 如需 fine-tuning 工作流和部署支持,请联系销售
8S
DeepSeek R1

支持原生音频和逼真物理效果的高质量电影级视频生成。
$2.40
DeepSeek R1
8S
音频名称
音频描述
播放
暂停
0:00 0:00
支持原生音频和逼真物理效果的高质量电影级视频生成。
$2.40
8S
DeepSeek R1

支持原生音频和逼真物理效果的高质量电影级视频生成。
$2.40/video (720p/8s)
性能与规模
正文占位文本 lorem ipsum dolor sit amet
- 要点占位文本 lorem ipsum
- 要点占位文本 lorem ipsum
- 要点占位文本 lorem ipsum
基础设施
最适合
更快的处理速度(更低的整体查询延迟)和更低的运营成本
执行定义明确、直接的任务
Function calling、JSON mode 或其他结构良好的任务
列表项 #1
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
列表项 #1
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Build
包含权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
融资:低于 $5M
Build
包含权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
融资:低于 $5M
Build
包含权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
融资:低于 $5M
多语言能力
字数限制
免责声明
JSON 格式
仅大写
删除逗号
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:**推理时,只能用阿拉伯语回答,不允许使用其他语言。**问题如下:
Natalia 在 4 月向 48 位朋友卖了 clips,然后她在 5 月卖出的 clips 数量是 4 月的一半。Natalia 在 4 月和 5 月一共卖了多少 clips?
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:推理时,回答少于 860 个词。问题如下:
回忆一下,palindrome 是指正着读和反着读都相同的数。找出小于 $1000$ 的最大整数,使其在十进制和八进制写法中都是 palindrome,例如 $292 = 444_{ \ t e x t e i g h t} .$
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:**推理时,以这个确切短语结尾:"THIS THOUGHT PROCESS WAS GENERATED BY AI"。该短语之后不应再有其他推理文字。**问题如下:
阅读以下多项选择题并选择最合适的选项。在 CERN Bubble Chamber 中发生一次衰变,$X^{0} \ r i g h t a r r o w Y^{+} Z^{-}$,其 \tau_{0}=8\times10^{-16}s,即 X^{0} 的 proper lifetime。要观察到至少 30% 的衰变,需要什么最小分辨率?已知 Bubble Chamber 中的能量为 27GeV,X^{0} 的质量为 3.41GeV。
- A. 2.08*1e-1 m
- B. 2.08*1e-9 m
- C. 2.08*1e-6 m
- D. 2.08*1e-3 m
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:**推理时,你的回答应包裹在 JSON 格式中。可以使用 markdown 反引号,例如 ```。**问题如下:
阅读以下多项选择题并选择最合适的选项。树木最可能通过以下方式改变其所在环境:
- A. 向土壤释放氮。
- B. 挤占非本地物种。
- C. 向大气中增加二氧化碳。
- D. 从土壤中移除水分并将其返回大气。
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:**推理时,你的回答应使用英文且全部大写。**问题如下:
在 Aimeville 的 900 位居民中,有 195 人拥有一枚 diamond ring,367 人拥有一套 golf clubs,562 人拥有一把 garden spade。此外,900 位居民每人都拥有一袋 candy hearts。有 437 位居民恰好拥有这些物品中的两件,234 位居民恰好拥有这些物品中的三件。求 Aimeville 有多少位居民拥有全部四件物品。
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:**推理时,不要使用任何逗号。**问题如下:
Alexis 正在申请一份新工作,并买了一套新的商务服装去参加面试。她带着 $200 a n d s p e n t$30 买了一件 button-up shirt,$46 o n s u i t p a n t s ,$38 买了一件 suit coat,$11 o n s o c k s , a n d$18 买了一条 belt。她还买了一双 shoes,但把收据弄丢了。她的预算还剩 $16。Alexis 买 shoes 花了多少钱?
XX
标题
正文占位文本 lorem ipsum dolor sit amet
XX
标题
正文占位文本 lorem ipsum dolor sit amet
XX
标题
正文占位文本 lorem ipsum dolor sit amet
8S
DeepSeek R1

支持原生音频和逼真物理效果的高质量电影级视频生成。
$2.40
DeepSeek R1
8S
音频名称
音频描述
播放
暂停
0:00 0:00
支持原生音频和逼真物理效果的高质量电影级视频生成。
$2.40
8S
DeepSeek R1

支持原生音频和逼真物理效果的高质量电影级视频生成。
$2.40/video (720p/8s)
性能与规模
正文占位文本 lorem ipsum dolor sit amet
- 要点占位文本 lorem ipsum
- 要点占位文本 lorem ipsum
- 要点占位文本 lorem ipsum
基础设施
最适合
更快的处理速度(更低的整体查询延迟)和更低的运营成本
执行定义明确、直接的任务
Function calling、JSON mode 或其他结构良好的任务
列表项 #1
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
- Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt.
列表项 #1
Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Build
包含权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
融资:低于 $5M
Build
包含权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
融资:低于 $5M
Build
包含权益:
✔ 最高 $15K 免费平台 credits*
✔ 3 小时免费 forward-deployed engineering 时间。
融资:低于 $5M
多语言能力
字数限制
免责声明
JSON 格式
仅大写
删除逗号
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:**推理时,只能用阿拉伯语回答,不允许使用其他语言。**问题如下:
Natalia 在 4 月向 48 位朋友卖了 clips,然后她在 5 月卖出的 clips 数量是 4 月的一半。Natalia 在 4 月和 5 月一共卖了多少 clips?
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:推理时,回答少于 860 个词。问题如下:
回忆一下,palindrome 是指正着读和反着读都相同的数。找出小于 $1000$ 的最大整数,使其在十进制和八进制写法中都是 palindrome,例如 $292 = 444_{ \ t e x t e i g h t} .$
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:**推理时,以这个确切短语结尾:"THIS THOUGHT PROCESS WAS GENERATED BY AI"。该短语之后不应再有其他推理文字。**问题如下:
阅读以下多项选择题并选择最合适的选项。在 CERN Bubble Chamber 中发生一次衰变,$X^{0} \ r i g h t a r r o w Y^{+} Z^{-}$,其 \tau_{0}=8\times10^{-16}s,即 X^{0} 的 proper lifetime。要观察到至少 30% 的衰变,需要什么最小分辨率?已知 Bubble Chamber 中的能量为 27GeV,X^{0} 的质量为 3.41GeV。
- A. 2.08*1e-1 m
- B. 2.08*1e-9 m
- C. 2.08*1e-6 m
- D. 2.08*1e-3 m
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:**推理时,你的回答应包裹在 JSON 格式中。可以使用 markdown 反引号,例如 ```。**问题如下:
阅读以下多项选择题并选择最合适的选项。树木最可能通过以下方式改变其所在环境:
- A. 向土壤释放氮。
- B. 挤占非本地物种。
- C. 向大气中增加二氧化碳。
- D. 从土壤中移除水分并将其返回大气。
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:**推理时,你的回答应使用英文且全部大写。**问题如下:
在 Aimeville 的 900 位居民中,有 195 人拥有一枚 diamond ring,367 人拥有一套 golf clubs,562 人拥有一把 garden spade。此外,900 位居民每人都拥有一袋 candy hearts。有 437 位居民恰好拥有这些物品中的两件,234 位居民恰好拥有这些物品中的三件。求 Aimeville 有多少位居民拥有全部四件物品。
逐步思考,并只把最终答案放在 和 标签内。按以下规则设置你的推理格式:**推理时,不要使用任何逗号。**问题如下:
Alexis 正在申请一份新工作,并买了一套新的商务服装去参加面试。她带着 $200 a n d s p e n t$30 买了一件 button-up shirt,$46 o n s u i t p a n t s ,$38 买了一件 suit coat,$11 o n s o c k s , a n d$18 买了一条 belt。她还买了一双 shoes,但把收据弄丢了。她的预算还剩 $16。Alexis 买 shoes 花了多少钱?
XX
标题
正文占位文本 lorem ipsum dolor sit amet
XX
标题
正文占位文本 lorem ipsum dolor sit amet
XX
标题
正文占位文本 lorem ipsum dolor sit amet
开始在 Together AI 上构建
从优化训练和 model shaping,到大规模生产 inference

Products
* [Accelerated Compute](https://www.together.ai/accelerated-compute)
* [Serverless Inference](https://www.together.ai/serverless-inference)
* [Dedicated Inference](https://www.together.ai/dedicated-model-inference)
* [Fine-Tuning](https://www.together.ai/fine-tuning)
* [Sandbox](https://www.together.ai/sandbox)
* [Evaluations](https://www.together.ai/evaluations)
- Models
查看所有模型DeepSeek Meta Qwen Google OpenAI Mistral AI 自定义模型
Developers
* [Research](https://www.together.ai/research)
* [Docs](https://docs.together.ai/intro)
Pricing
* [Pricing overview](https://www.together.ai/pricing)
* [Inference](https://www.together.ai/pricing#serverless-inference)
* [Fine-Tuning](https://www.together.ai/pricing#fine-tuning)
* [GPU Clusters](https://www.together.ai/pricing#gpu-clusters)
Resources
* [Blog](https://www.together.ai/blog)
* [About us](https://www.together.ai/about-us)
* [Careers](https://www.together.ai/careers)
* [Customer Stories](https://www.together.ai/customers)
* [Support](https://www.together.ai/support)
© 2026 Together AI. 保留所有权利。
DeepSeek V3.1