録实録译稿议社区 24h

词术语频次

历封存归档

reasoning model

█▄█▂ · 55 次 · 收录于 26 篇

推理模型 · 专门优化思考能力的模型类别

OpenAI模型推翻离散几何核心猜想研究 · OpenAI · 05-21
transformers v5.9.0 工程 · GitHub Release · 05-20
LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
ChatGPT 中的全新个人理财体验产品 · OpenAI · 05-16
vllm v0.21.0 工程 · GitHub Release · 05-15
通过简单统一缩放实现金牌级奥赛推理研究 · HF Papers · 05-15
管理日益强大的开放权重AI系统的风险研究 · UK AISI · 05-15
自主AI网络能力进步有多快？评测 · UK AISI · 05-15
印度发布 Sarvam 30B 和 105B 开源推理模型，105B 采用 DeepSeek 风格 MLA 注意力研究 · X · 05-13
Sub-32B 开放权重产品 · Artificial Analysis · 05-12
DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列产品 · Artificial Analysis · 05-12
OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct 产品 · Artificial Analysis · 05-12
解读今日开放-封闭性能差距研究 · Interconnects · 05-12
OncoAgent：用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架研究 · HF Blog · 05-10
自适应并行推理：高效推理扩展的下一范式研究 · BAIR · 05-09
在 Modal 上构建 RL 定理证明工作流工程 · Modal · 05-09
nidhinjs/prompt-master 工程 · GitHub · 05-08
NGC论文提出用RL训练LLM管理自身KV cache 研究 · X · 05-07
MolmoAct 2：面向现实世界机器人工作的开放基础 | Ai2 Allen AI · 05-06
MolmoAct2：面向现实世界部署的动作推理模型 HF Papers · 05-05
用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手 AWS ML · 05-03
用分布感知 speculative decoding 将 RL rollouts 加速最高 50% Together AI · 05-03
DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
Coding Agent 的组成部分 Sebastian Raschka · 05-03
我们对社区安全的承诺 OpenAI · 04-30
LLM 通过 Latent Distilling 进行探索 HF Papers · 04-30