实録译稿 社区 24h

术语频次

封存归档

reasoning model

█▄█▂ · 55 次 · 收录于 26 篇

推理模型 · 专门优化思考能力的模型类别

  1. OpenAI模型推翻离散几何核心猜想 研究 · OpenAI · 05-21
  2. transformers v5.9.0 工程 · GitHub Release · 05-20
  3. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  4. ChatGPT 中的全新个人理财体验 产品 · OpenAI · 05-16
  5. vllm v0.21.0 工程 · GitHub Release · 05-15
  6. 通过简单统一缩放实现金牌级奥赛推理 研究 · HF Papers · 05-15
  7. 管理日益强大的开放权重AI系统的风险 研究 · UK AISI · 05-15
  8. 自主AI网络能力进步有多快? 评测 · UK AISI · 05-15
  9. 印度发布 Sarvam 30B 和 105B 开源推理模型,105B 采用 DeepSeek 风格 MLA 注意力 研究 · X · 05-13
  10. Sub-32B 开放权重 产品 · Artificial Analysis · 05-12
  11. DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列 产品 · Artificial Analysis · 05-12
  12. OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct 产品 · Artificial Analysis · 05-12
  13. 解读今日开放-封闭性能差距 研究 · Interconnects · 05-12
  14. OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架 研究 · HF Blog · 05-10
  15. 自适应并行推理:高效推理扩展的下一范式 研究 · BAIR · 05-09
  16. 在 Modal 上构建 RL 定理证明工作流 工程 · Modal · 05-09
  17. nidhinjs/prompt-master 工程 · GitHub · 05-08
  18. NGC论文提出用RL训练LLM管理自身KV cache 研究 · X · 05-07
  19. MolmoAct 2:面向现实世界机器人工作的开放基础 | Ai2 Allen AI · 05-06
  20. MolmoAct2:面向现实世界部署的动作推理模型 HF Papers · 05-05
  21. 用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手 AWS ML · 05-03
  22. 用分布感知 speculative decoding 将 RL rollouts 加速最高 50% Together AI · 05-03
  23. DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
  24. Coding Agent 的组成部分 Sebastian Raschka · 05-03
  25. 我们对社区安全的承诺 OpenAI · 04-30
  26. LLM 通过 Latent Distilling 进行探索 HF Papers · 04-30