词
历reasoning model
推理模型 · 专门优化思考能力的模型类别
- OpenAI模型推翻离散几何核心猜想
- transformers v5.9.0
- LLM架构最新进展:KV共享、mHC与压缩注意力
- ChatGPT 中的全新个人理财体验
- vllm v0.21.0
- 通过简单统一缩放实现金牌级奥赛推理
- 管理日益强大的开放权重AI系统的风险
- 自主AI网络能力进步有多快?
- 印度发布 Sarvam 30B 和 105B 开源推理模型,105B 采用 DeepSeek 风格 MLA 注意力
- Sub-32B 开放权重
- DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列
- OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct
- 解读今日开放-封闭性能差距
- OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架
- 自适应并行推理:高效推理扩展的下一范式
- 在 Modal 上构建 RL 定理证明工作流
- nidhinjs/prompt-master
- NGC论文提出用RL训练LLM管理自身KV cache
- MolmoAct 2:面向现实世界机器人工作的开放基础 | Ai2
- MolmoAct2:面向现实世界部署的动作推理模型
- 用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手
- 用分布感知 speculative decoding 将 RL rollouts 加速最高 50%
- DeepSeek-V4 Pro 现已在 Together AI 上可用
- Coding Agent 的组成部分
- 我们对社区安全的承诺
- LLM 通过 Latent Distilling 进行探索