词
历chain-of-thought
思维链 · 让模型逐步推理的提示方法
- AI系统监管会变得更难吗?
- 前沿AI问答评估开发早期洞察
- 长文本任务
- 为何我们研究白盒控制
- 结构化引出实验协议
- Intern-S2-Preview
- Intern-S2-Preview-FP8
- Apollo 2026年5月更新
- 评估AI模型是否会破坏AI安全研究
- SocialReasoning-Bench:衡量AI智能体是否以用户最佳利益行事
- MiniCPM-V-4.6-Thinking-gguf
- MiniCPM-V-4.6-Thinking
- MiniCPM-V-4.6-Thinking-AWQ
- MiniCPM-V-4.6-Thinking-GPTQ
- MiniCPM-V-4.6-Thinking-BNB
- 自适应并行推理:高效推理扩展的下一范式
- world modeling被称为robotics新预训练范式
- MiniCPM-V-4_5-GPTQ
- nidhinjs/prompt-master
- rohitg00/从零开始的 AI 工程
- 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习
- NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用
- LaDiR:Latent Diffusion 增强 LLMs 的文本推理能力
- 自适应思考:LLM 知道何时在潜在空间中思考
- 服从性与合理性:大型语言模型的推理可控性
- 在图像编辑中利用基于 Verifier 的强化学习
- 用 AI agents 编写高效工具
- Claude Code auto 模式:更安全地跳过权限确认