实録译稿 社区 24h

术语频次

封存归档

scaling

▃█▇▃ · 242 次 · 收录于 103 篇

扩展规律 · 模型能力随规模增长的现象

  1. BitCPM-CANN-0.5B-unquantized 工程 · OpenBMB · 05-24
  2. BitCPM-CANN-1B-未量化 工程 · OpenBMB · 05-24
  3. BitCPM-CANN-3B-unquantized 工程 · OpenBMB · 05-24
  4. BitCPM-CANN-8B-未量化 工程 · OpenBMB · 05-24
  5. 专业化胜过规模化:多数AI采购决策忽视的战略变量 研究 · HF Blog · 05-22
  6. 谷歌DeepMind加速器项目落地亚太,应对环境风险 产品 · DeepMind · 05-22
  7. Modal C轮融资:以46.5亿美元估值募资3.55亿美元 产品 · Modal · 05-22
  8. Mega-ASR:通过扩展真实世界声学模拟实现野外²语音识别 研究 · HF Papers · 05-21
  9. 为何MoE模型能从推测解码中获益更多 研究 · Cohere · 05-21
  10. 在应用计算中扩展强化学习 工程 · Modal · 05-21
  11. NVIDIA 验证的 Agent 技能为 AI Agent 提供能力治理 工程 · NVIDIA Developer · 05-20
  12. vLLM 中的弹性专家并行 工程 · vLLM · 05-20
  13. 代码即代理工具 研究 · HF Papers · 05-20
  14. WeatherNext 如何帮助美国国家飓风中心更准确预测飓风梅丽莎在牙买加的历史性登陆 产品 · DeepMind · 05-20
  15. 让内容创建与编辑过程更易理解 产品 · DeepMind · 05-20
  16. OlmoEarth v1.1:更高效的模型系列 产品 · HF Blog · 05-20
  17. OlmoEarth v1.1:更高效的模型系列 | Ai2 产品 · Allen AI · 05-20
  18. 可扩展语音代理设计:Amazon Nova Sonic 的多代理、工具与会话分割 工程 · AWS ML · 05-20
  19. Import AI 457:AI 震网;诅咒的 Muon 优化器;与正向对齐 研究 · Import AI · 05-19
  20. 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频 工程 · HF Blog · 05-19
  21. PhysBrain 1.0 技术报告 研究 · HF Papers · 05-18
  22. BitCPM4-CANN-0.5B-未量化 产品 · OpenBMB · 05-18
  23. BitCPM4-CANN-1B-未量化 产品 · OpenBMB · 05-18
  24. BitCPM4-CANN-3B-未量化 工程 · OpenBMB · 05-18
  25. BitCPM4-CANN-8B-未量化 工程 · OpenBMB · 05-18
  26. “无法”论证的安全案例模板 研究 · UK AISI · 05-17
  27. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  28. AISI的安全案例 研究 · UK AISI · 05-17
  29. 评估前沿AI系统的早期经验 评测 · UK AISI · 05-16
  30. RepliBench:衡量AI系统中的自主复制能力 研究 · UK AISI · 05-16
  31. 如何评估AI agent的控制措施? 研究 · UK AISI · 05-16
  32. 为何我们研究白盒控制 研究 · UK AISI · 05-15
  33. 通过简单统一缩放实现金牌级奥赛推理 研究 · HF Papers · 05-15
  34. Intern-S2-Preview 研究 · InternLM · 05-15
  35. Intern-S2-Preview-FP8 研究 · InternLM · 05-15
  36. 当前AI系统的局限性映射 研究 · UK AISI · 05-15
  37. 2028:全球AI领导力的两种情景 研究 · Anthropic Research · 05-15
  38. vLLM x Mooncake 规模化服务 Agent 工作负载 工程 · vLLM · 05-15
  39. AnyFlow: 基于同策略流图蒸馏的任意步视频扩散模型 研究 · HF Papers · 05-14
  40. Apollo 2026年5月更新 产品 · Apollo Research · 05-14
  41. AI agent 能逃出沙箱吗?容器逃逸能力安全基准测试 研究 · UK AISI · 05-14
  42. 前沿AI智能体在多步网络攻击场景中表现如何? 评测 · UK AISI · 05-14
  43. AI网络任务中推理扩展的证据:增加评估预算揭示更高成功率 研究 · UK AISI · 05-14
  44. 我们对Claude Mythos Preview网络能力的评估 评测 · UK AISI · 05-13
  45. 如何与AI协作并实现复利 工程 · Eugene Yan · 05-12
  46. 如何实现真正的无服务器GPU 工程 · Modal · 05-12
  47. transformers v5.5.4 工程 · GitHub Release · 05-12
  48. 中国AI实验室内部笔记 对话 · Interconnects · 05-12
  49. 我对开源模型的押注,2026年中 研究 · Interconnects · 05-12
  50. Import AI 453:破解AI智能体;MirrorCode;以及关于渐进式失能的十种观点 研究 · Import AI · 05-12
  51. Import AI 455:AI系统即将开始自我构建 研究 · Import AI · 05-12
  52. Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4 研究 · Import AI · 05-12
  53. AWS 上基础模型训练与推理的构建模块 工程 · HF Blog · 05-12
  54. 均值模式尖叫:面向千层扩散Transformer的均值-方差分裂残差 研究 · HF Papers · 05-12
  55. xAI将Colossus 1租给Anthropic做inference 工程 · X Trending · 05-10
  56. 自适应并行推理:高效推理扩展的下一范式 研究 · BAIR · 05-09
  57. world modeling被称为robotics新预训练范式 研究 · X · 05-09
  58. 在 Modal 上构建 RL 定理证明工作流 工程 · Modal · 05-09
  59. 自动扩缩 Autoresearch:在 Modal 上为你的 agents 提供弹性 GPU 工程 · Modal · 05-09
  60. Robotics: Endgame 演讲提出 Physical AGI 路线图 研究 · X · 05-08
  61. MedQA:在 AMD ROCm 上微调临床 AI,无需 CUDA 工程 · HF Blog · 05-08
  62. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  63. wanshuiyin/睡眠中自动 Claude Code 研究 工程 · GitHub · 05-08
  64. 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习 工程 · AWS ML · 05-08
  65. 用 GPT-5.5 和 GPT-5.5-Cyber 扩展网络安全可信访问 产品 · OpenAI · 05-08
  66. 自然语言 Autoencoders 研究 · Anthropic Research · 05-08
  67. 幕后:用 Claude Mythos Preview 加固 Firefox 工程 · Simon Willison · 05-08
  68. AlphaEvolve:我们的 Gemini 驱动 coding agent 如何在各领域扩大影响 研究 · DeepMind · 05-08
  69. 混元3架构解析:整合Apertus、DeepSeek与Qwen MoE 工程 · X · 05-07
  70. 总结RL scaling laws与pretraining scaling laws的差异 研究 · X · 05-07
  71. 比较 pretraining 与 RL 中 scaling laws 的用法差异 研究 · X · 05-07
  72. 介绍 LLM RL 中的 entropy bonus 正则化作用 研究 · X · 05-07
  73. NVIDIA 机器人实验室发布 GR00T、Dreams、SONIC 等成果 产品 · X · 05-07
  74. DreamDojo 开源基于人类视频的机器人 world model 产品 · X · 05-07
  75. EgoScale用2万小时人类第一视角视频训练灵巧手人形机器人 研究 · X · 05-07
  76. Stream-T1:用于流式视频生成的 Test-Time Scaling 研究 · HF Papers · 05-07
  77. 用 vLLM x Mooncake 大规模服务 Agentic 工作负载 工程 · vLLM · 05-07
  78. vLLM V0 到 V1:RL 中纠错前先确保正确性 工程 · HF Blog · 05-07
  79. 用 MRC(Multipath Reliable Connection)解锁大规模 AI 训练网络 工程 · OpenAI · 05-06
  80. StateSMix:基于 Mamba 状态空间模型与稀疏 N-gram 上下文混合的在线无损压缩 HF Papers · 05-06
  81. OpenSeeker-v2:用信息量高且高难度的轨迹推动搜索 agent 的极限 HF Papers · 05-06
  82. 用于跨文档 RAG 的层次化摘要树 HF Papers · 05-05
  83. 支撑大规模高效推理的基础研究 Together AI · 05-05
  84. Themis:训练鲁棒的多语言代码奖励模型,用于灵活的多标准评分 HF Papers · 05-04
  85. Qwen3.6-27B-FP8 产品 · Qwen · 05-03
  86. Qwen3.6-27B 产品 · Qwen · 05-03
  87. 将 Codex 扩展至全球企业 OpenAI · 05-03
  88. Claude Code 最佳实践 - Claude Code 文档 Anthropic Engineering · 05-03
  89. vLLM 中的 DeepSeek V4:高效长上下文 Attention vLLM · 05-03
  90. 揭秘 AI agents 的 evals Anthropic Engineering · 05-03
  91. 介绍 GPT-5.5 OpenAI · 05-03
  92. moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
  93. NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
  94. Popsa 如何使用 Amazon Nova 通过个性化标题建议启发客户 AWS ML · 05-03
  95. 规模化构建和测试我们最先进 AI 的方式 Meta AI · 05-03
  96. 介绍 Muse Spark:迈向个人超级智能 Meta AI · 05-03
  97. ViPO:大规模视觉偏好优化 HF Papers · 05-02
  98. 协同演化的策略蒸馏 HF Papers · 05-01
  99. 在图像编辑中利用基于 Verifier 的强化学习 HF Papers · 05-01
  100. 我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
  101. 用 AI agents 编写高效工具 Anthropic Engineering · 05-01
  102. 扩展 Managed Agents:将大脑与双手解耦 Anthropic Engineering · 05-01
  103. LLM 通过 Latent Distilling 进行探索 HF Papers · 04-30