録实録译稿议社区 24h

词术语频次

历封存归档

scaling

▃█▇▃ · 242 次 · 收录于 103 篇

扩展规律 · 模型能力随规模增长的现象

BitCPM-CANN-0.5B-unquantized 工程 · OpenBMB · 05-24
BitCPM-CANN-1B-未量化工程 · OpenBMB · 05-24
BitCPM-CANN-3B-unquantized 工程 · OpenBMB · 05-24
BitCPM-CANN-8B-未量化工程 · OpenBMB · 05-24
专业化胜过规模化：多数AI采购决策忽视的战略变量研究 · HF Blog · 05-22
谷歌DeepMind加速器项目落地亚太，应对环境风险产品 · DeepMind · 05-22
Modal C轮融资：以46.5亿美元估值募资3.55亿美元产品 · Modal · 05-22
Mega-ASR：通过扩展真实世界声学模拟实现野外²语音识别研究 · HF Papers · 05-21
为何MoE模型能从推测解码中获益更多研究 · Cohere · 05-21
在应用计算中扩展强化学习工程 · Modal · 05-21
NVIDIA 验证的 Agent 技能为 AI Agent 提供能力治理工程 · NVIDIA Developer · 05-20
vLLM 中的弹性专家并行工程 · vLLM · 05-20
代码即代理工具研究 · HF Papers · 05-20
WeatherNext 如何帮助美国国家飓风中心更准确预测飓风梅丽莎在牙买加的历史性登陆产品 · DeepMind · 05-20
让内容创建与编辑过程更易理解产品 · DeepMind · 05-20
OlmoEarth v1.1：更高效的模型系列产品 · HF Blog · 05-20
OlmoEarth v1.1：更高效的模型系列 | Ai2 产品 · Allen AI · 05-20
可扩展语音代理设计：Amazon Nova Sonic 的多代理、工具与会话分割工程 · AWS ML · 05-20
Import AI 457：AI 震网；诅咒的 Muon 优化器；与正向对齐研究 · Import AI · 05-19
使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频工程 · HF Blog · 05-19
PhysBrain 1.0 技术报告研究 · HF Papers · 05-18
BitCPM4-CANN-0.5B-未量化产品 · OpenBMB · 05-18
BitCPM4-CANN-1B-未量化产品 · OpenBMB · 05-18
BitCPM4-CANN-3B-未量化工程 · OpenBMB · 05-18
BitCPM4-CANN-8B-未量化工程 · OpenBMB · 05-18
“无法”论证的安全案例模板研究 · UK AISI · 05-17
LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
AISI的安全案例研究 · UK AISI · 05-17
评估前沿AI系统的早期经验评测 · UK AISI · 05-16
RepliBench：衡量AI系统中的自主复制能力研究 · UK AISI · 05-16
如何评估AI agent的控制措施？研究 · UK AISI · 05-16
为何我们研究白盒控制研究 · UK AISI · 05-15
通过简单统一缩放实现金牌级奥赛推理研究 · HF Papers · 05-15
Intern-S2-Preview 研究 · InternLM · 05-15
Intern-S2-Preview-FP8 研究 · InternLM · 05-15
当前AI系统的局限性映射研究 · UK AISI · 05-15
2028：全球AI领导力的两种情景研究 · Anthropic Research · 05-15
vLLM x Mooncake 规模化服务 Agent 工作负载工程 · vLLM · 05-15
AnyFlow: 基于同策略流图蒸馏的任意步视频扩散模型研究 · HF Papers · 05-14
Apollo 2026年5月更新产品 · Apollo Research · 05-14
AI agent 能逃出沙箱吗？容器逃逸能力安全基准测试研究 · UK AISI · 05-14
前沿AI智能体在多步网络攻击场景中表现如何？评测 · UK AISI · 05-14
AI网络任务中推理扩展的证据：增加评估预算揭示更高成功率研究 · UK AISI · 05-14
我们对Claude Mythos Preview网络能力的评估评测 · UK AISI · 05-13
如何与AI协作并实现复利工程 · Eugene Yan · 05-12
如何实现真正的无服务器GPU 工程 · Modal · 05-12
transformers v5.5.4 工程 · GitHub Release · 05-12
中国AI实验室内部笔记对话 · Interconnects · 05-12
我对开源模型的押注，2026年中研究 · Interconnects · 05-12
Import AI 453：破解AI智能体；MirrorCode；以及关于渐进式失能的十种观点研究 · Import AI · 05-12
Import AI 455：AI系统即将开始自我构建研究 · Import AI · 05-12
Import AI 454：自动化对齐研究；中国模型安全评估；HiFloat4 研究 · Import AI · 05-12
AWS 上基础模型训练与推理的构建模块工程 · HF Blog · 05-12
均值模式尖叫：面向千层扩散Transformer的均值-方差分裂残差研究 · HF Papers · 05-12
xAI将Colossus 1租给Anthropic做inference 工程 · X Trending · 05-10
自适应并行推理：高效推理扩展的下一范式研究 · BAIR · 05-09
world modeling被称为robotics新预训练范式研究 · X · 05-09
在 Modal 上构建 RL 定理证明工作流工程 · Modal · 05-09
自动扩缩 Autoresearch：在 Modal 上为你的 agents 提供弹性 GPU 工程 · Modal · 05-09
Robotics: Endgame 演讲提出 Physical AGI 路线图研究 · X · 05-08
MedQA：在 AMD ROCm 上微调临床 AI，无需 CUDA 工程 · HF Blog · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
wanshuiyin/睡眠中自动 Claude Code 研究工程 · GitHub · 05-08
克服奖励信号挑战：在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习工程 · AWS ML · 05-08
用 GPT-5.5 和 GPT-5.5-Cyber 扩展网络安全可信访问产品 · OpenAI · 05-08
自然语言 Autoencoders 研究 · Anthropic Research · 05-08
幕后：用 Claude Mythos Preview 加固 Firefox 工程 · Simon Willison · 05-08
AlphaEvolve：我们的 Gemini 驱动 coding agent 如何在各领域扩大影响研究 · DeepMind · 05-08
混元3架构解析：整合Apertus、DeepSeek与Qwen MoE 工程 · X · 05-07
总结RL scaling laws与pretraining scaling laws的差异研究 · X · 05-07
比较 pretraining 与 RL 中 scaling laws 的用法差异研究 · X · 05-07
介绍 LLM RL 中的 entropy bonus 正则化作用研究 · X · 05-07
NVIDIA 机器人实验室发布 GR00T、Dreams、SONIC 等成果产品 · X · 05-07
DreamDojo 开源基于人类视频的机器人 world model 产品 · X · 05-07
EgoScale用2万小时人类第一视角视频训练灵巧手人形机器人研究 · X · 05-07
Stream-T1：用于流式视频生成的 Test-Time Scaling 研究 · HF Papers · 05-07
用 vLLM x Mooncake 大规模服务 Agentic 工作负载工程 · vLLM · 05-07
vLLM V0 到 V1：RL 中纠错前先确保正确性工程 · HF Blog · 05-07
用 MRC（Multipath Reliable Connection）解锁大规模 AI 训练网络工程 · OpenAI · 05-06
StateSMix：基于 Mamba 状态空间模型与稀疏 N-gram 上下文混合的在线无损压缩 HF Papers · 05-06
OpenSeeker-v2：用信息量高且高难度的轨迹推动搜索 agent 的极限 HF Papers · 05-06
用于跨文档 RAG 的层次化摘要树 HF Papers · 05-05
支撑大规模高效推理的基础研究 Together AI · 05-05
Themis：训练鲁棒的多语言代码奖励模型，用于灵活的多标准评分 HF Papers · 05-04
Qwen3.6-27B-FP8 产品 · Qwen · 05-03
Qwen3.6-27B 产品 · Qwen · 05-03
将 Codex 扩展至全球企业 OpenAI · 05-03
Claude Code 最佳实践 - Claude Code 文档 Anthropic Engineering · 05-03
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03
揭秘 AI agents 的 evals Anthropic Engineering · 05-03
介绍 GPT-5.5 OpenAI · 05-03
moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
NVIDIA Nemotron 3 Nano Omni：面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
Popsa 如何使用 Amazon Nova 通过个性化标题建议启发客户 AWS ML · 05-03
规模化构建和测试我们最先进 AI 的方式 Meta AI · 05-03
介绍 Muse Spark：迈向个人超级智能 Meta AI · 05-03
ViPO：大规模视觉偏好优化 HF Papers · 05-02
协同演化的策略蒸馏 HF Papers · 05-01
在图像编辑中利用基于 Verifier 的强化学习 HF Papers · 05-01
我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
用 AI agents 编写高效工具 Anthropic Engineering · 05-01
扩展 Managed Agents：将大脑与双手解耦 Anthropic Engineering · 05-01
LLM 通过 Latent Distilling 进行探索 HF Papers · 04-30