实録译稿 社区 24h

术语频次

封存归档

interpretability

█▂▂▁ · 46 次 · 收录于 26 篇

可解释性 · 理解模型内部运作机制

  1. Gemini 3.5:具备行动能力的前沿智能 产品 · DeepMind · 05-20
  2. AISI的安全案例 研究 · UK AISI · 05-17
  3. 我们如何弥合AI能力与防护之间的差距 研究 · UK AISI · 05-16
  4. 为何我们研究白盒控制 研究 · UK AISI · 05-15
  5. Import AI 456:RSI与经济增长;AI监管的激进可选性;神经计算机 研究 · Import AI · 05-12
  6. EMO:为涌现模块化预训练 Mixture of Experts | Ai2 研究 · Allen AI · 05-09
  7. EMO:为涌现模块化预训练混合专家 研究 · HF Blog · 05-09
  8. 自然语言 Autoencoders 研究 · Anthropic Research · 05-08
  9. MolmoAct 2:面向现实世界机器人工作的开放基础 | Ai2 Allen AI · 05-06
  10. Qwen/SAE-Res-Qwen3.5-9B-Base-W64K-L0_50 产品 · Qwen · 05-03
  11. Qwen/SAE-Res-Qwen3.5-9B-Base-W64K-L0_100 研究 · Qwen · 05-03
  12. Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W32K-L0_50 产品 · Qwen · 05-03
  13. Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W128K-L0_100 研究 · Qwen · 05-03
  14. Qwen/SAE-Res-Qwen3-30B-A3B-Base-W128K-L0_100 研究 · Qwen · 05-03
  15. SAE-Res-Qwen3.5-2B-Base-W32K-L0_50 工程 · Qwen · 05-03
  16. SAE-Res-Qwen3-1.7B-Base-W32K-L0_50 产品 · Qwen · 05-03
  17. SAE-Res-Qwen3-1.7B-Base-W32K-L0_100 产品 · Qwen · 05-03
  18. SAE-Res-Qwen3.5-2B-Base-W32K-L0_100 研究 · Qwen · 05-03
  19. Qwen/SAE-Res-Qwen3.5-27B-W80K-L0_50 研究 · Qwen · 05-03
  20. Qwen/SAE-Res-Qwen3.5-27B-W80K-L0_100 研究 · Qwen · 05-03
  21. SAE-Res-Qwen3-8B-Base-W64K-L0_50 研究 · Qwen · 05-03
  22. SAE-Res-Qwen3-8B-Base-W64K-L0_100 工程 · Qwen · 05-03
  23. Qwen/SAE-Res-Qwen3-30B-A3B-Base-W32K-L0_50 研究 · Qwen · 05-03
  24. 面向 LLM 的大规模交互识别 BAIR · 05-03
  25. 大语言模型中的情感概念及其功能 Anthropic Research · 04-30
  26. 自动化对齐研究者:使用 LLM 扩展可扩展监督 Anthropic Research · 04-30