实録译稿 社区 24h

术语频次

封存归档

attention

█▃▆▂ · 734 次 · 收录于 117 篇

Transformer 核心机制 · 计算 token 间相关性

  1. Nemotron-Labs 扩散语言模型实现光速级文本生成 产品 · HF Blog · 05-23
  2. 全注意力回归:百步训练内将全注意力转为稀疏 研究 · HF Papers · 05-23
  3. 如何通过评估与可观测性赢得利益相关者信任 产品 · Braintrust · 05-22
  4. FTC要求Cox Media Group等三家公司支付近100万美元,以和解其关于“主动监听”AI营销服务欺骗客户的指控 产品 · Simon Willison · 05-22
  5. Modal C轮融资:以46.5亿美元估值募资3.55亿美元 产品 · Modal · 05-22
  6. 为何MoE模型能从推测解码中获益更多 研究 · Cohere · 05-21
  7. transformers v5.9.0 工程 · GitHub Release · 05-20
  8. vLLM x Novita AI:PegaFlow 实现生产级外部 KV 缓存 工程 · vLLM · 05-20
  9. vLLM 中的弹性专家并行 工程 · vLLM · 05-20
  10. 大规模推理基准测试:编码智能体 评测 · Together AI · 05-20
  11. 推出 Ettin Reranker 系列 产品 · HF Blog · 05-19
  12. 五分钟看懂LLM过去六个月 评测 · Simon Willison · 05-19
  13. 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频 工程 · HF Blog · 05-19
  14. PaddleOCR 3.5:使用 Transformers 后端运行 OCR 与文档解析任务 工程 · HF Blog · 05-19
  15. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  16. sglang v0.5.12 工程 · GitHub Release · 05-17
  17. 从Gemma 4到DeepSeek V4:LLM长上下文效率优化技术导览 研究 · X · 05-17
  18. 评估前沿AI系统的早期经验 评测 · UK AISI · 05-16
  19. Claude Code 百万 token 上下文窗口的双刃剑效应与会话管理策略 工程 · X · 05-16
  20. 构建通用无障碍代理——过程中的经验教训 工程 · GitHub AI/ML · 05-16
  21. vllm v0.21.0 工程 · GitHub Release · 05-15
  22. 2028:全球AI领导力的两种情景 研究 · Anthropic Research · 05-15
  23. 智能体异步大规模协作研究:GitHub 分支模式原型设计 研究 · X · 05-15
  24. Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量 产品 · HF Blog · 05-15
  25. Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理 工程 · AWS ML · 05-15
  26. 解锁连续批处理中的异步性 工程 · HF Blog · 05-15
  27. vLLM x Mooncake 规模化服务 Agent 工作负载 工程 · vLLM · 05-15
  28. TurboQuant 首次全面研究:精度与性能 评测 · vLLM · 05-15
  29. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-15
  30. MinT:训练与服务百万级LLM的托管基础设施 研究 · HF Papers · 05-14
  31. Apollo 2026年5月更新 产品 · Apollo Research · 05-14
  32. AI模型如何说服?通过大规模实验探索AI说服的杠杆 研究 · UK AISI · 05-14
  33. GridSFM:一种新型小型电网基础模型 研究 · MS Research · 05-14
  34. 资助60个项目推进AI对齐研究 研究 · UK AISI · 05-14
  35. 构建安全有效的沙箱,在 Windows 上启用 Codex 工程 · OpenAI · 05-14
  36. δ-mem:大语言模型的高效在线记忆 研究 · HF Papers · 05-13
  37. 沙盒AI智能体能从评估环境中学到什么? 研究 · UK AISI · 05-13
  38. 问而不告:减少大语言模型中的谄媚行为 研究 · UK AISI · 05-13
  39. 评估AI模型是否会破坏AI安全研究 评测 · UK AISI · 05-13
  40. 印度发布 Sarvam 30B 和 105B 开源推理模型,105B 采用 DeepSeek 风格 MLA 注意力 研究 · X · 05-13
  41. 参数高尔夫教给我们的AI辅助研究经验 产品 · OpenAI · 05-13
  42. 如何与AI协作并实现复利 工程 · Eugene Yan · 05-12
  43. 如何实现真正的无服务器GPU 工程 · Modal · 05-12
  44. sglang v0.5.11 工程 · GitHub Release · 05-12
  45. transformers v5.8.0 工程 · GitHub Release · 05-12
  46. vllm v0.20.2 工程 · GitHub Release · 05-12
  47. transformers v5.7.0 工程 · GitHub Release · 05-12
  48. BalCapRL:基于RL的MLLM图像描述平衡框架 研究 · Apple ML · 05-12
  49. AWS 上基础模型训练与推理的构建模块 工程 · HF Blog · 05-12
  50. 关于GitLab裁员及"结构与战略决策"的思考 产品 · Simon Willison · 05-12
  51. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-12
  52. MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
  53. 均值模式尖叫:面向千层扩散Transformer的均值-方差分裂残差 研究 · HF Papers · 05-12
  54. TurboQuant 首次全面研究:精度与性能 研究 · vLLM · 05-12
  55. MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
  56. MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
  57. MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
  58. MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
  59. MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
  60. MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
  61. MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
  62. MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
  63. 自适应并行推理:高效推理扩展的下一范式 研究 · BAIR · 05-09
  64. 用一个 Python 字典将多模态推理性能提升 >10% 工程 · Modal · 05-09
  65. 如何在 AI Agents 中正确使用 MCP servers 工程 · Phil Schmid · 05-09
  66. Agent 如何管理其他 Agent:2026 年四种 Subagent 模式 工程 · Phil Schmid · 05-09
  67. CyberSecQwen-4B:为什么防御性网络安全需要小型、专用、可本地运行的模型 产品 · HF Blog · 05-09
  68. 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题 工程 · Together AI · 05-09
  69. MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
  70. MedQA:在 AMD ROCm 上微调临床 AI,无需 CUDA 工程 · HF Blog · 05-08
  71. nidhinjs/prompt-master 工程 · GitHub · 05-08
  72. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  73. 用于学习语义丰富视觉表征的文本条件 JEPA 研究 · Apple ML · 05-08
  74. 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习 工程 · AWS ML · 05-08
  75. 混元3架构解析:整合Apertus、DeepSeek与Qwen MoE 工程 · X · 05-07
  76. Gemma 4 架构近似前代,benchmark 明显提升 研究 · X · 05-07
  77. SimpleStream以最近4帧作为视频流理解强baseline 研究 · X · 05-07
  78. NGC论文提出用RL训练LLM管理自身KV cache 研究 · X · 05-07
  79. autoresearch使nanochat的Time to GPT-2缩短11% 工程 · X · 05-07
  80. 基于 In-Context Sparse Attention 的快速统一视频编辑 研究 · HF Papers · 05-07
  81. 使用迭代去噪的归一化流 研究 · Apple ML · 05-07
  82. 用 vLLM x Mooncake 大规模服务 Agentic 工作负载 工程 · vLLM · 05-07
  83. Vibe coding 和 agentic engineering 比我希望的更接近了 对话 · Simon Willison · 05-06
  84. SplAttN:用 Gaussian Soft Splatting 和 Attention 连接 2D 与 3D 以实现点云补全 HF Papers · 05-06
  85. 持久视觉记忆:为 LVLMs 的深度生成维持感知 HF Papers · 05-05
  86. 更好的模型,更快的训练:用于单细胞基础模型的 Sigmoid Attention HF Papers · 05-05
  87. 支撑大规模高效推理的基础研究 Together AI · 05-05
  88. Talker-T2AV:基于自回归扩散建模的联合说话音视频生成 HF Papers · 05-04
  89. Qwen3.6-27B-FP8 产品 · Qwen · 05-03
  90. 现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
  91. Qwen3.6-27B 产品 · Qwen · 05-03
  92. 用于编排的开源规范:Symphony OpenAI · 05-03
  93. Claude Code 最佳实践 - Claude Code 文档 Anthropic Engineering · 05-03
  94. Claude Opus 4.7 介绍 Anthropic · 05-03
  95. vLLM 中的 DeepSeek V4:高效长上下文 Attention vLLM · 05-03
  96. 揭秘 AI agents 的 evals Anthropic Engineering · 05-03
  97. 介绍 GPT-5.5 OpenAI · 05-03
  98. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  99. moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
  100. NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
  101. deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
  102. vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
  103. deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
  104. 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
  105. DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
  106. 面向 LLM 的大规模交互识别 BAIR · 05-03
  107. Coding Agent 的组成部分 Sebastian Raschka · 05-03
  108. 我们能靠 AI 走向更可持续的世界吗 对话 · MS Research · 05-03
  109. STARFlow-V:基于 Normalizing Flows 的端到端视频生成建模 Apple ML · 05-03
  110. MoCapAnything V2:面向任意骨架的端到端动作捕捉 HF Papers · 05-01
  111. 面向 AI agents 的有效 context engineering Anthropic Engineering · 05-01
  112. 用 Agent Skills 让 agent 适应真实世界 Anthropic Engineering · 05-01
  113. 用 sandboxing 让 Claude Code 更安全、更自主 Anthropic Engineering · 05-01
  114. 长时间运行的应用开发的 harness 设计 Anthropic Engineering · 05-01
  115. Claude Code auto 模式:更安全地跳过权限确认 Anthropic Engineering · 05-01
  116. 量化 agentic 编码评测中的基础设施噪声 Anthropic Engineering · 05-01
  117. 扭转 TIDE:Diffusion 大语言模型的跨架构蒸馏 HF Papers · 04-30