实録译稿 社区 24h

术语频次

封存归档

architectures

█▃▇▄ · 85 次 · 收录于 46 篇

  1. AI系统监管会变得更难吗? 研究 · UK AISI · 05-22
  2. vLLM 中的弹性专家并行 工程 · vLLM · 05-20
  3. OlmoEarth v1.1:更高效的模型系列 产品 · HF Blog · 05-20
  4. OlmoEarth v1.1:更高效的模型系列 | Ai2 产品 · Allen AI · 05-20
  5. 推出 Ettin Reranker 系列 产品 · HF Blog · 05-19
  6. LongLive-2.0:面向长视频生成的NVFP4并行基础设施 研究 · HF Papers · 05-19
  7. 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频 工程 · HF Blog · 05-19
  8. VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练 工程 · vLLM · 05-18
  9. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  10. 新型评估与Agent脚手架赏金计划 研究 · UK AISI · 05-16
  11. vllm v0.21.0 工程 · GitHub Release · 05-15
  12. Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量 产品 · HF Blog · 05-15
  13. Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理 工程 · AWS ML · 05-15
  14. vLLM x Mooncake 规模化服务 Agent 工作负载 工程 · vLLM · 05-15
  15. TurboQuant 首次全面研究:精度与性能 评测 · vLLM · 05-15
  16. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-15
  17. AnyFlow: 基于同策略流图蒸馏的任意步视频扩散模型 研究 · HF Papers · 05-14
  18. MinT:训练与服务百万级LLM的托管基础设施 研究 · HF Papers · 05-14
  19. MulTaBench:基于文本与图像的多模态表格学习基准测试 研究 · HF Papers · 05-14
  20. 从头实现LLM架构的Python/PyTorch教程及开放权重模型对比方法 工程 · X · 05-14
  21. AIMIP 发布:AI 天气与气候模型比对项目 | Ai2 评测 · Allen AI · 05-14
  22. SenseNova-U1:基于NEO-unify架构统一多模态理解与生成 研究 · HF Papers · 05-13
  23. Sub-32B 开放权重 产品 · Artificial Analysis · 05-12
  24. 近期开源权重模型发布 产品 · Artificial Analysis · 05-12
  25. Import AI 456:RSI与经济增长;AI监管的激进可选性;神经计算机 研究 · Import AI · 05-12
  26. AWS 上基础模型训练与推理的构建模块 工程 · HF Blog · 05-12
  27. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-12
  28. TurboQuant 首次全面研究:精度与性能 研究 · vLLM · 05-12
  29. OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架 研究 · HF Blog · 05-10
  30. world modeling被称为robotics新预训练范式 研究 · X · 05-09
  31. 自动扩缩 Autoresearch:在 Modal 上为你的 agents 提供弹性 GPU 工程 · Modal · 05-09
  32. 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题 工程 · Together AI · 05-09
  33. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  34. APEX:面向 AI 生成音乐的大规模多任务美学感知流行度预测 研究 · HF Papers · 05-07
  35. 用 vLLM x Mooncake 大规模服务 Agentic 工作负载 工程 · vLLM · 05-07
  36. 支撑大规模高效推理的基础研究 Together AI · 05-05
  37. 现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
  38. vLLM 中的 DeepSeek V4:高效长上下文 Attention vLLM · 05-03
  39. 揭秘 AI agents 的 evals Anthropic Engineering · 05-03
  40. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  41. vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
  42. NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用 AWS ML · 05-03
  43. 用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手 AWS ML · 05-03
  44. 我理解 LLM 架构的工作流 Sebastian Raschka · 05-03
  45. 我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
  46. 面向 AI agents 的有效 context engineering Anthropic Engineering · 05-01