实録译稿 社区 24h

术语频次

封存归档

Qwen3

█▂▅▂ · 616 次 · 收录于 83 篇

通义千问第三代模型系列

  1. Nemotron-Labs 扩散语言模型实现光速级文本生成 产品 · HF Blog · 05-23
  2. DelTA: 基于可验证奖励的强化学习中的判别性令牌信用分配 研究 · HF Papers · 05-22
  3. vLLM x Novita AI:PegaFlow 实现生产级外部 KV 缓存 工程 · vLLM · 05-20
  4. 推出 Ettin Reranker 系列 产品 · HF Blog · 05-19
  5. 五分钟看懂LLM过去六个月 评测 · Simon Willison · 05-19
  6. 阿里千问发布Qwen3.7-Max-Preview,数学能力升至总榜第七 字节跳动开源3B全模态模型Lance,统一处理文本、图像与视频 评测 · X · 05-19
  7. 字节跳动开源3B全模态模型Lance,训练仅用128张A100显卡 评测 · X · 05-19
  8. VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练 工程 · vLLM · 05-18
  9. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  10. 最新开放制品(#21):开放模型大爆发!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。 评测 · Interconnects · 05-17
  11. DavidAU 团队基于 Qwen3.5-27B 拼接训练出非官方 Qwen3.5-40B Dense 模型 研究 · X · 05-15
  12. 特斯拉 AI5 芯片流片成功,带宽接近 MacStudio M2 Ultra 产品 · X · 05-15
  13. vllm v0.21.0 工程 · GitHub Release · 05-15
  14. Intern-S2-Preview 研究 · InternLM · 05-15
  15. Intern-S2-Preview-FP8 研究 · InternLM · 05-15
  16. Qwen3-TTS:低成本、高性能文本转语音 工程 · Baseten · 05-15
  17. TurboQuant 首次全面研究:精度与性能 评测 · vLLM · 05-15
  18. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-15
  19. 开源 Qwen3.5 小型 LLM 实现,Gated DeltaNet 不增加 KV cache 大小 研究 · X · 05-13
  20. 印度发布 Sarvam 30B 和 105B 开源推理模型,105B 采用 DeepSeek 风格 MLA 注意力 研究 · X · 05-13
  21. 如何实现真正的无服务器GPU 工程 · Modal · 05-12
  22. sglang v0.5.11 工程 · GitHub Release · 05-12
  23. vllm v0.20.2 工程 · GitHub Release · 05-12
  24. transformers v5.7.0 工程 · GitHub Release · 05-12
  25. Sub-32B 开放权重 产品 · Artificial Analysis · 05-12
  26. OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct 产品 · Artificial Analysis · 05-12
  27. Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4 研究 · Import AI · 05-12
  28. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-12
  29. MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
  30. TurboQuant 首次全面研究:精度与性能 研究 · vLLM · 05-12
  31. MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
  32. MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
  33. MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
  34. MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
  35. MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
  36. MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
  37. MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
  38. MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
  39. 用一个 Python 字典将多模态推理性能提升 >10% 工程 · Modal · 05-09
  40. CyberSecQwen-4B:为什么防御性网络安全需要小型、专用、可本地运行的模型 产品 · HF Blog · 05-09
  41. MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
  42. MedQA:在 AMD ROCm 上微调临床 AI,无需 CUDA 工程 · HF Blog · 05-08
  43. nidhinjs/prompt-master 工程 · GitHub · 05-08
  44. wanshuiyin/睡眠中自动 Claude Code 研究 工程 · GitHub · 05-08
  45. SciCore-Mol 研究 · OpenBMB · 05-07
  46. Qwen3.6-35B-A3B多项benchmark显示Agent能力提升 研究 · X · 05-07
  47. 混元3架构解析:整合Apertus、DeepSeek与Qwen MoE 工程 · X · 05-07
  48. Nvidia 发布 Nemotron 3 Super 120B-A12B,throughput 突出 研究 · X · 05-07
  49. Google 发布 Gemma 4 专用 draft model,推测解码最高提速 3.1x 产品 · X · 05-07
  50. Gemma 4 架构近似前代,benchmark 明显提升 研究 · X · 05-07
  51. 重新思考推理密集型检索:评估并改进 Agentic 搜索系统中的检索器 研究 · HF Papers · 05-07
  52. HKUDS/Vibe-Trading 工程 · GitHub · 05-07
  53. 证据链:用于迭代式 RAG 的像素级视觉归因 HF Papers · 05-06
  54. 超越 SFT-to-RL:通过 Black-Box On-Policy Distillation 进行多模态 RL 的预对齐 HF Papers · 05-06
  55. MolmoAct 2:面向现实世界机器人工作的开放基础 | Ai2 Allen AI · 05-06
  56. 持久视觉记忆:为 LVLMs 的深度生成维持感知 HF Papers · 05-05
  57. Vibe 中的远程 agent,由 Mistral Medium 3.5 驱动 Mistral · 05-04
  58. Qwen3.6-27B-FP8 产品 · Qwen · 05-03
  59. Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
  60. 现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
  61. Qwen/SAE-Res-Qwen3.5-9B-Base-W64K-L0_50 产品 · Qwen · 05-03
  62. Qwen/SAE-Res-Qwen3.5-9B-Base-W64K-L0_100 研究 · Qwen · 05-03
  63. Qwen3.6-27B 产品 · Qwen · 05-03
  64. Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W32K-L0_50 产品 · Qwen · 05-03
  65. Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W128K-L0_100 研究 · Qwen · 05-03
  66. Qwen/SAE-Res-Qwen3-30B-A3B-Base-W128K-L0_100 研究 · Qwen · 05-03
  67. SAE-Res-Qwen3.5-2B-Base-W32K-L0_50 工程 · Qwen · 05-03
  68. SAE-Res-Qwen3-1.7B-Base-W32K-L0_50 产品 · Qwen · 05-03
  69. SAE-Res-Qwen3-1.7B-Base-W32K-L0_100 产品 · Qwen · 05-03
  70. SAE-Res-Qwen3.5-2B-Base-W32K-L0_100 研究 · Qwen · 05-03
  71. Qwen/SAE-Res-Qwen3.5-27B-W80K-L0_50 研究 · Qwen · 05-03
  72. Qwen/SAE-Res-Qwen3.5-27B-W80K-L0_100 研究 · Qwen · 05-03
  73. SAE-Res-Qwen3-8B-Base-W64K-L0_50 研究 · Qwen · 05-03
  74. SAE-Res-Qwen3-8B-Base-W64K-L0_100 工程 · Qwen · 05-03
  75. Qwen/SAE-Res-Qwen3-30B-A3B-Base-W32K-L0_50 研究 · Qwen · 05-03
  76. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  77. NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
  78. vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
  79. 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
  80. 用分布感知 speculative decoding 将 RL rollouts 加速最高 50% Together AI · 05-03
  81. Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
  82. 从 732 字节到无处可去:在生产环境中关闭 Copy Fail 工程 · Together AI · 05-03
  83. 使用 RoundPipe 在多个消费级 GPUs 上高效训练 HF Papers · 05-01