録实録译稿议社区 24h

词术语频次

历封存归档

Qwen3

█▂▅▂ · 616 次 · 收录于 83 篇

通义千问第三代模型系列

Nemotron-Labs 扩散语言模型实现光速级文本生成产品 · HF Blog · 05-23
DelTA: 基于可验证奖励的强化学习中的判别性令牌信用分配研究 · HF Papers · 05-22
vLLM x Novita AI：PegaFlow 实现生产级外部 KV 缓存工程 · vLLM · 05-20
推出 Ettin Reranker 系列产品 · HF Blog · 05-19
五分钟看懂LLM过去六个月评测 · Simon Willison · 05-19
阿里千问发布Qwen3.7-Max-Preview，数学能力升至总榜第七字节跳动开源3B全模态模型Lance，统一处理文本、图像与视频评测 · X · 05-19
字节跳动开源3B全模态模型Lance，训练仅用128张A100显卡评测 · X · 05-19
VeRL-Omni 发布：扩散与全模态模型的简易、快速、稳定 RL 训练工程 · vLLM · 05-18
LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
最新开放制品（#21）：开放模型大爆发！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。评测 · Interconnects · 05-17
DavidAU 团队基于 Qwen3.5-27B 拼接训练出非官方 Qwen3.5-40B Dense 模型研究 · X · 05-15
特斯拉 AI5 芯片流片成功，带宽接近 MacStudio M2 Ultra 产品 · X · 05-15
vllm v0.21.0 工程 · GitHub Release · 05-15
Intern-S2-Preview 研究 · InternLM · 05-15
Intern-S2-Preview-FP8 研究 · InternLM · 05-15
Qwen3-TTS：低成本、高性能文本转语音工程 · Baseten · 05-15
TurboQuant 首次全面研究：精度与性能评测 · vLLM · 05-15
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-15
开源 Qwen3.5 小型 LLM 实现，Gated DeltaNet 不增加 KV cache 大小研究 · X · 05-13
印度发布 Sarvam 30B 和 105B 开源推理模型，105B 采用 DeepSeek 风格 MLA 注意力研究 · X · 05-13
如何实现真正的无服务器GPU 工程 · Modal · 05-12
sglang v0.5.11 工程 · GitHub Release · 05-12
vllm v0.20.2 工程 · GitHub Release · 05-12
transformers v5.7.0 工程 · GitHub Release · 05-12
Sub-32B 开放权重产品 · Artificial Analysis · 05-12
OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct 产品 · Artificial Analysis · 05-12
Import AI 454：自动化对齐研究；中国模型安全评估；HiFloat4 研究 · Import AI · 05-12
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-12
MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
TurboQuant 首次全面研究：精度与性能研究 · vLLM · 05-12
MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
用一个 Python 字典将多模态推理性能提升 >10% 工程 · Modal · 05-09
CyberSecQwen-4B：为什么防御性网络安全需要小型、专用、可本地运行的模型产品 · HF Blog · 05-09
MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
MedQA：在 AMD ROCm 上微调临床 AI，无需 CUDA 工程 · HF Blog · 05-08
nidhinjs/prompt-master 工程 · GitHub · 05-08
wanshuiyin/睡眠中自动 Claude Code 研究工程 · GitHub · 05-08
SciCore-Mol 研究 · OpenBMB · 05-07
Qwen3.6-35B-A3B多项benchmark显示Agent能力提升研究 · X · 05-07
混元3架构解析：整合Apertus、DeepSeek与Qwen MoE 工程 · X · 05-07
Nvidia 发布 Nemotron 3 Super 120B-A12B，throughput 突出研究 · X · 05-07
Google 发布 Gemma 4 专用 draft model，推测解码最高提速 3.1x 产品 · X · 05-07
Gemma 4 架构近似前代，benchmark 明显提升研究 · X · 05-07
重新思考推理密集型检索：评估并改进 Agentic 搜索系统中的检索器研究 · HF Papers · 05-07
HKUDS/Vibe-Trading 工程 · GitHub · 05-07
证据链：用于迭代式 RAG 的像素级视觉归因 HF Papers · 05-06
超越 SFT-to-RL：通过 Black-Box On-Policy Distillation 进行多模态 RL 的预对齐 HF Papers · 05-06
MolmoAct 2：面向现实世界机器人工作的开放基础 | Ai2 Allen AI · 05-06
持久视觉记忆：为 LVLMs 的深度生成维持感知 HF Papers · 05-05
Vibe 中的远程 agent，由 Mistral Medium 3.5 驱动 Mistral · 05-04
Qwen3.6-27B-FP8 产品 · Qwen · 05-03
Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
Qwen/SAE-Res-Qwen3.5-9B-Base-W64K-L0_50 产品 · Qwen · 05-03
Qwen/SAE-Res-Qwen3.5-9B-Base-W64K-L0_100 研究 · Qwen · 05-03
Qwen3.6-27B 产品 · Qwen · 05-03
Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W32K-L0_50 产品 · Qwen · 05-03
Qwen/SAE-Res-Qwen3.5-35B-A3B-Base-W128K-L0_100 研究 · Qwen · 05-03
Qwen/SAE-Res-Qwen3-30B-A3B-Base-W128K-L0_100 研究 · Qwen · 05-03
SAE-Res-Qwen3.5-2B-Base-W32K-L0_50 工程 · Qwen · 05-03
SAE-Res-Qwen3-1.7B-Base-W32K-L0_50 产品 · Qwen · 05-03
SAE-Res-Qwen3-1.7B-Base-W32K-L0_100 产品 · Qwen · 05-03
SAE-Res-Qwen3.5-2B-Base-W32K-L0_100 研究 · Qwen · 05-03
Qwen/SAE-Res-Qwen3.5-27B-W80K-L0_50 研究 · Qwen · 05-03
Qwen/SAE-Res-Qwen3.5-27B-W80K-L0_100 研究 · Qwen · 05-03
SAE-Res-Qwen3-8B-Base-W64K-L0_50 研究 · Qwen · 05-03
SAE-Res-Qwen3-8B-Base-W64K-L0_100 工程 · Qwen · 05-03
Qwen/SAE-Res-Qwen3-30B-A3B-Base-W32K-L0_50 研究 · Qwen · 05-03
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状工程 · vLLM · 05-03
NVIDIA Nemotron 3 Nano Omni：面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
用分布感知 speculative decoding 将 RL rollouts 加速最高 50% Together AI · 05-03
Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
从 732 字节到无处可去：在生产环境中关闭 Copy Fail 工程 · Together AI · 05-03
使用 RoundPipe 在多个消费级 GPUs 上高效训练 HF Papers · 05-01