实録译稿 社区 24h

术语频次

封存归档

quantization

▃▂▃█ · 235 次 · 收录于 46 篇

量化 · 降低权重精度以减少计算 / 存储

  1. BitCPM-CANN-1B 工程 · OpenBMB · 05-24
  2. BitCPM-CANN-3B 工程 · OpenBMB · 05-24
  3. BitCPM-CANN-8B 研究 · OpenBMB · 05-24
  4. BitCPM-CANN-0.5B 工程 · OpenBMB · 05-24
  5. BitCPM-CANN-1B-gguf 研究 · OpenBMB · 05-24
  6. BitCPM-CANN-0.5B-gguf 研究 · OpenBMB · 05-24
  7. BitCPM-CANN-3B-gguf 研究 · OpenBMB · 05-24
  8. BitCPM-CANN-0.5B-unquantized 工程 · OpenBMB · 05-24
  9. BitCPM-CANN-1B-未量化 工程 · OpenBMB · 05-24
  10. BitCPM-CANN-3B-unquantized 工程 · OpenBMB · 05-24
  11. BitCPM-CANN-8B-gguf 研究 · OpenBMB · 05-24
  12. BitCPM-CANN-8B-未量化 工程 · OpenBMB · 05-24
  13. BitCPM4-CANN-0.5B-gguf 研究 · OpenBMB · 05-22
  14. BitCPM4-CANN-1B-gguf 研究 · OpenBMB · 05-22
  15. BitCPM4-CANN-3B-gguf 研究 · OpenBMB · 05-22
  16. BitCPM4-CANN-8B-gguf 研究 · OpenBMB · 05-22
  17. VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练 工程 · vLLM · 05-18
  18. BitCPM4-CANN-0.5B 工程 · OpenBMB · 05-18
  19. BitCPM4-CANN-1B 工程 · OpenBMB · 05-18
  20. BitCPM4-CANN-3B 工程 · OpenBMB · 05-18
  21. BitCPM4-CANN-0.5B-未量化 产品 · OpenBMB · 05-18
  22. BitCPM4-CANN-1B-未量化 产品 · OpenBMB · 05-18
  23. BitCPM4-CANN-3B-未量化 工程 · OpenBMB · 05-18
  24. BitCPM4-CANN-8B-未量化 工程 · OpenBMB · 05-18
  25. BitCPM4-CANN-8B 研究 · OpenBMB · 05-18
  26. TurboQuant 首次全面研究:精度与性能 评测 · vLLM · 05-15
  27. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-15
  28. 参数高尔夫教给我们的AI辅助研究经验 产品 · OpenAI · 05-13
  29. Sub-32B 开放权重 产品 · Artificial Analysis · 05-12
  30. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-12
  31. TurboQuant 首次全面研究:精度与性能 研究 · vLLM · 05-12
  32. 自动扩缩 Autoresearch:在 Modal 上为你的 agents 提供弹性 GPU 工程 · Modal · 05-09
  33. CyberSecQwen-4B:为什么防御性网络安全需要小型、专用、可本地运行的模型 产品 · HF Blog · 05-09
  34. 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题 工程 · Together AI · 05-09
  35. MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
  36. MedQA:在 AMD ROCm 上微调临床 AI,无需 CUDA 工程 · HF Blog · 05-08
  37. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  38. 模型量化:使用 NVIDIA Model Optimizer 进行训练后量化 工程 · NVIDIA Developer · 05-08
  39. 支撑大规模高效推理的基础研究 Together AI · 05-05
  40. Qwen3.6-27B-FP8 产品 · Qwen · 05-03
  41. vLLM 中的 DeepSeek V4:高效长上下文 Attention vLLM · 05-03
  42. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  43. moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
  44. vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
  45. 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
  46. 使用 Adaptive Quantization 与 Differential Privacy 提升 Non-IID Federated Learning 的隐私和通信效率 HF Papers · 05-01