録实録译稿议社区 24h

词术语频次

历封存归档

quantization

▃▂▃█ · 235 次 · 收录于 46 篇

量化 · 降低权重精度以减少计算 / 存储

BitCPM-CANN-1B 工程 · OpenBMB · 05-24
BitCPM-CANN-3B 工程 · OpenBMB · 05-24
BitCPM-CANN-8B 研究 · OpenBMB · 05-24
BitCPM-CANN-0.5B 工程 · OpenBMB · 05-24
BitCPM-CANN-1B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-0.5B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-3B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-0.5B-unquantized 工程 · OpenBMB · 05-24
BitCPM-CANN-1B-未量化工程 · OpenBMB · 05-24
BitCPM-CANN-3B-unquantized 工程 · OpenBMB · 05-24
BitCPM-CANN-8B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-8B-未量化工程 · OpenBMB · 05-24
BitCPM4-CANN-0.5B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-1B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-3B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-8B-gguf 研究 · OpenBMB · 05-22
VeRL-Omni 发布：扩散与全模态模型的简易、快速、稳定 RL 训练工程 · vLLM · 05-18
BitCPM4-CANN-0.5B 工程 · OpenBMB · 05-18
BitCPM4-CANN-1B 工程 · OpenBMB · 05-18
BitCPM4-CANN-3B 工程 · OpenBMB · 05-18
BitCPM4-CANN-0.5B-未量化产品 · OpenBMB · 05-18
BitCPM4-CANN-1B-未量化产品 · OpenBMB · 05-18
BitCPM4-CANN-3B-未量化工程 · OpenBMB · 05-18
BitCPM4-CANN-8B-未量化工程 · OpenBMB · 05-18
BitCPM4-CANN-8B 研究 · OpenBMB · 05-18
TurboQuant 首次全面研究：精度与性能评测 · vLLM · 05-15
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-15
参数高尔夫教给我们的AI辅助研究经验产品 · OpenAI · 05-13
Sub-32B 开放权重产品 · Artificial Analysis · 05-12
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-12
TurboQuant 首次全面研究：精度与性能研究 · vLLM · 05-12
自动扩缩 Autoresearch：在 Modal 上为你的 agents 提供弹性 GPU 工程 · Modal · 05-09
CyberSecQwen-4B：为什么防御性网络安全需要小型、专用、可本地运行的模型产品 · HF Blog · 05-09
服务 DeepSeek-V4：为什么百万 token 上下文是推理系统问题工程 · Together AI · 05-09
MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
MedQA：在 AMD ROCm 上微调临床 AI，无需 CUDA 工程 · HF Blog · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
模型量化：使用 NVIDIA Model Optimizer 进行训练后量化工程 · NVIDIA Developer · 05-08
支撑大规模高效推理的基础研究 Together AI · 05-05
Qwen3.6-27B-FP8 产品 · Qwen · 05-03
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状工程 · vLLM · 05-03
moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
使用 Adaptive Quantization 与 Differential Privacy 提升 Non-IID Federated Learning 的隐私和通信效率 HF Papers · 05-01