词
历Llama
Meta 开源大模型系列
- BitCPM-CANN-1B-gguf
- BitCPM-CANN-0.5B-gguf
- BitCPM-CANN-3B-gguf
- BitCPM-CANN-0.5B-unquantized
- BitCPM-CANN-1B-未量化
- BitCPM-CANN-3B-unquantized
- BitCPM-CANN-8B-gguf
- BitCPM-CANN-8B-未量化
- BitCPM4-CANN-0.5B-gguf
- BitCPM4-CANN-1B-gguf
- BitCPM4-CANN-3B-gguf
- BitCPM4-CANN-8B-gguf
- 腾讯发布Hy-MT2系列翻译模型,30B-A3B版本在DomainMTBench超越DeepSeek-V4-Pro
- vLLM x Novita AI:PegaFlow 实现生产级外部 KV 缓存
- BitCPM4-CANN-0.5B-未量化
- BitCPM4-CANN-1B-未量化
- BitCPM4-CANN-3B-未量化
- BitCPM4-CANN-8B-未量化
- 为何我们研究白盒控制
- 管理日益强大的开放权重AI系统的风险
- Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量
- TurboQuant 首次全面研究:精度与性能
- 中国AI实验室内部笔记
- Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4
- MiniCPM-V-4.6-gguf
- TurboQuant 首次全面研究:精度与性能
- MiniCPM-V-4.6-Thinking-gguf
- MiniCPM-V-4.6-Thinking
- MiniCPM-V-4.6-AWQ
- MiniCPM-V-4.6-BNB
- MiniCPM-V-4.6-GPTQ
- MiniCPM-V-4.6-Thinking-AWQ
- MiniCPM-V-4.6-Thinking-GPTQ
- MiniCPM-V-4.6-Thinking-BNB
- open-multi-agent/open-multi-agent
- CyberSecQwen-4B:为什么防御性网络安全需要小型、专用、可本地运行的模型
- MiniCPM-V-4_5-GPTQ
- nidhinjs/prompt-master
- rohitg00/从零开始的 AI 工程
- 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习
- JackChen-me/open-multi-agent
- 现代 LLM 中 Attention 变体的可视化指南
- vLLM 中 FP8 KV-Cache 与 Attention 量化的现状
- 无冲突的容量:面向 AI-native 团队的多租户 GPU 集群设计指南