録实録译稿议社区 24h

词术语频次

历封存归档

Llama

▃▃█▃ · 195 次 · 收录于 44 篇

Meta 开源大模型系列

BitCPM-CANN-1B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-0.5B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-3B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-0.5B-unquantized 工程 · OpenBMB · 05-24
BitCPM-CANN-1B-未量化工程 · OpenBMB · 05-24
BitCPM-CANN-3B-unquantized 工程 · OpenBMB · 05-24
BitCPM-CANN-8B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-8B-未量化工程 · OpenBMB · 05-24
BitCPM4-CANN-0.5B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-1B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-3B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-8B-gguf 研究 · OpenBMB · 05-22
腾讯发布Hy-MT2系列翻译模型，30B-A3B版本在DomainMTBench超越DeepSeek-V4-Pro 产品 · X · 05-22
vLLM x Novita AI：PegaFlow 实现生产级外部 KV 缓存工程 · vLLM · 05-20
BitCPM4-CANN-0.5B-未量化产品 · OpenBMB · 05-18
BitCPM4-CANN-1B-未量化产品 · OpenBMB · 05-18
BitCPM4-CANN-3B-未量化工程 · OpenBMB · 05-18
BitCPM4-CANN-8B-未量化工程 · OpenBMB · 05-18
为何我们研究白盒控制研究 · UK AISI · 05-15
管理日益强大的开放权重AI系统的风险研究 · UK AISI · 05-15
Granite Embedding Multilingual R2：Apache 2.0 开源多语言嵌入，32K 上下文 — 最佳 Sub-100M 检索质量产品 · HF Blog · 05-15
TurboQuant 首次全面研究：精度与性能评测 · vLLM · 05-15
中国AI实验室内部笔记对话 · Interconnects · 05-12
Import AI 454：自动化对齐研究；中国模型安全评估；HiFloat4 研究 · Import AI · 05-12
MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
TurboQuant 首次全面研究：精度与性能研究 · vLLM · 05-12
MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
open-multi-agent/open-multi-agent 工程 · GitHub · 05-10
CyberSecQwen-4B：为什么防御性网络安全需要小型、专用、可本地运行的模型产品 · HF Blog · 05-09
MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
nidhinjs/prompt-master 工程 · GitHub · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
克服奖励信号挑战：在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习工程 · AWS ML · 05-08
JackChen-me/open-multi-agent 工程 · GitHub · 05-07
现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状工程 · vLLM · 05-03
无冲突的容量：面向 AI-native 团队的多租户 GPU 集群设计指南 Together AI · 05-03