词
历DeepSeek-V3
DeepSeek 第三代开源大模型 · MoE 架构
- vLLM x Novita AI:PegaFlow 实现生产级外部 KV 缓存
- 开放Agent排行榜
- LLM架构最新进展:KV共享、mHC与压缩注意力
- sglang v0.5.12
- vLLM 登顶 Artificial Analysis 排行榜
- 开放模型生态如何持续放大优势
- sglang v0.5.11
- transformers v5.8.0
- DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列
- 近期开源权重模型发布
- Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4
- vLLM 登顶 Artificial Analysis 排行榜
- 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题
- rohitg00/从零开始的 AI 工程
- 混元3架构解析:整合Apertus、DeepSeek与Qwen MoE
- HKUDS/Vibe-Trading
- JackChen-me/open-multi-agent
- Together AI 与 Adaption 建立合作伙伴关系
- 现代 LLM 中 Attention 变体的可视化指南
- vLLM 中的 DeepSeek V4:高效长上下文 Attention
- vLLM 中 FP8 KV-Cache 与 Attention 量化的现状
- moonshotai/Kimi-K2.6
- deepseek-ai/DeepSeek-V4-Pro
- deepseek-ai/DeepSeek-V4-Flash
- Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni
- DeepSeek-V4 Pro 现已在 Together AI 上可用
- 从 732 字节到无处可去:在生产环境中关闭 Copy Fail