词
历DeepSeek
中国 AI 公司 · 开源大模型出品方
- 腾讯发布Hy-MT2系列翻译模型,30B-A3B版本在DomainMTBench超越DeepSeek-V4-Pro
- Modal C轮融资:以46.5亿美元估值募资3.55亿美元
- Midjourney 创始人自曝因用TPU弃N卡导致产品迭代落后一年
- vLLM 中的弹性专家并行
- 大规模推理基准测试:编码智能体
- LLM架构最新进展:KV共享、mHC与压缩注意力
- sglang v0.5.12
- 最新开放制品(#21):开放模型大爆发!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。
- vllm v0.21.0
- esengine/DeepSeek-Reasonix
- 2028:全球AI领导力的两种情景
- vLLM 登顶 Artificial Analysis 排行榜
- 印度发布 Sarvam 30B 和 105B 开源推理模型,105B 采用 DeepSeek 风格 MLA 注意力
- transformers v5.8.0
- Sub-32B 开放权重
- Kimi K2.6:新的领先开源权重模型
- DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列
- 近期开源权重模型发布
- 中国AI实验室内部笔记
- Import AI 455:AI系统即将开始自我构建
- Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4
- vLLM 登顶 Artificial Analysis 排行榜
- open-multi-agent/open-multi-agent
- 自适应并行推理:高效推理扩展的下一范式
- Claude Code 源码快照泄露,展示 repo context 与 subagent 设计
- Narcooo/inkos
- 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题
- rohitg00/从零开始的 AI 工程
- wanshuiyin/睡眠中自动 Claude Code 研究
- DeepSeek-V4-Pro与Flash大象牙膏测试优于V3但指令遵循存疑
- DeepSeek-V4需回传空reasoning_content以避免400
- CaP-X开源:机器人agentic toolkit与CaP-Gym
- HKUDS/Vibe-Trading
- JackChen-me/open-multi-agent
- nesquena/hermes-webui
- Together AI 与 Adaption 建立合作伙伴关系
- 现代 LLM 中 Attention 变体的可视化指南
- vLLM 中的 DeepSeek V4:高效长上下文 Attention
- vLLM 中 FP8 KV-Cache 与 Attention 量化的现状
- deepseek-ai/DeepSeek-V4-Flash-Base
- DeepInfra 登陆 Hugging Face 推理服务提供商 🔥
- deepseek-ai/DeepSeek-V4-Pro
- deepseek-ai/DeepSeek-V4-Pro-Base
- deepseek-ai/DeepSeek-V4-Flash
- Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni
- DeepSeek-V4 Pro 现已在 Together AI 上可用
- 从 732 字节到无处可去:在生产环境中关闭 Copy Fail
- 使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建