録实録译稿议社区 24h

词术语频次

历封存归档

DeepSeek

█▃▆▂ · 256 次 · 收录于 48 篇

中国 AI 公司 · 开源大模型出品方

腾讯发布Hy-MT2系列翻译模型，30B-A3B版本在DomainMTBench超越DeepSeek-V4-Pro 产品 · X · 05-22
Modal C轮融资：以46.5亿美元估值募资3.55亿美元产品 · Modal · 05-22
Midjourney 创始人自曝因用TPU弃N卡导致产品迭代落后一年工程 · X · 05-21
vLLM 中的弹性专家并行工程 · vLLM · 05-20
大规模推理基准测试：编码智能体评测 · Together AI · 05-20
LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
sglang v0.5.12 工程 · GitHub Release · 05-17
最新开放制品（#21）：开放模型大爆发！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。评测 · Interconnects · 05-17
vllm v0.21.0 工程 · GitHub Release · 05-15
esengine/DeepSeek-Reasonix 工程 · GitHub · 05-15
2028：全球AI领导力的两种情景研究 · Anthropic Research · 05-15
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-15
印度发布 Sarvam 30B 和 105B 开源推理模型，105B 采用 DeepSeek 风格 MLA 注意力研究 · X · 05-13
transformers v5.8.0 工程 · GitHub Release · 05-12
Sub-32B 开放权重产品 · Artificial Analysis · 05-12
Kimi K2.6：新的领先开源权重模型产品 · Artificial Analysis · 05-12
DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列产品 · Artificial Analysis · 05-12
近期开源权重模型发布产品 · Artificial Analysis · 05-12
中国AI实验室内部笔记对话 · Interconnects · 05-12
Import AI 455：AI系统即将开始自我构建研究 · Import AI · 05-12
Import AI 454：自动化对齐研究；中国模型安全评估；HiFloat4 研究 · Import AI · 05-12
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-12
open-multi-agent/open-multi-agent 工程 · GitHub · 05-10
自适应并行推理：高效推理扩展的下一范式研究 · BAIR · 05-09
Claude Code 源码快照泄露，展示 repo context 与 subagent 设计工程 · X · 05-09
Narcooo/inkos 工程 · GitHub · 05-09
服务 DeepSeek-V4：为什么百万 token 上下文是推理系统问题工程 · Together AI · 05-09
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
wanshuiyin/睡眠中自动 Claude Code 研究工程 · GitHub · 05-08
DeepSeek-V4-Pro与Flash大象牙膏测试优于V3但指令遵循存疑研究 · X · 05-07
DeepSeek-V4需回传空reasoning_content以避免400 工程 · X · 05-07
CaP-X开源：机器人agentic toolkit与CaP-Gym 研究 · X · 05-07
HKUDS/Vibe-Trading 工程 · GitHub · 05-07
JackChen-me/open-multi-agent 工程 · GitHub · 05-07
nesquena/hermes-webui 工程 · GitHub · 05-07
Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状工程 · vLLM · 05-03
deepseek-ai/DeepSeek-V4-Flash-Base 产品 · DeepSeek · 05-03
DeepInfra 登陆 Hugging Face 推理服务提供商 🔥 产品 · HF Blog · 05-03
deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
deepseek-ai/DeepSeek-V4-Pro-Base 产品 · DeepSeek · 05-03
deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
从 732 字节到无处可去：在生产环境中关闭 Copy Fail 工程 · Together AI · 05-03
使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建 NVIDIA Developer · 05-03