实録译稿 社区 24h

术语频次

封存归档

DeepSeek

█▃▆▂ · 256 次 · 收录于 48 篇

中国 AI 公司 · 开源大模型出品方

  1. 腾讯发布Hy-MT2系列翻译模型,30B-A3B版本在DomainMTBench超越DeepSeek-V4-Pro 产品 · X · 05-22
  2. Modal C轮融资:以46.5亿美元估值募资3.55亿美元 产品 · Modal · 05-22
  3. Midjourney 创始人自曝因用TPU弃N卡导致产品迭代落后一年 工程 · X · 05-21
  4. vLLM 中的弹性专家并行 工程 · vLLM · 05-20
  5. 大规模推理基准测试:编码智能体 评测 · Together AI · 05-20
  6. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  7. sglang v0.5.12 工程 · GitHub Release · 05-17
  8. 最新开放制品(#21):开放模型大爆发!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。 评测 · Interconnects · 05-17
  9. vllm v0.21.0 工程 · GitHub Release · 05-15
  10. esengine/DeepSeek-Reasonix 工程 · GitHub · 05-15
  11. 2028:全球AI领导力的两种情景 研究 · Anthropic Research · 05-15
  12. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-15
  13. 印度发布 Sarvam 30B 和 105B 开源推理模型,105B 采用 DeepSeek 风格 MLA 注意力 研究 · X · 05-13
  14. transformers v5.8.0 工程 · GitHub Release · 05-12
  15. Sub-32B 开放权重 产品 · Artificial Analysis · 05-12
  16. Kimi K2.6:新的领先开源权重模型 产品 · Artificial Analysis · 05-12
  17. DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列 产品 · Artificial Analysis · 05-12
  18. 近期开源权重模型发布 产品 · Artificial Analysis · 05-12
  19. 中国AI实验室内部笔记 对话 · Interconnects · 05-12
  20. Import AI 455:AI系统即将开始自我构建 研究 · Import AI · 05-12
  21. Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4 研究 · Import AI · 05-12
  22. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-12
  23. open-multi-agent/open-multi-agent 工程 · GitHub · 05-10
  24. 自适应并行推理:高效推理扩展的下一范式 研究 · BAIR · 05-09
  25. Claude Code 源码快照泄露,展示 repo context 与 subagent 设计 工程 · X · 05-09
  26. Narcooo/inkos 工程 · GitHub · 05-09
  27. 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题 工程 · Together AI · 05-09
  28. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  29. wanshuiyin/睡眠中自动 Claude Code 研究 工程 · GitHub · 05-08
  30. DeepSeek-V4-Pro与Flash大象牙膏测试优于V3但指令遵循存疑 研究 · X · 05-07
  31. DeepSeek-V4需回传空reasoning_content以避免400 工程 · X · 05-07
  32. CaP-X开源:机器人agentic toolkit与CaP-Gym 研究 · X · 05-07
  33. HKUDS/Vibe-Trading 工程 · GitHub · 05-07
  34. JackChen-me/open-multi-agent 工程 · GitHub · 05-07
  35. nesquena/hermes-webui 工程 · GitHub · 05-07
  36. Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
  37. 现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
  38. vLLM 中的 DeepSeek V4:高效长上下文 Attention vLLM · 05-03
  39. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  40. deepseek-ai/DeepSeek-V4-Flash-Base 产品 · DeepSeek · 05-03
  41. DeepInfra 登陆 Hugging Face 推理服务提供商 🔥 产品 · HF Blog · 05-03
  42. deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
  43. deepseek-ai/DeepSeek-V4-Pro-Base 产品 · DeepSeek · 05-03
  44. deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
  45. Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
  46. DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
  47. 从 732 字节到无处可去:在生产环境中关闭 Copy Fail 工程 · Together AI · 05-03
  48. 使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建 NVIDIA Developer · 05-03