词
历DeepSeek-V4-Pro
DeepSeek-V4的Pro版本
- 腾讯发布Hy-MT2系列翻译模型,30B-A3B版本在DomainMTBench超越DeepSeek-V4-Pro
- 阿里千问发布Qwen3.7-Max-Preview,数学能力升至总榜第七 字节跳动开源3B全模态模型Lance,统一处理文本、图像与视频
- 字节跳动开源3B全模态模型Lance,训练仅用128张A100显卡
- transformers v5.8.0
- 近期开源权重模型发布
- 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题
- DeepSeek-V4-Pro与Flash大象牙膏测试优于V3但指令遵循存疑
- vLLM 中的 DeepSeek V4:高效长上下文 Attention
- DeepInfra 登陆 Hugging Face 推理服务提供商 🔥
- deepseek-ai/DeepSeek-V4-Pro
- deepseek-ai/DeepSeek-V4-Pro-Base
- deepseek-ai/DeepSeek-V4-Flash
- DeepSeek-V4 Pro 现已在 Together AI 上可用
- 使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建