实録译稿 社区 24h

术语频次

封存归档

GPQA

█▂▇ · 25 次 · 收录于 15 篇

研究生水平科学问答基准

  1. 长文本任务 研究 · UK AISI · 05-16
  2. TurboQuant 首次全面研究:精度与性能 评测 · vLLM · 05-15
  3. Opus 4.7:你需要知道的一切 产品 · Artificial Analysis · 05-12
  4. Sub-32B 开放权重 产品 · Artificial Analysis · 05-12
  5. Import AI 455:AI系统即将开始自我构建 研究 · Import AI · 05-12
  6. TurboQuant 首次全面研究:精度与性能 研究 · vLLM · 05-12
  7. Qwen3.6-35B-A3B多项benchmark显示Agent能力提升 研究 · X · 05-07
  8. Qwen3.6-27B-FP8 产品 · Qwen · 05-03
  9. Qwen3.6-27B 产品 · Qwen · 05-03
  10. 介绍 GPT-5.5 OpenAI · 05-03
  11. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  12. moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
  13. deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
  14. deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
  15. DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03