实録译稿 社区 24h

术语频次

封存归档

MMLU

▄▂ █ · 61 次 · 收录于 29 篇

Massive Multitask Language Understanding · 综合知识测试

  1. BitCPM-CANN-1B 工程 · OpenBMB · 05-24
  2. BitCPM-CANN-3B 工程 · OpenBMB · 05-24
  3. BitCPM-CANN-8B 研究 · OpenBMB · 05-24
  4. BitCPM-CANN-0.5B 工程 · OpenBMB · 05-24
  5. BitCPM-CANN-1B-gguf 研究 · OpenBMB · 05-24
  6. BitCPM-CANN-0.5B-gguf 研究 · OpenBMB · 05-24
  7. BitCPM-CANN-3B-gguf 研究 · OpenBMB · 05-24
  8. BitCPM-CANN-8B-gguf 研究 · OpenBMB · 05-24
  9. BitCPM4-CANN-0.5B-gguf 研究 · OpenBMB · 05-22
  10. BitCPM4-CANN-1B-gguf 研究 · OpenBMB · 05-22
  11. BitCPM4-CANN-3B-gguf 研究 · OpenBMB · 05-22
  12. BitCPM4-CANN-8B-gguf 研究 · OpenBMB · 05-22
  13. Cohere 收购 Reliant AI 以扩展主权企业 AI 产品 · Cohere · 05-21
  14. 宣布与Indra Group和Multiverse Computing签署战略合作备忘录 产品 · Cohere · 05-21
  15. Import AI 457:AI 震网;诅咒的 Muon 优化器;与正向对齐 研究 · Import AI · 05-19
  16. ImageNet 创造者发布 BEHAVIOR 统一机器人基准测试 研究 · X · 05-18
  17. BitCPM4-CANN-0.5B 工程 · OpenBMB · 05-18
  18. BitCPM4-CANN-1B 工程 · OpenBMB · 05-18
  19. BitCPM4-CANN-3B 工程 · OpenBMB · 05-18
  20. BitCPM4-CANN-8B 研究 · OpenBMB · 05-18
  21. EMO:为涌现模块化预训练混合专家 研究 · HF Blog · 05-09
  22. SciCore-Mol 研究 · OpenBMB · 05-07
  23. Qwen3.6-35B-A3B多项benchmark显示Agent能力提升 研究 · X · 05-07
  24. 总结robotics三点教训:硬件可靠性、benchmark混乱与VLA错位 研究 · X · 05-07
  25. Qwen3.6-27B-FP8 产品 · Qwen · 05-03
  26. Qwen3.6-27B 产品 · Qwen · 05-03
  27. deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
  28. deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
  29. 面向 LLM 的大规模交互识别 BAIR · 05-03