録实録译稿议社区 24h

词术语频次

历封存归档

MMLU

▄▂ █ · 61 次 · 收录于 29 篇

Massive Multitask Language Understanding · 综合知识测试

BitCPM-CANN-1B 工程 · OpenBMB · 05-24
BitCPM-CANN-3B 工程 · OpenBMB · 05-24
BitCPM-CANN-8B 研究 · OpenBMB · 05-24
BitCPM-CANN-0.5B 工程 · OpenBMB · 05-24
BitCPM-CANN-1B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-0.5B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-3B-gguf 研究 · OpenBMB · 05-24
BitCPM-CANN-8B-gguf 研究 · OpenBMB · 05-24
BitCPM4-CANN-0.5B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-1B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-3B-gguf 研究 · OpenBMB · 05-22
BitCPM4-CANN-8B-gguf 研究 · OpenBMB · 05-22
Cohere 收购 Reliant AI 以扩展主权企业 AI 产品 · Cohere · 05-21
宣布与Indra Group和Multiverse Computing签署战略合作备忘录产品 · Cohere · 05-21
Import AI 457：AI 震网；诅咒的 Muon 优化器；与正向对齐研究 · Import AI · 05-19
ImageNet 创造者发布 BEHAVIOR 统一机器人基准测试研究 · X · 05-18
BitCPM4-CANN-0.5B 工程 · OpenBMB · 05-18
BitCPM4-CANN-1B 工程 · OpenBMB · 05-18
BitCPM4-CANN-3B 工程 · OpenBMB · 05-18
BitCPM4-CANN-8B 研究 · OpenBMB · 05-18
EMO：为涌现模块化预训练混合专家研究 · HF Blog · 05-09
SciCore-Mol 研究 · OpenBMB · 05-07
Qwen3.6-35B-A3B多项benchmark显示Agent能力提升研究 · X · 05-07
总结robotics三点教训：硬件可靠性、benchmark混乱与VLA错位研究 · X · 05-07
Qwen3.6-27B-FP8 产品 · Qwen · 05-03
Qwen3.6-27B 产品 · Qwen · 05-03
deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
面向 LLM 的大规模交互识别 BAIR · 05-03

更新于五月二十五日 09:40