hallucination
▂▇█▄
·
70 次
·
收录于 31 篇
幻觉 · 模型生成看似合理但虚假的内容
-
为1000万文档设计零幻觉RAG管道的10个关键步骤
工程 · X Trending · 05-22
-
Mega-ASR:通过扩展真实世界声学模拟实现野外²语音识别
研究 · HF Papers · 05-21
-
CiteVQA:面向可信文档智能的证据归因基准测试
研究 · HF Papers · 05-18
-
Imbad0202/学术研究技能
工程 · GitHub · 05-18
-
构建通用无障碍代理——过程中的经验教训
工程 · GitHub AI/ML · 05-16
-
国际联合测试演习:Agentic 测试
评测 · UK AISI · 05-15
-
当前AI系统的局限性映射
研究 · UK AISI · 05-15
-
Opus 4.7:你需要知道的一切
产品 · Artificial Analysis · 05-12
-
Sub-32B 开放权重
产品 · Artificial Analysis · 05-12
-
Kimi K2.6:新的领先开源权重模型
产品 · Artificial Analysis · 05-12
-
DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列
产品 · Artificial Analysis · 05-12
-
OpenAI的GPT-5.5成为领先AI模型
产品 · Artificial Analysis · 05-12
-
近期开源权重模型发布
产品 · Artificial Analysis · 05-12
-
xAI 推出 Grok 4.3,提升智能体性能并降低定价
产品 · Artificial Analysis · 05-12
-
OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct
产品 · Artificial Analysis · 05-12
-
引用《纽约时报》编辑说明
研究 · Simon Willison · 05-11
-
MachinaCheck:基于 AMD MI300X 构建 Multi-Agent CNC 可制造性系统
工程 · HF Blog · 05-11
-
OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架
研究 · HF Blog · 05-10
-
Agent pull request 无处不在,如何 review 它们
工程 · GitHub AI/ML · 05-09
-
MiniCPM-V-4_5-GPTQ
产品 · OpenBMB · 05-08
-
nidhinjs/prompt-master
工程 · GitHub · 05-08
-
wanshuiyin/睡眠中自动 Claude Code 研究
工程 · GitHub · 05-08
-
自然语言 Autoencoders
研究 · Anthropic Research · 05-08
-
AI能力认知差距被指源于SOTA agentic models体验分层
研究 · X · 05-07
-
nesquena/hermes-webui
工程 · GitHub · 05-07
-
用于视觉 Grounded 推理的感知流网络
HF Papers · 05-05
-
视觉-语言模型中抑制幻觉的在线自校准
HF Papers · 05-04
-
揭秘 AI agents 的 evals
Anthropic Engineering · 05-03
-
数据科学家的复仇
Hamel Husain · 05-03
-
引用 Andrew Kelley
Simon Willison · 05-03
-
用 AI agents 编写高效工具
Anthropic Engineering · 05-01