録实録译稿议社区 24h

词术语频次

历封存归档

hallucination

▂▇█▄ · 70 次 · 收录于 31 篇

幻觉 · 模型生成看似合理但虚假的内容

为1000万文档设计零幻觉RAG管道的10个关键步骤工程 · X Trending · 05-22
Mega-ASR：通过扩展真实世界声学模拟实现野外²语音识别研究 · HF Papers · 05-21
CiteVQA：面向可信文档智能的证据归因基准测试研究 · HF Papers · 05-18
Imbad0202/学术研究技能工程 · GitHub · 05-18
构建通用无障碍代理——过程中的经验教训工程 · GitHub AI/ML · 05-16
国际联合测试演习：Agentic 测试评测 · UK AISI · 05-15
当前AI系统的局限性映射研究 · UK AISI · 05-15
Opus 4.7：你需要知道的一切产品 · Artificial Analysis · 05-12
Sub-32B 开放权重产品 · Artificial Analysis · 05-12
Kimi K2.6：新的领先开源权重模型产品 · Artificial Analysis · 05-12
DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列产品 · Artificial Analysis · 05-12
OpenAI的GPT-5.5成为领先AI模型产品 · Artificial Analysis · 05-12
近期开源权重模型发布产品 · Artificial Analysis · 05-12
xAI 推出 Grok 4.3，提升智能体性能并降低定价产品 · Artificial Analysis · 05-12
OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct 产品 · Artificial Analysis · 05-12
引用《纽约时报》编辑说明研究 · Simon Willison · 05-11
MachinaCheck：基于 AMD MI300X 构建 Multi-Agent CNC 可制造性系统工程 · HF Blog · 05-11
OncoAgent：用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架研究 · HF Blog · 05-10
Agent pull request 无处不在，如何 review 它们工程 · GitHub AI/ML · 05-09
MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
nidhinjs/prompt-master 工程 · GitHub · 05-08
wanshuiyin/睡眠中自动 Claude Code 研究工程 · GitHub · 05-08
自然语言 Autoencoders 研究 · Anthropic Research · 05-08
AI能力认知差距被指源于SOTA agentic models体验分层研究 · X · 05-07
nesquena/hermes-webui 工程 · GitHub · 05-07
用于视觉 Grounded 推理的感知流网络 HF Papers · 05-05
视觉-语言模型中抑制幻觉的在线自校准 HF Papers · 05-04
揭秘 AI agents 的 evals Anthropic Engineering · 05-03
数据科学家的复仇 Hamel Husain · 05-03
引用 Andrew Kelley Simon Willison · 05-03
用 AI agents 编写高效工具 Anthropic Engineering · 05-01