实録译稿 社区 24h

术语频次

封存归档

hallucination

▂▇█▄ · 70 次 · 收录于 31 篇

幻觉 · 模型生成看似合理但虚假的内容

  1. 为1000万文档设计零幻觉RAG管道的10个关键步骤 工程 · X Trending · 05-22
  2. Mega-ASR:通过扩展真实世界声学模拟实现野外²语音识别 研究 · HF Papers · 05-21
  3. CiteVQA:面向可信文档智能的证据归因基准测试 研究 · HF Papers · 05-18
  4. Imbad0202/学术研究技能 工程 · GitHub · 05-18
  5. 构建通用无障碍代理——过程中的经验教训 工程 · GitHub AI/ML · 05-16
  6. 国际联合测试演习:Agentic 测试 评测 · UK AISI · 05-15
  7. 当前AI系统的局限性映射 研究 · UK AISI · 05-15
  8. Opus 4.7:你需要知道的一切 产品 · Artificial Analysis · 05-12
  9. Sub-32B 开放权重 产品 · Artificial Analysis · 05-12
  10. Kimi K2.6:新的领先开源权重模型 产品 · Artificial Analysis · 05-12
  11. DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列 产品 · Artificial Analysis · 05-12
  12. OpenAI的GPT-5.5成为领先AI模型 产品 · Artificial Analysis · 05-12
  13. 近期开源权重模型发布 产品 · Artificial Analysis · 05-12
  14. xAI 推出 Grok 4.3,提升智能体性能并降低定价 产品 · Artificial Analysis · 05-12
  15. OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct 产品 · Artificial Analysis · 05-12
  16. 引用《纽约时报》编辑说明 研究 · Simon Willison · 05-11
  17. MachinaCheck:基于 AMD MI300X 构建 Multi-Agent CNC 可制造性系统 工程 · HF Blog · 05-11
  18. OncoAgent:用于隐私保护肿瘤学临床决策支持的双层 Multi-Agent 框架 研究 · HF Blog · 05-10
  19. Agent pull request 无处不在,如何 review 它们 工程 · GitHub AI/ML · 05-09
  20. MiniCPM-V-4_5-GPTQ 产品 · OpenBMB · 05-08
  21. nidhinjs/prompt-master 工程 · GitHub · 05-08
  22. wanshuiyin/睡眠中自动 Claude Code 研究 工程 · GitHub · 05-08
  23. 自然语言 Autoencoders 研究 · Anthropic Research · 05-08
  24. AI能力认知差距被指源于SOTA agentic models体验分层 研究 · X · 05-07
  25. nesquena/hermes-webui 工程 · GitHub · 05-07
  26. 用于视觉 Grounded 推理的感知流网络 HF Papers · 05-05
  27. 视觉-语言模型中抑制幻觉的在线自校准 HF Papers · 05-04
  28. 揭秘 AI agents 的 evals Anthropic Engineering · 05-03
  29. 数据科学家的复仇 Hamel Husain · 05-03
  30. 引用 Andrew Kelley Simon Willison · 05-03
  31. 用 AI agents 编写高效工具 Anthropic Engineering · 05-01