二〇二六年五月十四日
收録 35 篇
研究 17 · 产品 7 · 工程 8 · 评测 3
- MinT:训练与服务百万级LLM的托管基础设施
- AnyFlow: 基于同策略流图蒸馏的任意步视频扩散模型
- MulTaBench:基于文本与图像的多模态表格学习基准测试
- Apollo 2026年5月更新
- 研究不对齐模型
- AI模型如何说服?通过大规模实验探索AI说服的杠杆
- 深化与Google DeepMind的合作关系
- 我们应对AI生成儿童性虐待材料的方法
- 我们的2025年度回顾
- AI Agent 如何使用?来自 17.7 万 AI Agent 工具的证据
- AI与工作的未来:衡量AI驱动的工作任务生产力提升
- AI评估中的国际共识与开放问题
- 我们对TanStack npm供应链攻击的回应
- Devin 现已支持 Android 模拟器
- 云代理的开发环境
- mimalloc:面向现代的高性能可扩展内存分配器
- GridSFM:一种新型小型电网基础模型
- 欢迎来到 Datasette 博客
- 整合AI与AI原生企业 | Cohere
- 研究提出用期望校准误差衡量大语言模型可靠性
- Android 16 原生内置 MCP,Gemini 智能体可跨应用调用 AppFunction 工具
- 从头实现LLM架构的Python/PyTorch教程及开放权重模型对比方法
- 用ElevenLabs推进AI语音安全
- 使用Inspect Scout进行转录分析的工作流
- 资助60个项目推进AI对齐研究
- 前沿AI智能体在多步网络攻击场景中表现如何?
- AI agent 能逃出沙箱吗?容器逃逸能力安全基准测试
- AI在欺诈与网络犯罪中滥用的评估框架
- AI网络任务中推理扩展的证据:增加评估预算揭示更高成功率
- 使用 Amazon Nova Sonic 和 WebRTC 构建实时语音流应用
- 我们如何使用 Sourcegraph 和 Slack 机器人快速检测漏洞并响应
- 构建安全有效的沙箱,在 Windows 上启用 Codex
- 引用 Boris Mann
- AIMIP 发布:AI 天气与气候模型比对项目 | Ai2
- 用AI Agent与技能将视频转化为即时可搜索、可行动的情报