二〇二六年五月十四日

收録 35 篇

研究 17 · 产品 7 · 工程 8 · 评测 3

MinT：训练与服务百万级LLM的托管基础设施研究 · HF Papers · 05-14
AnyFlow: 基于同策略流图蒸馏的任意步视频扩散模型研究 · HF Papers · 05-14
MulTaBench：基于文本与图像的多模态表格学习基准测试研究 · HF Papers · 05-14
Apollo 2026年5月更新产品 · apollo-research · 05-13
研究不对齐模型研究 · uk-aisi · 05-14
AI模型如何说服？通过大规模实验探索AI说服的杠杆研究 · uk-aisi · 05-13
深化与Google DeepMind的合作关系研究 · uk-aisi · 05-13
我们应对AI生成儿童性虐待材料的方法研究 · uk-aisi · 05-14
我们的2025年度回顾评测 · uk-aisi · 05-13
AI Agent 如何使用？来自 17.7 万 AI Agent 工具的证据研究 · uk-aisi · 05-13
AI与工作的未来：衡量AI驱动的工作任务生产力提升研究 · uk-aisi · 05-14
AI评估中的国际共识与开放问题研究 · uk-aisi · 05-14
我们对TanStack npm供应链攻击的回应产品 · OpenAI · 05-13
Devin 现已支持 Android 模拟器产品 · cognition · 05-13
云代理的开发环境产品 · cursor-changelog · 05-13
mimalloc：面向现代的高性能可扩展内存分配器工程 · microsoft-research · 05-13
GridSFM：一种新型小型电网基础模型研究 · microsoft-research · 05-13
欢迎来到 Datasette 博客工程 · simon-willison · 05-13
整合AI与AI原生企业 | Cohere产品 · cohere · 04-24
研究提出用期望校准误差衡量大语言模型可靠性研究 · twitter@cwolferesearch · 05-13
Android 16 原生内置 MCP，Gemini 智能体可跨应用调用 AppFunction 工具产品 · twitter@_philschmid · 05-13
从头实现LLM架构的Python/PyTorch教程及开放权重模型对比方法工程 · twitter@rasbt · 05-13
用ElevenLabs推进AI语音安全研究 · uk-aisi · 05-13
使用Inspect Scout进行转录分析的工作流工程 · uk-aisi · 05-13
资助60个项目推进AI对齐研究研究 · uk-aisi · 05-13
前沿AI智能体在多步网络攻击场景中表现如何？评测 · uk-aisi · 05-13
AI agent 能逃出沙箱吗？容器逃逸能力安全基准测试研究 · uk-aisi · 05-13
AI在欺诈与网络犯罪中滥用的评估框架研究 · uk-aisi · 05-13
AI网络任务中推理扩展的证据：增加评估预算揭示更高成功率研究 · uk-aisi · 05-13
使用 Amazon Nova Sonic 和 WebRTC 构建实时语音流应用工程 · aws-ml · 05-13
我们如何使用 Sourcegraph 和 Slack 机器人快速检测漏洞并响应工程 · sourcegraph · 05-13
构建安全有效的沙箱，在 Windows 上启用 Codex工程 · OpenAI · 05-15
引用 Boris Mann工程 · simon-willison · 05-13
AIMIP 发布：AI 天气与气候模型比对项目 | Ai2评测 · allenai-blog · 05-13
用AI Agent与技能将视频转化为即时可搜索、可行动的情报产品 · nvidia-developer · 05-13