增强AI韧性

Strengthening AI resilience

二〇二六年五月十五日 · 英文原文

摘要

英国研究与创新署（UKRI）下属的工程与物理科学研究理事会（EPSRC）和英国创新署（Innovate UK）主导的系统性AI安全资助计划（Systemic AI Safety Grants Programme）在首尔AI峰会上宣布，已从300多份申请中遴选出20个项目，每个项目获得最高20万英镑种子基金。项目涵盖AI决策安全、劳动者保护、错误信息打击、高风险领域AI应用、基础设施安全、隐私保护及AI agent交互等方向，由牛津大学、艾伦·图灵研究所、剑桥大学等机构承担，旨在12个月内产出关键见解以支持AI治理与风险缓解。

在关键基础设施和社会系统（如金融市场、医疗保健和交通运输）中部署人工智能（AI）带来了巨大益处，同时也引入了可能在高风险领域造成重大破坏的风险。

我们的系统性AI安全资助计划（Systemic AI Safety Grants Programme）首次在首尔AI峰会上宣布，旨在增强社会对AI相关风险的抵御能力，从而充分实现其益处。今天，我们自豪地宣布20个项目已获得最高20万英镑的种子基金，用于开展独立研究，重点关注保护正在部署AI的社会系统和关键基础设施。

遴选过程

我们收到了来自英国及国际高校、企业和非营利组织的300多份资助申请。每份申请都经过了严格的评估流程，由英国研究与创新署（UKRI）下属的工程与物理科学研究理事会（EPSRC）和英国创新署（Innovate UK）主导。

超过150名外部评审员初步筛选出82份申请，随后由Siân John MBE（EPSRC成员、NCC Group首席技术官）担任主席的专家小组进行评估。小组根据申请的价值和潜在影响进行评审，最终由英国AI安全研究所做出最终选择。

选定的20个项目组合涵盖了多样化的重点领域，反映了AI安全、安保和韧性方面挑战的广度：

让AI决策更安全——探索对AI决策理论的根本性改进，以确保AI系统做出更安全、更一致的选择。
保护AI驱动行业中的劳动者——研究自动化对操作员技能的影响，为工会工人开发AI风险培训，并评估地方政府决策中采用AI的风险。
打击错误信息与虚假信息——开发帮助用户评估内容可靠性的工具，并调查合成内容如何在危机时期被利用以放大社会动荡。
确保AI在高风险领域安全有效——在医疗、金融、法律、教育、交通和高危行业中识别并缓解风险，确保监管机构和从业者能够应对AI相关故障。
保障AI基础设施安全——开发安全共享AI模型的技术解决方案，评估AI agent与操作系统及电信网络交互的风险，并确保私有数据交换中的机密性。
保护个人隐私——开发社会技术解决方案，防止通过视觉AI系统对个人进行地理定位，并解决嵌入可穿戴设备中的AI带来的隐私问题。
理解AI agent如何交互——探索AI agent在游戏环境中的涌现行为，以理解竞争或合谋如何在无设计者意图的情况下出现。

获奖者

项目负责人	机构	项目名称
Adel Bibi, Philip Torr 和 Adam Mahdi	牛津大学	操作系统AI Agent的安全性：形式化、评估与认证
Alexander Babuta, Ardi Janjeva 和 Sam Stockwell	艾伦·图灵研究所	安全事件中AI驱动的虚假信息：缓解公共秩序混乱的风险
Alexander Serb 和 Themis Prodromakis	爱丁堡大学	AI赋能的投资策略指南（AEGIS）
Antonio Valerio Miceli-Barone, Vaishak Belle 和 Shay B. Cohen	爱丁堡大学	理解并改进AI agent在竞争与合作游戏中的行为
Brian Sheil, Jennifer Schooling 和 Maya Indira Ganesh	剑桥大学和安格利亚鲁斯金大学	指导一线人员：推进公共部门AI系统在伦理指导下社会技术安全的发展
Caitlin Bentley, Gordon Meadow 和 David Wavell	伦敦国王学院、Seabot Maritime 和 Frontier Robotics	演进人-AI能力：为构建系统性安全的网络物理系统进行劳动力开发
Carl Macrae	诺丁汉大学	构建系统性AI安全的学习基础设施：开发调查和学习系统性AI安全事件的流程
Farhana Ferdousi Liza, Shoaib Ahmed 和 Katherine Deane	东英吉利大学和苏塞克斯大学商学院	BRA(AI)N：在AI导航中构建韧性与问责制
Gina Neff	伦敦玛丽女王大学	为AI安全而工作（WAIS）：工作场所中应对系统性风险的社会技术能力
Haris Shuaib	Newtons Tree	CLIO：临床大语言模型集成与监督
John Keers, Jun Liu 和 Niall McCarroll	阿尔斯特大学、法律技术中心	Agentic AI在司法决策中的应用
Marios Kogias 和 Hamed Haddadi	帝国理工学院	C3Infer：用于分区化、机密且经认证的AI推理框架
Martin Thomson 和 Richard Waine	健康与安全执行局科学研究中心和Emlyn Square	高危环境中的安全AI（SAFEHAZ）
Mark McGill, Richard Jones 和 Tanaya Guha	格拉斯哥大学和爱丁堡大学	WearAI：审视嵌入情境感知智能可穿戴设备中的AI所暴露的社会脆弱性
Michael Bronstein, Reihaneh Rabbany 和 Shenyang Huang	牛津大学、麦吉尔大学和Mila	迈向可信赖的AI agent以实现信息真实性
Nick Hawes 和 Ruth Chang	牛津大学	AI与艰难抉择：对等模型
Qian Lu, Vasile Palade 和 Huw Davis	考文垂大学	在自动驾驶汽车开发中使用AI生成合成数据的系统性风险
Shoaib Ehsan, Jack Stilgoe 和 Michael Milford	南安普顿大学、伦敦大学学院和昆士兰科技大学	PRIV-LOC：评估并缓解视觉-语言模型在基于图像的地理定位系统中的隐私风险
Syed A. R. Zaidi, Zeinab Nizami 和 Maryam Hafeez	利兹大学	AI agent间的战略决策与合作：探索电信领域的安全与治理
Yali Du	伦敦国王学院	评估生成式agent系统的合作行为

下一步计划

在未来12个月内，这些项目将产生关键见解，为AI治理、风险缓解和系统性保障措施提供信息。这些工作将有助于形成切实可行的干预措施，确保AI融入关键基础设施的过程安全、可靠且有益。

我们向获奖者表示祝贺，并感谢数百名申请者、专家评审员以及我们杰出的外部评审小组，正是他们的努力使这一计划成为可能。他们的集体努力塑造了一个强大且多元化的研究组合，将帮助社会为AI发展的下一个前沿做好准备。

译自 UK AI Security Institute · 录于二〇二六年五月十五日