推进内容溯源,构建更安全透明的AI生态
Advancing content provenance for a safer, more transparent AI ecosystem
OpenAI 通过多层次、生态系统驱动的方法加强内容溯源,包括:使其工具符合 C2PA(内容来源与真实性联盟)标准,以便来源信号更易被其他平台识别;与 Google 合作,为 ChatGPT、Codex 及 API 生成的图像添加持久的跨平台 SynthID 水印;并公开预览一款公共验证工具,用户可通过检查内容凭证和 SynthID 信号确认图像是否来自 OpenAI。这些措施旨在构建更可信的信息生态系统。
人们每天都在使用 OpenAI 的工具来创建和编辑图像与音频,让沟通更具表现力、更实用、更易获取。随着这些工具成为人们构建、想象和分享的一部分,人们能够理解和验证媒体来源变得至关重要,这样他们才能更有信心地解读内容。来源信号(provenance signals)可以提供帮助,让人们了解内容的来源、创建或编辑方式,以及它是否名副其实。
今天,我们正在通过一种多层次、生态系统驱动的方法来加强内容溯源,以建立在线信任。我们通过符合 C2PA 标准,让我们的来源信号更易于其他工具和平台识别;通过与 Google 合作,为图像添加持久的跨平台 SynthID 水印;并公开预览一款工具,公众可用它来验证图像是否来自 OpenAI。
这些更新共同建立在我们早期工作的基础上,以支持开放标准,让 OpenAI 生成的内容更易于识别,并与行业合作,支持一个更可信的信息生态系统。
通过符合 C2PA 标准构建信任生态系统
自 2024 年以来,OpenAI 一直参与来源标准的开发和采用,当时我们开始为 DALL·E 3(在新窗口中打开)生成的图像添加内容凭证(Content Credentials),随后扩展到 ImageGen(在新窗口中打开)和 Sora(在新窗口中打开)。我们还加入了内容来源与真实性联盟(C2PA)的指导委员会,该联盟是内容来源开放技术标准背后的跨行业组织。C2PA 的技术方法使用元数据和加密签名,帮助关于媒体作品的信息安全地随内容本身一起传播。这些信息包括有助于记者评估来源、平台做出完整性决策以及人们理解他们在网上所看到内容的上下文。
我们最近采取了措施,使 OpenAI 成为 C2PA 符合性生成器产品(在新窗口中打开)。通过符合 C2PA 标准,我们为平台提供了一种可信的方式,来读取、保留和传递我们附加到内容上的来源信息。这一点很重要,因为来源只有在内容创建的第一个平台之外仍然存在时才有效,而符合性使这成为可能。
结合 Google SynthID 图像水印的多层次溯源方法
C2PA 元数据是溯源的重要基础。它帮助内容携带关于其来源、创建或编辑方式以及签署该信息者的信息。但元数据并非万无一失。它可能被剥离,在上传和下载过程中丢失,或因文件格式更改、调整大小或截图等转换而损坏。
为了使溯源更具韧性,我们正在采取多层次的方法,并通过 Google DeepMind 的 SynthID(在新窗口中打开)引入水印,首先从通过 ChatGPT、Codex 或 OpenAI API 生成的图像开始。SynthID 嵌入了一层不可见的水印,补充了基于 C2PA 元数据的方法。
我们为此已经努力了一段时间。我们在 Sora 中使用了可见水印,在 Voice Engine 中使用了音频水印,并随着时间的推移持续测试和研究其准确性和可靠性。
这两个系统相互加强。C2PA 帮助内容携带详细的上下文;SynthID 在元数据无法保留时帮助保存信号。水印在截图等转换过程中可能更持久,而元数据可以比单独的水印提供更多信息。它们共同使溯源比任何单一层次都更具韧性。
检测与公共验证工具预览
可信的元数据和能抵抗大多数修改的水印可以使来源信号更持久。但人们需要一种检测这些信号的方法。我们现在正在预览一款公共验证工具,它将帮助人们通过检查上传的图像是否包含来源信号(包括内容凭证和 SynthID),来验证该图像是否由 ChatGPT、OpenAI API 或 Codex 生成。
我们相信,来源应该更易于人们验证和解读,我们的工具可以通过整合多种信号,帮助人们在回答“这是 AI 生成的吗?”这个问题中发挥作用。这建立在 2024 年我们图像检测分类器初步研究预览的经验之上,并使人们能够可靠地检测媒体中是否存在源自 OpenAI 的 SynthID 水印,以及在发现时呈现 C2PA 元数据。

没有哪种检测方法是万无一失的,因此我们在检测失败时会采取谨慎的方法。例如,如果未检测到元数据或水印,该工具不会对图像是否使用 OpenAI 工具生成做出明确结论,因为来源信号在某些情况下可能被剥离。
在发布时,该工具仅限于 OpenAI 生成的内容。在接下来的几个月里,我们旨在支持跨行业的努力,使跨平台的验证成为可能。随着时间的推移,我们还期望支持人们可能在线上遇到的更多类型的内容。
展望未来
没有单一的溯源技术是足够的。我们相信,一个强大的方法需要结合共享标准、持久的水印信号和公共验证。通过在我们长期以来对内容凭证的支持基础上,符合 C2PA 标准,采用 SynthID,并预览公共验证工具,我们希望从长远来看,为一个更具互操作性的溯源生态系统做出贡献。