推进内容溯源，构建更安全透明的AI生态

Advancing content provenance for a safer, more transparent AI ecosystem

二〇二六年五月十九日 · 英文原文

摘要

OpenAI 通过多层次、生态系统驱动的方法加强内容溯源，包括：使其工具符合 C2PA（内容来源与真实性联盟）标准，以便来源信号更易被其他平台识别；与 Google 合作，为 ChatGPT、Codex 及 API 生成的图像添加持久的跨平台 SynthID 水印；并公开预览一款公共验证工具，用户可通过检查内容凭证和 SynthID 信号确认图像是否来自 OpenAI。这些措施旨在构建更可信的信息生态系统。

人们每天都在使用 OpenAI 的工具来创建和编辑图像与音频，让沟通更具表现力、更实用、更易获取。随着这些工具成为人们构建、想象和分享的一部分，人们能够理解和验证媒体来源变得至关重要，这样他们才能更有信心地解读内容。来源信号（provenance signals）可以提供帮助，让人们了解内容的来源、创建或编辑方式，以及它是否名副其实。

今天，我们正在通过一种多层次、生态系统驱动的方法来加强内容溯源，以建立在线信任。我们通过符合 C2PA 标准，让我们的来源信号更易于其他工具和平台识别；通过与 Google 合作，为图像添加持久的跨平台 SynthID 水印；并公开预览一款工具，公众可用它来验证图像是否来自 OpenAI。

这些更新共同建立在我们早期工作的基础上，以支持开放标准，让 OpenAI 生成的内容更易于识别，并与行业合作，支持一个更可信的信息生态系统。

通过符合 C2PA 标准构建信任生态系统

自 2024 年以来，OpenAI 一直参与来源标准的开发和采用，当时我们开始为 DALL·E 3（在新窗口中打开）生成的图像添加内容凭证（Content Credentials），随后扩展到 ImageGen（在新窗口中打开）和 Sora（在新窗口中打开）。我们还加入了内容来源与真实性联盟（C2PA）的指导委员会，该联盟是内容来源开放技术标准背后的跨行业组织。C2PA 的技术方法使用元数据和加密签名，帮助关于媒体作品的信息安全地随内容本身一起传播。这些信息包括有助于记者评估来源、平台做出完整性决策以及人们理解他们在网上所看到内容的上下文。

我们最近采取了措施，使 OpenAI 成为 C2PA 符合性生成器产品（在新窗口中打开）。通过符合 C2PA 标准，我们为平台提供了一种可信的方式，来读取、保留和传递我们附加到内容上的来源信息。这一点很重要，因为来源只有在内容创建的第一个平台之外仍然存在时才有效，而符合性使这成为可能。

结合 Google SynthID 图像水印的多层次溯源方法

C2PA 元数据是溯源的重要基础。它帮助内容携带关于其来源、创建或编辑方式以及签署该信息者的信息。但元数据并非万无一失。它可能被剥离，在上传和下载过程中丢失，或因文件格式更改、调整大小或截图等转换而损坏。

为了使溯源更具韧性，我们正在采取多层次的方法，并通过 Google DeepMind 的 SynthID（在新窗口中打开）引入水印，首先从通过 ChatGPT、Codex 或 OpenAI API 生成的图像开始。SynthID 嵌入了一层不可见的水印，补充了基于 C2PA 元数据的方法。

我们为此已经努力了一段时间。我们在 Sora 中使用了可见水印，在 Voice Engine 中使用了音频水印，并随着时间的推移持续测试和研究其准确性和可靠性。

这两个系统相互加强。C2PA 帮助内容携带详细的上下文；SynthID 在元数据无法保留时帮助保存信号。水印在截图等转换过程中可能更持久，而元数据可以比单独的水印提供更多信息。它们共同使溯源比任何单一层次都更具韧性。

检测与公共验证工具预览

可信的元数据和能抵抗大多数修改的水印可以使来源信号更持久。但人们需要一种检测这些信号的方法。我们现在正在预览一款公共验证工具，它将帮助人们通过检查上传的图像是否包含来源信号（包括内容凭证和 SynthID），来验证该图像是否由 ChatGPT、OpenAI API 或 Codex 生成。

我们相信，来源应该更易于人们验证和解读，我们的工具可以通过整合多种信号，帮助人们在回答“这是 AI 生成的吗？”这个问题中发挥作用。这建立在 2024 年我们图像检测分类器初步研究预览的经验之上，并使人们能够可靠地检测媒体中是否存在源自 OpenAI 的 SynthID 水印，以及在发现时呈现 C2PA 元数据。

图片 1：OpenAI 网页显示上传图像的验证结果，根据检测到的 SynthID 和内容凭证信号，确认该图像是使用 OpenAI 工具生成的。

没有哪种检测方法是万无一失的，因此我们在检测失败时会采取谨慎的方法。例如，如果未检测到元数据或水印，该工具不会对图像是否使用 OpenAI 工具生成做出明确结论，因为来源信号在某些情况下可能被剥离。

在发布时，该工具仅限于 OpenAI 生成的内容。在接下来的几个月里，我们旨在支持跨行业的努力，使跨平台的验证成为可能。随着时间的推移，我们还期望支持人们可能在线上遇到的更多类型的内容。

展望未来

没有单一的溯源技术是足够的。我们相信，一个强大的方法需要结合共享标准、持久的水印信号和公共验证。通过在我们长期以来对内容凭证的支持基础上，符合 C2PA 标准，采用 SynthID，并预览公共验证工具，我们希望从长远来看，为一个更具互操作性的溯源生态系统做出贡献。

译自 OpenAI · 官方博客 · 录于二〇二六年五月十九日