Data Formulator 0.7:面向企业数据的AI驱动数据分析
Data Formulator 0.7: AI-powered data analytics for enterprise data
Data Formulator 0.7 是一个开源、AI 驱动的企业数据分析系统,由 Azure AI Foundry Labs 发布。它通过 Data Connectors 支持跨数据库、数据仓库、BI 系统、对象存储和本地文件的可复用连接,减少平台团队集成工作。上下文感知 agent 可协助数据准备、探索和可视化,处理长时间运行及分支式分析工作流。交互式多模态界面允许团队无需 SQL 或编程专业知识即可迭代优化分析。
Data Formulator 0.7:面向企业数据的 AI 驱动数据分析
Data Formulator 0.7 是一个开源、AI 驱动的企业数据分析系统,它在共享工作区中整合了数据连接、agent 引导式探索和可视化优化。其 Data Connectors 功能支持跨数据库、数据仓库、BI 系统、对象存储和本地文件的有管控、可复用连接,从而减少平台团队的集成工作。上下文感知的 agent 可帮助用户准备数据、探索分析、生成可视化,并处理长时间运行及分支式的分析工作流。交互式多模态界面允许团队跨碎片化数据源迭代探索和优化分析,无需 SQL 或编程专业知识。
企业团队越来越依赖 AI 系统进行数据分析,但企业数据工作流往往分散在多个存储系统和工具中。在分析开始之前,团队通常需要建立受管控的连接、准备元数据、管理权限,并构建跨多个系统组合和重塑数据的工作流。除了数据连接之外,分析本身对分析师和领域专家而言仍然具有挑战性,其中许多人缺乏深入的编码技能。他们经常需要计算新的指标、比较不同的数据组织方式、检查中间输出,并根据需求变化优化可视化。这些工作流难以在孤立的聊天交互中复现,因为后者缺乏对企业数据、工作流历史和可视化上下文的持久访问。
我们的新版本 Data Formulator 0.7(在新标签页中打开)旨在应对这些挑战。它是一个开源、AI 驱动的数据分析系统,连接碎片化的企业数据和迭代式分析工作流。它提供了一种轻量级的方式来连接多种数据源,配备上下文感知的 agent 来协助数据准备、探索和可视化,并提供一个交互式工作区,用户可以在其中迭代优化和分享分析结果。
Azure AI Foundry Labs
通过微软研究院的这些实验性技术,一窥 AI 未来可能的发展方向。
Azure AI Foundry(在新标签页中打开)
使用 Data Connectors 连接企业数据
Data Formulator 帮助团队将企业数据引入 AI 就绪的工作区,而无需为每个数据源重建相同的连接。Data Connectors 功能支持身份验证、持久连接、预览、元数据,以及跨数据库、数据仓库、BI 系统、对象存储和本地文件的统一工作区模型。这减少了平台团队的集成工作,并允许用户基于集中管理、可复用的数据连接进行工作,而不是依赖重复的手动文件上传,如图 1 所示。
图 1. Data Connectors 在企业数据源与 Data Formulator 之间提供持久连接,使分析师和 AI agent 能够加载、查询和可视化共享数据。
用于数据分析的上下文感知 agent
上下文感知的 AI agent 构成了 Data Formulator 的核心。与单次 prompt 不同,Data Formulator 赋予 agent 对整个分析工作区的访问权限,包括已连接的数据源、已加载的表、先前的图表以及用户的目标。Agent 通过工具而非纯文本进行推理和行动。在单次交互中,agent 可以检查数据、在隔离环境中编写并运行代码、生成图表规范,并在显示中间步骤的同时解释其结果。当请求不明确时,agent 会在继续之前提出澄清性问题。这使得 agent 能够执行更复杂的分析工作流:使分析与用户目标对齐、准备和转换数据、建议后续问题、批量生成表格和图表,并为每个结果创建可验证、可复现的代码。
用于迭代数据分析的工作区
Data Formulator 将这些 agent 与专为开放式分析工作流设计的多模态界面配对。用户通过 Data Thread(数据线程)与 agent 协作,这是一种结构化的聊天记录,可在整个分析过程中记录每个问题、中间发现和图表。长时间会话保持可导航性:用户可以回溯之前的步骤,分支到替代分析,并在不丢失上下文的情况下并排比较它们。如图 2 所示,交互式画布补充了 Data Thread,允许用户直接编辑可视化。当用户从探索转向沟通时,他们可以直接在画布上优化图表,或用自然语言描述更改,让 agent 调整标签、注释、布局、颜色和重点。分析师还可以生成报告并与他人分享发现。
图 2. (左)Data Thread 允许用户通过提问、请求数据可视化和探索后续分析与 AI agent 交互。线程保留了长时间分析会话的历史,使得回溯、复用和基于先前工作进行构建成为可能。(右)交互式画布允许用户通过调整设置、重新设计图表以及并排检查底层数据和代码来直接优化可视化。
在此处查看 Data Formulator 演示(在新标签页中打开),或探索 Data Formulator GitHub 仓库(在新标签页中打开)。为企业数据开发分析工作流的团队可以将该项目作为基础,将这些能力适配到自己的系统和需求中。
(在新标签页中打开)
文章《Data Formulator 0.7: AI-powered data analytics for enterprise data》最初发表于 Microsoft Research。