Hugging Face · Daily Papers

面向分布式黑盒共识优化的行动与协作学习

Learning to Act and Cooperate for Distributed Black-Box Consensus Optimization

Zi-Bo Qin, Feng-Feng Wei, Tai-You Chen, Wei-Neng Chen

二〇二六年五月四日 · arXiv:2605.00691 · PDF

摘要

分布式 blackbox consensus optimization 是 multi-agent systems 中的一个基础问题，其中 agents 必须仅通过本地 objective queries 和有限的邻居通信来改进全局 objective。现有方法大多依赖手工设计的 update rules 和静态 cooperation patterns，在异构 nonconvex 环境中往往难以平衡局部适应、全局协调和通信效率。

本文迈出了面向分布式 black-box consensus optimization 的 trajectory-driven self-design 的初步一步。我们首先重新设计了 agent-level swarm dynamics，引入一种适用于去中心化 consensus 场景的自适应内部机制，从而更好地平衡 exploration、convergence 和 local escape。在这一自适应执行层之上，我们提出 Learning to Act and Cooperate（LACMAS），这是一个 trajectory-driven 框架，其中 large language models 通过历史优化 trajectories 提供稀疏的高层指导，用于塑造 agent-internal action behaviors 和 agent-external cooperation patterns。我们进一步引入一种 phased cognitive scheduling 策略，以资源感知的方式激活不同形式的适应。

在标准分布式 black-box benchmarks 和真实世界分布式任务上的实验表明，LAC-MAS 相较强 baselines 在 solution quality、convergence efficiency 和 communication efficiency 方面均持续提升，表明从手工设计的分布式协调走向自设计的 multi-agent optimization systems 是一条可行路径。