面向分布式黑盒共识优化的行动与协作学习
Learning to Act and Cooperate for Distributed Black-Box Consensus Optimization
分布式 blackbox consensus optimization 是 multi-agent systems 中的一个基础问题,其中 agents 必须仅通过本地 objective queries 和有限的邻居通信来改进全局 objective。现有方法大多依赖手工设计的 update rules 和静态 cooperation patterns,在异构 nonconvex 环境中往往难以平衡局部适应、全局协调和通信效率。
本文迈出了面向分布式 black-box consensus optimization 的 trajectory-driven self-design 的初步一步。我们首先重新设计了 agent-level swarm dynamics,引入一种适用于去中心化 consensus 场景的自适应内部机制,从而更好地平衡 exploration、convergence 和 local escape。在这一自适应执行层之上,我们提出 Learning to Act and Cooperate(LACMAS),这是一个 trajectory-driven 框架,其中 large language models 通过历史优化 trajectories 提供稀疏的高层指导,用于塑造 agent-internal action behaviors 和 agent-external cooperation patterns。我们进一步引入一种 phased cognitive scheduling 策略,以资源感知的方式激活不同形式的适应。
在标准分布式 black-box benchmarks 和真实世界分布式任务上的实验表明,LAC-MAS 相较强 baselines 在 solution quality、convergence efficiency 和 communication efficiency 方面均持续提升,表明从手工设计的分布式协调走向自设计的 multi-agent optimization systems 是一条可行路径。