圍繞多智能體黑箱非凸優(yōu)化共識難題,華南理工大學(xué)團(tuán)隊發(fā)表系列研究
多智能體系統(tǒng)分布式共識優(yōu)化的一系列研究來了!
在智能城市、智能電網(wǎng)、無人系統(tǒng)等前沿應(yīng)用不斷擴(kuò)展的今天,多智能體系統(tǒng)(Multi-Agent Systems, MAS)作為新一代智能協(xié)同的技術(shù)基礎(chǔ),正迎來前所未有的發(fā)展機(jī)遇。
在這些系統(tǒng)中,多個具備計算與通信能力的智能體需要在沒有中心協(xié)調(diào)、通信受限的條件下實現(xiàn)任務(wù)協(xié)作、資源共享與一致性決策。
這一過程的核心挑戰(zhàn)之一,便是分布式共識優(yōu)化問題。
近年來,分布式共識優(yōu)化逐漸成為機(jī)器學(xué)習(xí)、運籌優(yōu)化、群體智能等多個交叉領(lǐng)域的研究熱點,聚焦如何在僅依賴本地信息和鄰居通信的前提下,實現(xiàn)全局目標(biāo)的優(yōu)化與智能體之間的解一致性。
在這一背景下,華南理工大學(xué)計算智能團(tuán)隊圍繞“多智能體共識與合作中的分布式進(jìn)化計算”這一核心問題,持續(xù)開展系統(tǒng)研究,已取得一系列具有代表性的成果:
- 在IEEE/CAA Journal of Automatica Sinica發(fā)表綜述論文,提出描述性框架總結(jié)現(xiàn)有研究成果;
- 提出多智能體粒子群優(yōu)化算法MASOIE,創(chuàng)新性地引入了內(nèi)部學(xué)習(xí)與外部學(xué)習(xí)機(jī)制;
- 提出目標(biāo)激勵驅(qū)動的協(xié)同演化算法MACPO,通過激勵機(jī)制引導(dǎo)協(xié)作行為;
- 設(shè)計了一種具有協(xié)作與累積特性的步長自適應(yīng)機(jī)制,構(gòu)建了更靈活的搜索節(jié)奏調(diào)控方式;
- 提出MASTER算法應(yīng)對無線傳感器網(wǎng)絡(luò)中常見的“無數(shù)據(jù)關(guān)聯(lián)”問題。
另外,華南理工大學(xué)計算智能團(tuán)隊還于CEC2024組織并主導(dǎo)了首屆分布式黑盒共識優(yōu)化競賽。
相關(guān)研究不僅理論扎實、方法創(chuàng)新,更在多個現(xiàn)實場景中展現(xiàn)出顯著應(yīng)用潛力。
分布式進(jìn)化計算的系統(tǒng)性探索與算法創(chuàng)新
系統(tǒng)綜述:構(gòu)建EC與MAS融合研究的理論藍(lán)圖
為梳理進(jìn)化計算與多智能體系統(tǒng)交叉領(lǐng)域的發(fā)展脈絡(luò),團(tuán)隊在IEEE/CAA Journal of Automatica Sinica發(fā)表綜述論文,系統(tǒng)總結(jié)了二者融合的主要研究方向與技術(shù)路徑。
論文從兩個維度出發(fā):
- 基于MAS的EC建模:探索如何利用多智能體模型增強(qiáng)EC的分布式能力與并行計算性能;
- EC輔助MAS優(yōu)化:利用EC強(qiáng)大的全局搜索能力,提升MAS在協(xié)同任務(wù)中的優(yōu)化表現(xiàn)。
此外,團(tuán)隊還提出了一個描述性框架,總結(jié)現(xiàn)有研究成果,并展望了未來在聯(lián)邦學(xué)習(xí)、邊緣計算等新興技術(shù)背景下的融合潛力。
論文標(biāo)題: 《The confluence of evolutionary computation and multi-agent systems: A survey》
期刊信息:IEEE/CAA Journal of Automatica Sinica(綜述),DOI:10.1109/JAS.2025.125246
多智能體粒子群優(yōu)化算法MASOIE:內(nèi)外部學(xué)習(xí)機(jī)制助力協(xié)同優(yōu)化
在分布式環(huán)境下,智能體之間的通信能力和信息共享受限,如何在這一限制下協(xié)同優(yōu)化全局目標(biāo)函數(shù)是重要挑戰(zhàn)。
為此,團(tuán)隊提出MASOIE(Multi-Agent Swarm Optimization With Adaptive Internal and External Learning)算法,創(chuàng)新性地引入了內(nèi)部學(xué)習(xí)與外部學(xué)習(xí)機(jī)制,在保持系統(tǒng)一致性的同時提升整體優(yōu)化性能。
- 內(nèi)部學(xué)習(xí):每個智能體根據(jù)自己的局部目標(biāo)函數(shù)獨立優(yōu)化,聚焦局部最優(yōu)。
- 外部學(xué)習(xí):智能體通過與鄰居的交流,實現(xiàn)經(jīng)驗共享與協(xié)同進(jìn)化,從而逐步接近全局最優(yōu)。
算法還引入外部學(xué)習(xí)慣性速度控制策略,在演化過程中自適應(yīng)調(diào)整通信頻率,提升了算法在收斂速度和通信效率上的平衡能力。
該工作結(jié)合共識理論和動力學(xué)系統(tǒng)理論,首次從理論上證明了所提出的內(nèi)外部協(xié)同學(xué)習(xí)機(jī)制在多智能體系統(tǒng)上的系統(tǒng)共識性
論文標(biāo)題:《Multi-Agent Swarm Optimization With Adaptive Internal and External Learning for Complex Consensus-Based Distributed Optimization》
期刊信息:IEEE Transactions on Evolutionary Computation,DOI:10.1109/TEVC.2024.3380436代碼開源:GitHub - MASOIE
目標(biāo)激勵驅(qū)動的協(xié)同演化算法MACPO:讓“自私”節(jié)點協(xié)同起來
當(dāng)系統(tǒng)中各個節(jié)點的局部目標(biāo)函數(shù)存在矛盾時,如何實現(xiàn)合作優(yōu)化?
團(tuán)隊提出MACPO(A Multiagent Co-Evolutionary Algorithm With Penalty-Based Objective)算法,核心思路是通過激勵機(jī)制引導(dǎo)協(xié)作行為。
MACPO在設(shè)計上將優(yōu)化過程拆分為兩個階段:
- 局部優(yōu)化階段:引入懲罰目標(biāo)函數(shù),使每個節(jié)點即使在只知道本地信息的前提下,也能通過“獎勵/懲罰”機(jī)制更理性地搜索。
- 協(xié)商階段:節(jié)點之間根據(jù)共享變量是否存在沖突進(jìn)行通信,并基于局部反饋動態(tài)調(diào)整目標(biāo)方向,實現(xiàn)更合理的集體進(jìn)化。
此外,算法設(shè)計了沖突檢測機(jī)制與共享變量協(xié)商機(jī)制(評估-競爭-共享),提高了解的一致性與可控性。
實驗顯示,該方法在無梯度約束優(yōu)化場景中能取得與集中式算法相當(dāng)?shù)男Ч疫m應(yīng)分布式部署需求。
論文標(biāo)題:《A Multi-Agent Co-evolutionary Algorithm with Penalty-Based Objective for Network-Based Distributed Optimization》
期刊信息:IEEE Transactions on Systems, Man, and Cybernetics: Systems,DOI:10.1109/TSMC.2024.3380389
步長自適應(yīng)機(jī)制 CCSA:動態(tài)調(diào)整節(jié)奏,提升黑盒優(yōu)化性能
在黑盒共識優(yōu)化中,如何選擇合適的步長策略至關(guān)重要。傳統(tǒng)方法大多使用固定或單調(diào)遞減的步長,難以適應(yīng)復(fù)雜任務(wù)。
為此,團(tuán)隊設(shè)計了一種具有協(xié)作與累積特性的步長自適應(yīng)機(jī)制(CCSA),構(gòu)建了更靈活的搜索節(jié)奏調(diào)控方式。
- 當(dāng)多個智能體的搜索方向一致時,放大步長,快速朝向最優(yōu)區(qū)域收斂。
- 當(dāng)搜索方向存在顯著沖突時,縮小步長,以避免誤差擴(kuò)散和信息偏離。
實驗結(jié)果表明,該算法在多個復(fù)雜函數(shù)測試中取得更優(yōu)的收斂效果與系統(tǒng)一致性,展現(xiàn)出極強(qiáng)的黑盒優(yōu)化能力。
論文標(biāo)題:《Multi-Agent Evolution Strategy With Cooperative and Cumulative Step Adaptation for Black-Box Distributed Optimization》
期刊信息:IEEE Transactions on Evolutionary Computation,DOI:10.1109/TEVC.2025.3525713
MASTER算法:提升傳感器網(wǎng)絡(luò)下多目標(biāo)協(xié)同定位精度
面對無線傳感器網(wǎng)絡(luò)中常見的“無數(shù)據(jù)關(guān)聯(lián)”問題,團(tuán)隊提出MASTER算法(Multi-Agent Swarm with contribution-based collaboration)。
該方法將傳感器間信息共享建模為雙層優(yōu)化問題,核心貢獻(xiàn)包括:
- 利用Kuhn-Munkres算法與CSO方法實現(xiàn)本地優(yōu)化;
- 設(shè)計“貢獻(xiàn)學(xué)習(xí)機(jī)制”,根據(jù)傳感器在全局目標(biāo)中的貢獻(xiàn)程度,進(jìn)行加權(quán)式經(jīng)驗傳播;
- 在多個定位維度與目標(biāo)數(shù)量場景下,實現(xiàn)了更小的誤差、更強(qiáng)的一致性。
論文標(biāo)題:《Multi-agent swarm optimization with contribution-based cooperation for distributed multi-target localization and data association》
期刊信息:IEEE/CAA Journal of Automatica Sinica,DOI:10.1109/JAS.2025.125150
分布式黑盒共識優(yōu)化競賽:構(gòu)建統(tǒng)一研究基準(zhǔn)平臺
華南理工大學(xué)計算智能團(tuán)隊于CEC2024組織并主導(dǎo)了首屆分布式黑盒共識優(yōu)化競賽,為分布式共識優(yōu)化領(lǐng)域構(gòu)建了具有挑戰(zhàn)性與實際導(dǎo)向的測試平臺。
競賽模擬多智能體在不同通信拓?fù)洹⒛繕?biāo)函數(shù)異質(zhì)性、沖突環(huán)境下的協(xié)同場景,吸引了眾多研究團(tuán)隊參與,推動了算法性能與工程適配的共同進(jìn)步。
未來展望:從智能協(xié)同到智慧生態(tài)系統(tǒng)
分布式共識優(yōu)化不僅是算法問題,更是智能系統(tǒng)協(xié)作能力的“中樞神經(jīng)”。
隨著IoT、自動駕駛、智能制造的深入發(fā)展,去中心、可擴(kuò)展、高魯棒的優(yōu)化機(jī)制將成為智能基礎(chǔ)設(shè)施的剛需。 未來,該領(lǐng)域有望向以下方向持續(xù)拓展:
- 與聯(lián)邦學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)等架構(gòu)深度融合;
- 面向隱私保護(hù)和不可見目標(biāo)函數(shù)的優(yōu)化;
- 在工業(yè)控制、能源系統(tǒng)、復(fù)雜機(jī)器人編隊等場景中廣泛部署。
華南理工大學(xué)計算智能團(tuán)隊將持續(xù)圍繞“分布式智能優(yōu)化”的核心命題,推進(jìn)基礎(chǔ)研究與應(yīng)用落地的雙輪驅(qū)動,歡迎來自不同領(lǐng)域的同行共同探討與合作。