清華EconAgent獲ACL 2024杰出論文:大模型智能體革新計算經濟學研究范式
宏觀經濟學在上個世紀經歷了多次危機與發展。
從18世紀亞當·斯密古典宏觀經濟學中「看不見的手」到上世紀20~30年代美國大蕭條時期的凱恩斯革命,從二戰后薩繆爾森的新古典綜合到70~80年代美國滯漲時期的貨幣主義,從新古典宏觀經濟學的理性預期到行為經濟學,尤其是2008年全球金融危機后,對宏觀經濟現象的研究越來越重視對人的復雜行為的準確建模。
20世紀末到21世紀初,基于代理的建模(Agent-based Modeling, ABM)在計算經濟學中受到一定程度的關注。
ABM強調了主流方法動態隨機一般均衡(DSGE)模型中「完美世界」假設的缺陷,旨在通過模擬微觀個體的行為及其交互自下而上地涌現出宏觀層面的典型化事實(Stylized facts),例如GDP增長與波動、通脹與失業率的權衡。
然而,由于個體行為規則需要專家設定,并帶來模型校驗、可解釋性有限的問題,ABM模擬在宏觀經濟學領域的發展一定程度上受限。
如今,大語言模型(LLM)的出現催生了各個領域的智能體研究并取得了多方面的成功,驗證了LLM強大的推理與決策能力,這為模擬更真實的經濟個體提供了有效途徑。
論文鏈接:https://arxiv.org/abs/2310.10436v4
清華大學團隊的這項工作使用LLM構造EconAgent,在一個宏觀經濟系統中模擬了個體的工作與消費行為,并相較于傳統ABM模擬涌現出了更穩定、真實的典型事實(Stylized fact, 即經典的宏觀經濟現象)。
EconAgent與經濟模擬系統
論文第一作者為清華大學博士生李念,合作者包括清華大學李勇教授、高宸助理研究員、廖慶敏教授。
經濟模擬系統的構建
為盡可能保證經濟模擬的真實性,經濟系統包括了必要的經濟活動,包括個體、公司、政府、銀行等經濟對象,以及工作、消費、定價等經濟活動:
- 個體通過工作取得月收入;
- 政府按照稅收政策對所有個體征稅,并將稅收平均返還;
- 個體決定將稅收收入和儲蓄的一部分用于消費生活必需品;
- 個體的工作帶來必需品的生產供應,個體的消費帶來必需品的消費需求,結合當前的庫存,供需不平衡會帶來消費市場與勞動市場的動態變化,即商品價格與個體工資的變動;
- 每年個體在銀行的儲蓄得到一些利息;銀行通過常用的Taylor Rule進行每年的利率調整。
EconAgent智能體設計
為了使EconAgent能根據自身與外部的經濟狀況作出合理決策,研究者進行了如下幾方面設計。
首先,在prompt中賦予了個體差異化的、基于現實世界的畫像,包括年齡、姓名、職業等,使得每個個體都具有獨特的特征和背景,從而能夠模擬真實世界中個體的多樣性和復雜性。
其次,prompt中描述了真實經濟環境中的生活場景,使得EconAgent夠感知與理解經濟環境中的信息及其變化趨勢,從而作出正確合理的響應。進一步地,研究者對智能體設計了記憶模塊,以模擬廣泛的宏觀經濟趨勢對個體決策的影響;
如此一來,EconAgent不僅能夠感知當前的經濟環境,還能夠考慮市場環境的歷史變化和長期趨勢。
最后,EconAgent綜合考慮多類經濟因素做出自主決策,不依賴于預定義的規則。
反思prompt與結果:個體能感知勞動市場與消費市場的變化
實驗結果:宏觀經濟現象與規律的自主涌現
研究者模擬了一個百人經濟系統,每個模擬步代表一個月,共進行了20年的模擬,從宏觀經濟指標與經濟規律兩個方面對模擬結果進行驗證,并與基于規則的ABM模擬[1,2]以及RL方法[3]進行對比。
1. 宏觀經濟指標:通脹率、失業率、名義GDP、名義GDP增長率
實驗結果表明,基于EconAgent的模擬涌現出數值更合理、波動更穩定的宏觀經濟指標。例如,通脹率不超過10%、在第3年后基本達到穩定。
宏觀經濟指標
2. 宏觀經濟規律:Phillips Curve、Okun’s Law
實驗結果表明,基于EconAgent的模擬涌現出更合理的經濟規律,而其它方法的結果出現了錯誤的Phillips Curve:失業率與工資通脹率并不是負相關關系。
宏觀經濟規律
EconAgent的決策行為分析
為進一步探究EconAgent所做的決策是否符合真實世界的經濟常識,研究者對其工作與消費決策進行多個經濟因素的回歸分析。
結果表明,當稅收越少、政府返還越多、預期收入越高時,工作意愿越高;當儲蓄越高、上個月消費越少時,消費占儲蓄比例越低,意味著EconAgent會保持穩定的消費水平;此外,商品價格也是影響工作與消費意愿的重要因素。以上結論均與現實世界中的人類行為相吻合。
研究者進一步研究EconAgent是否自主地表現出決策機制中的異質性。
上圖(a)展示了消費傾向隨年齡增長而逐步增加,這與在傳統宏觀經濟研究中觀察到的經驗規律大體一致[4]。
研究者通過與EconAgent的交互,進一步解讀了Phillips Curve中出現負相關的可能原因。首先,計算失業率最高和最低的兩年中所有Agent的平均消費傾向。
上圖(b)展示了比較結果,其中***表示顯著差異(p < 0.001),可以觀察出高失業率導致消費傾向顯著降低。
為了更深入地了解在高失業率的勞動市場中選擇減少消費的原因,隨機選擇一個Agent,并基于在失業率最高的那一年的行為決策歷史,結合每個季度的經濟動態,為所做出的消費決策提供理由。以下結果表明,Agent對宏觀經濟趨勢有所感知,在面對高失業率下的勞動市場通貨緊縮時,會選擇謹慎消費。
研究者進一步探究了重要事件對EconAgent行為的影響以及由此產生的宏觀經濟模擬結果的變化,這也是許多ABM研究中廣泛討論的一個話題[5]。
以對全球經濟產生重大影響的COVID-19為例,研究者通過prompt的方式將其納入模擬中,如下所示:
下圖對比了失業率的變化情況,其中「Normal」和「COVID-19」分別表示有無上述提示的模擬結果。
結果表明基于EconAgent的模擬成功地復現了全球失業率的增長,盡管數值與真實數據并不完全匹配,但這表明所提出的框架能夠定性模擬重要事件對宏觀經濟產生的影響。
以下是EconAgent的反思示例。
進一步地,研究團隊將EconAgent與研發的OpenCity智能體平臺[6]相結合,基于EconAgent驅動北京真實街區中的個體工作、消費行為,與企業的生產行為等經濟活動的模擬仿真。
總結與展望
總而言之,該論文工作結合LLM智能體與經濟模擬,為計算經濟學的研究范式開辟了一條新的可能道路,未來有望以DSGE等主流模型為目標,向更精準、更真實的模擬邁進。
進一步地,關于大語言模型智能體ABM模擬及其在社會、經濟、物理、網絡等領域應用的相關工作,團隊還發布了首篇綜述論文:《Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspectives》,該論文已被Humanities and Social Sciences Communications接收。