斯坦福、華盛頓大學與Google DeepMind合作:AI智能體預測人類行為準確率高達85%
11月25日消息,據(jù)外媒報道,斯坦福大學、華盛頓大學與Google?DeepMind的研究人員攜手開發(fā)了一種能夠逼真模擬人類行為的AI智能體。
研究團隊將詳細的訪談記錄與先進的GPT-4o模型相結合,構建了這一模擬系統(tǒng)。當用戶向智能體提出問題時,系統(tǒng)會加載訪談數(shù)據(jù),并促使AI模仿受訪者的回答方式。為獲取這些寶貴的訪談記錄,研究團隊對每位受訪者進行了長達兩小時的深入訪談,并利用OpenAI的Whisper技術將對話內容精準轉錄成文本。
為了全面評估AI對人類行為的預測能力,研究團隊設計了包括《通用社會調查》、大五人格評估以及多個行為經(jīng)濟學實驗在內的測試。結果顯示,基于訪談數(shù)據(jù)的AI在預測社會調查問題時,準確率高達85%,遠超僅依賴人口統(tǒng)計信息的傳統(tǒng)方法。
在五項社會科學實驗的對比測試中,AI的表現(xiàn)與人類高度一致,相關系數(shù)高達0.98,充分展示了其強大的模擬能力。訪談驅動的AI相較于傳統(tǒng)的人口統(tǒng)計法展現(xiàn)出了顯著優(yōu)勢,不僅預測更為準確,還能有效減少人口統(tǒng)計類別之間的偏差。
目前,研究團隊已將包含這1000個AI模型的數(shù)據(jù)集公開在GitHub上,并建立了嚴格的兩層訪問機制,以確保數(shù)據(jù)的安全與合規(guī)使用。綜合性數(shù)據(jù)對研究人員完全開放,而涉及個別參與者的詳細數(shù)據(jù)則需經(jīng)過特殊審批方可訪問。