大語言模型對時間序列預測真的有用嗎？

作者：Reza Yazdanfar 2024-07-24 13:58:21

人工智能

我們已經看到了語言模型的巨大進步，但時間序列任務，如預測呢？今天我們推薦一篇論文，對現有的語言模型和時間序列做了深入的研究。將探討了是否可以從大型語言模型（LLMs）中獲益于時間序列（TS）預測。

時間序列

時間序列是機器學習中最具挑戰性的工作領域之一，解決時間序列任務，如異常檢測、時間序列預測等，在多個行業中至關重要，能夠節省大量資金。

由OpenAI發起的規模化法則顯示，模型能在更多原始數據上更好地泛化結果就得到了ChatGPT。自那以后，大型語言模型（LLMs）吸引了所有人的注意。

自那以后，研究者們一直在嘗試將LLMs用于時間序列！這在某種程度上是有道理的，因為無論是語言數據還是時間序列都是序列數據，研究者認為如果LLMs能在語言數據上表現出良好的泛化能力，那么它可能也適用于時間序列。

關于這方面有很多酷炫的研究成果，但問題是“有多少LLMs真正適用于時間序列任務？”

我認為一些工作展示了時間序列的光明未來，例如使用LLMs實現的時間序列推理和理解（代理）等。

時間序列推理：

使用大型語言模型（LLMs）進行時間序列推理可以通過整合三種主要的分析任務來增強時間序列推理：因果推理、問答和輔助上下文預測。

因果推理涉及假設觀察到的時間序列模式背后的潛在原因，使模型能夠識別最有可能產生給定時間序列數據的場景。

問答使模型能夠解釋和回應關于時間序列的事實性查詢，如識別趨勢或對數據變化進行反事實推斷。

輔助上下文預測允許模型利用額外的文本信息來增強對未來數據點的預測，整合相關上下文以提高預測準確性。

但當前的LLMs在這些任務中表現出有限的熟練程度，比如在因果和問答任務中的表現僅略高于隨機水平，并在輔助上下文預測中顯示出適度的改進。

社會理解：

使用大型語言模型（LLMs）進行時間序列分析可以顯著提高社會理解，使代理能夠系統地分析和預測社會趨勢和行為。基于LLM的代理使用來自財經、經濟、民調和搜索趨勢等多個領域的真實世界時間序列數據來近似社會的隱藏狀態。這種近似有助于通過將時間序列數據與新聞和社交媒體等其他信息源相關聯，對社會行為進行假設和驗證。

通過整合這些多樣化的數據流，LLMs能夠深入洞察多面且動態的社會問題，促進包含邏輯和數字分析的復雜和混合推理。

這種方法確保代理不僅僅是執行歷史數據擬合，而是積極與不斷流動的真實世界數據互動并適應，使其分析和預測在真實場景中保持相關和適用。

但是當涉及到時間序列時，這些新模型并沒有使用預訓練的LMs的自然推理能力。