2023人工智能工程五大新方向
除了LLM的大量增加,AI開發工具也有了擴展。我們來看一下今年AI開發中的五個關鍵趨勢。
譯自Top 5 AI Engineering Trends of 2023,作者 Richard MacManus 是The New Stack的高級編輯,專注于Web和應用程序開發趨勢的報道。此前,他于2003年創辦了ReadWriteWeb,并將其發展成為全球最有影響力的科技新聞站之一。從早期...
使用大語言模型(LLM)進行應用程序開發,是今年技術發展中的最大趨勢之一。這始于公司通過 OpenAI 的專有模型使用其 API,但到 2023 年底,有大量不同的 LLM 可供選擇,包括開發人員可以直接訪問的開源 LLM,而不是依賴 API。
與 LLM 的激增一樣,也有大量用于將 LLM 集成到應用中的開發工具。作為我們查看 AI 工程今年五大關鍵趨勢的一部分,我們將討論此問題及更多內容。
1. AI 工程師的出現
首先也是最重要的,開發人員現在有了一個新的職業選擇:AI 工程師。
根據其主要宣傳者 Shawn " @swyx" Wang 介紹,AI 工程師是“提示工程師”的下一步。今年早些時候,他創建了一個簡潔的圖表,展示了 AI 工程師在更廣泛的 AI 和開發生態系統中的位置:
圖片
通過 swyx。
AI 工程師的角色仍然非常新。截至 2023 年底,它意味著使用 LLM 和相關工具的開發人員,例如 LangChain 框架和向量數據庫。
在 10 月我對 Shawn Wang 在舊金山聯合主持的AI 工程師峰會上的采訪中,他將 AI 工程師的角色比作是移動專家。
“所以,把AI看作一個平臺,就像移動工程一樣,對吧?就像,你只專注于移動堆棧。我不想碰它,因為移動很復雜。你參加所有移動會議,了解所有移動技術,還知道爭論。但當我需要處理任何移動問題時,我就來找你,你知道如何解決?!?/p>
他補充說,所有開發人員都應該至少了解一下什么是AI工程,就像十到十五年前移動工程變得流行時他們至少了解了移動工程的范圍一樣。
2. LLM堆棧的演進
今年AI工程中的一個相關趨勢是這一新角色的技術堆棧的出現。關于堆棧包含什么,有不同的意見,但我喜歡VC公司安德森·霍洛維茨(a16z)的以下圖表:
圖片
對于AI工程師來說,編排層可能是最重要的,因為這是他們的應用程序將連接到LLMs的地方。這就是“提示工程”的地方,基本上是一種查詢LLMs的方法,以使這些系統為應用程序提供有用的信息。在2023年,類似LangChain和LlamaIndex的工具出現,以幫助開發人員進行提示工程和其他LLM集成。
值得注意的是LangChain名稱中的“Chain”一詞,它表明它可以與其他工具進行互操作 - 不僅僅是各種LLMs,還有其他開發框架。例如,今年五月,Cloudflare宣布LangChain支持其Workers框架。
3. 開源LLMs
今年在AI工程領域最具影響力的發展,可以說是開源LLMs的興起。在OpenAI在11月份幾乎因一場董事會政變而瀕臨崩潰后,擁有選擇的另類、非專有LLMs變得尤為重要。
我與大多數AI工程師的交流中得知,他們認為OpenAI的LLMs仍然優于其他LLMs。然而,開源模型正在迅速趕超。Meta于7月宣布的LLama 2目前在斯坦福的HELM(語言模型的整體評估)基準排行榜上居首。
圖片
LLama 2規格;來自Meta
當Meta在2月份首次宣布LLama時,它以非商業許可向研究界發布了模型權重。而其他強大的LLMs,如GPT,通常只能通過有限的API訪問。
“所以你必須通過OpenAI并訪問API,但你實際上不能,比如說,下載模型或在你的電腦上運行它,” Lightning AI 的Sebastian Raschka在五月向我解釋道?!盎旧夏悴荒苓M行任何自定義?!?/p>
換句話說,LLama對于開發人員來說更加靈活。隨著我們進入2024年,這對于當前LLMs的領導者,如OpenAI和Google,可能具有潛在的顛覆性。
4. 向量數據庫
今年在LLM開發的數據方面最大的影響力無疑是向量數據庫的使用。
微軟將向量數據庫定義為“一種將數據存儲為高維向量的數據庫類型,這些向量是特征或屬性的數學表示?!?數據以一種稱為“嵌入”的技術存儲為向量。
在今年早些時候的《The New Stack》上的一篇投稿中,Mark Hinkle使用倉庫的類比來解釋向量數據庫的用例?!跋胂笠幌?,將向量數據庫視為一個巨大的倉庫,而AI則是熟練的倉庫管理員,” Hinkle寫道。“在這個倉庫中,每個物品(數據)都存儲在一個箱子(向量)中,整齊地組織在多維空間的貨架上?!?然后,AI可以根據它們的相似性檢索或比較物品。據Hinkle稱,向量數據庫“非常適用于推薦系統、異常檢測和自然語言處理等應用。”
像Pinecone這樣的新型數據庫解決方案或Chroma等開源項目在今年在向量數據庫領域開辟了有利可圖的市場。但市場上現在有許多向量數據庫的選擇,包括一些現有的數據庫公司為其產品添加這一功能。例如,Redis在其Redis Enterprise產品中提供了向量數據庫功能。
5. AI代理
也許在AI工程領域最具爭議的趨勢之一就是AI代理軟件,比如AutoGPT,該軟件于三月底發布。AI代理是使用LLMs執行各種任務的自動化軟件片段。
十月份的AI工程師峰會上,我感覺到一些演講者對這些自動化代理的能力過于自信。也許甚至有些傲慢,因為代理的一般理念似乎是將人類排除在外。但如果你曾經與銀行或電話公司等機構的自動聊天機器人打過交道,有可能你希望在聊天的另一端是一個人類。
Voxel51的機器學習工程師Jacob Marks在LinkedIn的一篇文章中這樣表達:“AI代理遠未達到其充分潛力。部分原因是很難為這些代理創建健壯的評估。AutoGPT正經歷重大波動。”
也許2024年是Auto-GPT和其他AI代理軟件嶄露頭角的時候。但目前,正如OpenAI聯合創始人Andrej Karpathy在四月警告的那樣,風險在于AI代理可能“失控”。
結論
在AI工程領域,這一年是創新的繁忙之年。盡管存在明顯的問題,無論是技術上的(見AI代理)還是商業上的(見OpenAI董事會),我們可以期待來年生成式AI方面取得更大的進展。OpenAI正受到Meta和Google等公司的積極挑戰,所有跡象都表明底層技術將繼續飛速改進。就在這周,Google發布了Gemini,聲稱在大多數測試中勝過了ChatGPT。對于LLM霸權的爭奪將持續到2024年。
此外,LLM應用生態系統可能會成熟,像LangChain和Pinecone這樣的年輕公司不斷擴張。明年我們可能還會看到政府介入進行監管,因此一切可能并不會一帆風順。
無論2024年會帶來什么,202年對于AI工程領域來說都是一個狂野的一年 — 也許會被記為互聯網歷史上的一個關鍵時刻。