小型語言模型與大型語言模型:2025年對企業的影響
小型語言模型 (SLM) 提供了比大型語言模型 (LLM) 更具成本效益的特定領域解決方案。
譯自Small Language Models vs. LLMs: What They'll Mean for Businesses in 2025,作者 Souvik Das。
隨著生成式AI的進步以驚人的速度繼續改變運營和流程,組織正處于一個關鍵時刻。
麥肯錫公司2024年5月的一份報告顯示,65%的受訪者現在至少在一個業務職能中定期使用生成式AI(GenAI)——幾乎是十個月前的數據的兩倍。
然而,雖然一些公司正在收獲早期回報,但另一些公司卻在與實施復雜性作斗爭,而規則仍在制定中。鑒于這種“蠻荒西部”的環境,挑戰是顯而易見的:隨著GenAI準備加速各行各業人們的工作,企業領導者必須選擇如何有效地利用其潛力。
根據IBM 2024年5月調查結果,62%的CEO愿意在AI采用方面承擔比競爭對手更大的風險,其中一半(51%)承認,對落后的恐懼促使他們在甚至不清楚其價值的情況下投資某些技術。在這種情況下,企業面臨著大量關于如何最好地采用和運行GenAI的決策——從選擇合適的基礎設施提供商和模型到管理組織內部的組織變革。
在這個快速變化的環境中,以下是我們積累的關鍵經驗,這些經驗可以幫助領導者就如何以最有效的方式向前推進其GenAI投資做出關鍵決策。
生成式AI采用趨勢
一旦預算分配完畢,CTO和應用程序開發人員必須考慮許多可用的GenAI提供商。決策者必須評估每個模型或基礎設施的優勢、風險和價格性能,因為GenAI/LLM工具并非都相同。此外,像谷歌和亞馬遜這樣的行業巨頭不斷更新和創新他們的模型。每個模型都有不同的優勢、能力和專長,可擴展性和可定制性水平也不同。不同行業的公司將有獨特的需求,公司內部的不同部門也將有特定的要求。
Gartner 2024年的調查發現,利用嵌入現有應用程序中的GenAI(例如,Microsoft的Copilot for 365或Adobe Firefly)是實現GenAI用例的主要方法。其次是定制GenAI模型及提示工程(25%),訓練或微調定制的GenAI模型(21%),或使用獨立的GenAI工具,如ChatGPT或Gemini(19%)。但是,例如,如何在一個OpenAI、Anthropic或Meta的開源Llama之間做出決定呢?
評估用于商業用途的生成式AI模型
我們建議循序漸進——但不要過于循序漸進以至于陷入癱瘓。企業的一個模型評估團隊或小型組織的個人應該探索哪些模型更適合特定應用程序和查詢。理想情況下,團隊將對不同模型的功效和效率獲得實際的理解。模型評估團隊還應該預測失誤,并在試用后保持嘗試不同模型的開放態度,因為GenAI模型仍在不斷改進。
需要多少提示工程?
在選擇集成GenAI工具的方法時,領導者必須考慮他們必須投入多少時間和資源來訓練他們的模型。為通用任務設計的預訓練模型需要最少的提示工程。在金融、能源或醫療保健等受嚴格監管的行業中的組織會發現,他們的用例需要大量的提示工程來為他們的模型創建防護措施。參與內容創作、營銷和客戶服務的人員需要更輕松的培訓,以確保回復專業、公正且符合品牌策略。金融服務或醫療保健公司必須確保技術能夠滿足其用例和客戶需求。 大多數公司都需要一定程度的提示工程來微調工具以適應其領域。簡單來說,你訓練 GenAI 的越好,結果就越好。大多數行業可能會選擇更符合其需求的定制模型,而不是現成的解決方案,這完全有可能。能源公司主要開發 GenAI 的策略 (60%) 是自己制作或大幅定制其模型。在金融服務和醫療保健領域,47% 的公司也在這樣做。
平衡領域專業知識與人工智能技術
在 Clearwater Analytics,我們與全球金融機構合作,嚴格構建提示以確保它們理解查詢的細微上下文。對于試圖在金融、技術或能源等行業中使用復雜用例的公司而言,專業的提示分析師在這個階段非常寶貴。這些分析師會評估模型的響應并改進提示,以確保它們產生正確的結果。人工監督在部署人工智能工具中仍然發揮著至關重要的作用。
我們已經為客戶解決了兩個或三個強大的案例,使用 GenAI。但是,我們認識到這是一個持續的過程。公司必須不斷為其運營和客戶構建更多用例,才能充分從 GenAI 代理中提取價值。在我們早期使用多代理工作流程的實驗中,代理速度緩慢且性能低下,但我們不斷對其進行迭代。我們發現,范圍越廣,這些代理就越成問題。
小型語言模型 (SLM) 的優勢
如果你縮小模型的范圍,它們在回答特定問題時就會變得更具響應性和能力。例如,如果我正在構建投資管理 GenAI 工作流程或客戶用例,我不需要大型語言模型訓練內容的 90%。我需要更窄的代理,這些代理深入了解與投資經理相關的領域。我需要一位在金融服務領域擁有專業知識的人工智能專業人士來實現這一點。小型語言模型 (SLM) 將激增的最大原因是其可負擔性和資源節約。
高度調整的 LLMs 需要數十億個參數,規模如此之大,以至于互聯網上的數據都用完了。令人驚訝,對吧?訓練這些 LLMs 需要大量的時間和大量的能源消耗,正如微軟重啟臭名昭著的三里島核電站以及英偉達及其 GPU 的市場價值飆升所證明的那樣。大多數公司無法承擔此類模型所需的巨額基礎設施投資。這就是為什么風險投資家正在資助 SLM,例如 Arcee 最近的 2400 萬美元 A 輪融資。
集成合成數據和精選數據用于 SLM
即使 SLM 的訓練數據少得多,提供商仍在為此而苦苦掙扎,因為模型的好壞取決于其底層數據集。因此,提供商花費大量時間來確定使用哪些數據集進行訓練。然而,初創公司正在介入,創建經過精細調整的合成數據集,公司可以使用這些數據集以精確的方式為其獨特的需求訓練模型。
一系列公司正在開發 GenAI 堆棧中每一層的工具,以提高其效率和性能。這進一步支持了這樣一個觀點,即組織應該保持靈活,不要過度依賴任何特定語言模型提供商,無論是 ChatGPT、Claude 還是 Anthropic。每個模型提供商都會獨立發展,因此必須確保您的基礎設施允許根據需要輕松交換模型。
保持 GenAI 采用的靈活性
現在是組織擁抱生成式人工智能熱潮的時候了。通過積極參與這項變革性技術,同時警惕潛在的陷阱,公司可以有效地應對人工智能采用的復雜性。
從小處著手,試點用例,并培養迭代和學習的文化——最大限度地發揮 GenAI 潛力的旅程才剛剛開始,并且正在我們眼前展開。