編譯丨諾亞
出品 | 51CTO技術棧(微信號:blog51cto)
在IT行業,“精益”常用來描述追求更高效率和成本效益的流程,生成式AI也不例外。一些企業的AI系統運行成本高達數百萬美元,并消耗大量電力,促使企業尋求更高效、精益的AI解決方案。
企業自然傾向于借助公共云快速部署生成式AI,因其提供便捷的一站式服務。大型云服務商已從AI投資中獲益。但使用云服務的成本有時會超過傳統數據中心,盡管如此,企業仍在尋找有效降低成本的方法,這正是精益AI概念的意義所在。
1.精益AI是如何工作的
精益人工智能是一種戰略方法,強調在交付最大商業價值的同時注重效率、成本效益以及最小資源消耗。許多精益人工智能的方法借鑒了最初用于制造業和產品開發的精益管理方法。
精益人工智能側重于優化人工智能系統的開發、部署和運營。它采用較小的模型、迭代開發實踐以及資源高效的技巧來減少浪費。通過優先考慮敏捷的數據驅動決策制定和持續改進,精益人工智能使企業能夠以可持續且可擴展的方式利用人工智能的力量。這確保了人工智能計劃既具有影響力又經濟可行。
如今,企業意識到更大的并不總是更好的。企業人工智能轉型的景觀由小型語言模型(SLM)和一波開源進展所標志。這種演變是對生成式人工智能系統使用大型語言模型(LLM)所帶來的高昂成本和資源需求的一種直接回應。許多企業現在希望重新評估成本與商業價值之間的平衡。
2.大型語言模型的挑戰
像OpenAI的GPT-4和Meta的Llama這樣的大型語言模型在理解和生成人類語言方面展示了非凡的能力。然而,這些優勢伴隨著許多越來越難以讓企業接受的挑戰。這些模型的計算需求及其相應的云成本非常高,給預算帶來壓力并限制了更廣泛的采用。還有能源消耗的問題,這不僅帶來了財務負擔,也帶來了重大的環境影響。
操作延遲是另一個障礙,特別是對于需要實時響應的應用程序而言。我們也不應忽視管理和維護這些龐大模型的復雜性,這些模型需要專門的專業知識和基礎設施,而并非所有組織都具備這些條件。
3.轉向小型語言模型
在這種背景下,小型語言模型被加速用于生成式人工智能在云端和非云端環境中的部署。它們正越來越多地被視為實用的選擇。小型語言模型旨在顯著降低計算資源需求和能源消耗。這意味著更低的運營成本和更具吸引力的人工智能計劃投資回報率。更快的訓練和部署周期也使得小型語言模型對那些需要在快節奏市場中保持敏捷性和響應性的企業更具吸引力。
企業通常不會使用大型語言模型,所以建議它們這樣做是不現實的。相反,它們將構建更有針對性的人工智能系統來解決特定的應用場景,例如設備維護、運輸物流和制造優化等領域,在這些領域中,精益人工智能方法可以立即產生商業價值。
小型語言模型還加強了定制化。這些模型可以針對具體任務和行業領域進行精細調整,產生專業應用并產生可衡量的商業成果。無論是在客戶服務、金融分析還是醫療診斷領域,這些更精簡的模型都證明了自己的有效性。
4.開源的優勢
開源社區一直是推動小型語言模型進步和采用的驅動力。Meta的新版本Llama 3.1提供了多種大小選項,能夠在不過度消耗資源的情況下提供強大的能力。其他模型,如斯坦福大學的Alpaca和Stability AI的StableLM,表明小型模型的表現可以媲美甚至超越其大型對手,尤其是在特定領域的應用中。
來自Hugging Face、IBM的Watsonx.ai等公司的云平臺和工具使得這些模型更容易獲取,并降低了各類企業的入門門檻。這種人工智能能力的民主化是一個游戲規則改變者。更多的組織可以在不依賴專有且往往價格昂貴的解決方案的情況下融入先進的人工智能技術。
5.企業的轉變
采用小型語言模型對企業來說有多重好處:
- 成本效益:這些模型讓企業能以更低的成本部署人工智能,這對需要最大化技術投資的初創公司和中小企業尤為重要。
- 敏捷性提升:更快的部署速度和更靈活的定制能力確保AI功能更好地適應不斷變化的業務需求。
- 數據隱私與主權:在本地或私有云部署小型模型可以更好地保護數據隱私,滿足監管要求并確保數據安全。
- 可持續發展:較低的能源消耗支持企業的環保目標。
借助開源創新,小型語言模型降低了大型AI系統的成本和復雜度,為企業提供了高效、可定制的路徑。這種轉變提高了AI投資的價值,并促進了可持續且可擴展的增長。在可持續且經濟實惠的人工智能領域,小型模型正變得越來越重要。
參考鏈接:https://www.infoworld.com/article/3480593/small-language-models-and-open-source-are-transforming-ai.html