譯者 | 布加迪
審校 | 重樓
LLM正在推動各行各業的突破和效率。在選擇一種模型時,企業應該考慮預期的應用、速度、安全、成本、語言和易用性。
雖然與其他人工智能(AI)技術相比,生成式AI比較新,但它已經被用于支持從審查求職者到診斷和推薦疾病治療的一系列任務。IDC預測,到2028年,80%的首席信息官將依靠生成式AI工具來加快分析、促進決策和改善客戶服務等。
企業正在競相挖掘這項技術的潛力,以提高客戶滿意度和員工生產力。為此,它們正在考慮使用最適合支持生成式AI應用的大語言模型(LLM),比如AI copilot和聊天機器人。
了解LLM的多樣性
如今市面上有大量的LLM可供選擇,這意味著企業更有可能找到適合自己特定需求的LLM,而不是求助于一應俱全的LLM。這可以加速創新,不過從數百種模型中選擇合適的模型可能很復雜。
在選擇LLM時,企業應該考慮其預期的應用、速度、安全、成本、語言和易用性。
模型類型包括:
- 商業模型:在醫療保健和金融服務行業很流行,這類模型通常用于涉及專門定制或安全限制的項目。
- 開源模型:由于可訪問性和成本優勢,這類模型經常被初創公司和小企業用于研究。
- 通用模型:這類模型使用大量數據加以訓練,可以用作構建定制AI應用程序的基礎模型。
- 針對特定領域的模型:這類模型經過訓練以適應特定的行業或用例,比如醫療保健或金融服務。
- 針對特定任務的模型:這類度身定制的模型針對單一自然語言處理(NLP)功能進行了優化,比如摘要、答題或翻譯。
- 視覺語言模型:這類模型被稱為VLM,結合了計算機視覺和NLP,從文本描述中生成圖像,并從圖像中識別物體。同時使用文本和代碼讓它們可以在不直接使用視覺數據訓練的情況下創建和理解圖像。
考慮模型的大小也很重要,因為這將影響其功能和局限性。一些因素包括如下:
- 推理速度:較小的模型通常提供較短的推理時間,實現實時處理,提高能效并節省成本。
- 準確性:使用檢索增強生成(RAG)改善的大型模型常常會獲得更高的準確性。
- 可部署性:較小的模型非常適合邊緣設備和移動應用程序,而較大的模型最好在云端或數據中心運行。
- 成本:較大的模型需要更多的計算基礎設施來運行。
開發者還應該基于誰將使用AI模型、應用于何處,考慮AI模型必須支持哪些語言。這在現代工作場所顯得尤為重要,因為員工可能說多種不同的語言。確保模型能夠無縫翻譯語言對于用戶之間的有效溝通和協作至關重要。
此外,隨著主權AI越來越重要,許多國家正在構建使用當地語言和數據集訓練的專有模型。這使各國能夠對AI保持控制權和自主權,確保這些技術的開發和應用符合其獨特的文化、道德和法律標準。
企業如何使用LLM?
LLM支持各種AI應用,包括聊天機器人和預測分析工具,這些應用正在各行各業帶來突破和效率。
- 醫療保健業:Insilico Medicine是一家基于生成式AI的藥物發現公司,它開發了一種新的LLM轉換器:nach0,用于回答生物醫學問題,并合成新分子。這種多領域模型使研究人員能夠高效地處理和分析大型數據集,減少內存需求,提高處理速度,促進更有效的數據管理和組織。
- 電信業:Amdocs正在使用其amAIz平臺來提高業務效率,推動新的收入流,并改善客戶體驗。這包括一款客戶計費代理,便于用戶立即享用基于LLM的數據洞察和自動化,以解決客戶計費問題。
- 金融服務業:Bank Negara(又名BNI)正在整合Cloudera的AI Inference服務,以便使用生成式AI增強客戶體驗,并提高運營效率。這將使BNI能夠在安全的企業環境中有效地部署和管理大規模AI模型,并提供高性能和數據隱私。
針對特定需求量身定制的不同模型允許快速實施AI解決方案和工具,以幫助自動處理冗余工作。這為人們騰出了更多的時間和空間,以便專注于對公司和組織帶來價值的項目。
展望未來,開發者將竭力構建和部署能夠增強行業特定應用的LLM,致力于改善系統之間的互操作性,降低運營成本,并提高效率。使用量身定制的LLM,企業可以構建滿足其獨特需求的AI應用程序,以提高客戶滿意度,并促進卓越運營。
原文標題:Finding the right large language model for your needs,作者:Amanda Saunders