企業中最常用的十種GenAI工具
從AI聊天機器人和虛擬助手,到音頻和視頻生成器,這些都是當今最前沿的GenAI工具。
自OpenAI于2022年推出ChatGPT以來,GenAI已大規模進入企業領域。根據Precedence Research的數據,2024年全球GenAI市場規模已超過250億美元,并預計到2033年將達到驚人的8030億美元。同時,賓夕法尼亞大學沃頓商學院的沃頓AI和分析倡議組織(AI at Wharton)與咨詢公司GBK Collective的一項針對高層決策者的研究發現,2024年擁有1000名或更多員工的企業在GenAI上的投資平均比2023年高出了一倍以上。
然而,德勤最近的一項調查顯示,盡管大多數董事級至高管級的受訪者在使用或實施GenAI計劃方面有經驗,并計劃在下一個財政年度增加其整體AI支出,但他們的態度較為謹慎,預計在未來幾個月內,只有30%或更少的GenAI實驗能夠全面推廣,這反映了他們手頭可用的工具狀況。因此,鑒于當前的獲取和采用環境,以下是當前企業中最常用的10種GenAI工具。
ChatGPT
ChatGPT是OpenAI推出的一款聊天機器人應用程序,它建立在生成式預訓練轉換器(GPT)模型之上。自2022年推出以來,它已成為企業中最常用的GenAI工具,沃頓商學院最近的調查顯示,62%的受訪者表示他們目前正在使用它,28%的受訪者表示他們目前尚未使用但正在評估或測試它。
ChatGPT的優勢在于自然語言的理解和生成,使其成為應對復雜語言挑戰的優秀工具,包括自動化和改進客戶服務、通過處理重復性查詢來簡化運營、生成報告、起草電子郵件以及創建產品描述等。
與所有GenAI一樣,ChatGPT的準確性可能會有所不同,而且它無法理解情緒,這可能會在某些情況下引發問題。因此,可能需要人類監督和干預。
Microsoft Copilot
Microsoft Copilot是嵌入在Microsoft 365中的一款對話聊天界面,旨在增強Word、Excel、PowerPoint、Outlook和Teams等應用程序的生產力。它于2023年推出,利用OpenAI的GPT-4基礎大型語言模型(LLM),是第二大常用的GenAI工具。根據沃頓商學院的調查,52%的受訪者表示他們的企業目前正在使用Copilot,35%的受訪者表示他們正在評估或測試它。
Copilot的強項在于它與Microsoft 365環境中員工全天使用的生產力應用程序的集成。它遵循企業已有的安全、合規和隱私政策,并可作為現有Microsoft許可證的附加組件提供。其用途包括:
? 在Word中起草文檔和摘要文本
? 根據Excel中現有數據生成圖表
? 在PowerPoint中創建大綱和設計幻燈片
? 管理Outlook收件箱、摘要電子郵件線程和起草回復
? 匯總Teams會議的關鍵點并創建待辦事項
? 利用Power BI通過自然語言查詢創建報告和可視化內容
與ChatGPT一樣,Copilot的準確性并非完美。例如,在總結內容時,它可能會遺漏要點或忽略關鍵細節。同樣,即使在使用品牌材料、文案和圖像時,其輸出也不一定符合品牌標準。用戶需要關注其輸出。
Google Gemini
Google Gemini(前身為Bard)是一款基于Google的Gemini多模態AI模型構建的對話聊天機器人。沃頓商學院的調查顯示,40%的受訪者表示他們目前正在使用Gemini,39%的受訪者表示他們正在評估或測試它。
與ChatGPT和Microsoft Copilot相比,Gemini在2023年推出時,在多模態功能方面處于領先地位——除了文本之外,它還能夠處理和生成圖像、音頻和視頻。Gemini與Gmail、Docs和Slides等Google Workspace工具集成。
Gemini的潛在用途包括:
? 根據Smart Email Composer的提示起草電子郵件
? 根據提示在Google Slides中創建幻燈片演示文稿
? 通過Spreadsheet Analyzer在Google Sheets中識別趨勢、異常值和相關性
? 為Google Meet視頻會議生成背景插圖并模擬專業照明,甚至改善音頻體驗
Gemini與Google Workspace的集成使其成為在使用Workspace的環境中出類拔萃的工具,但在此類環境之外,其效用有限,因為它在Google的安全環境中運行。與ChatGPT和Copilot一樣,準確性可能是一個問題,因此建議對人類監督其輸出。
Meta AI
Meta AI是Meta為其消息和社交媒體應用程序(包括Facebook、Instagram、WhatsApp和Messenger)打造的多模態AI虛擬助手。與Gemini一樣,沃頓商學院的調查顯示,40%的受訪者表示他們目前正在使用Meta AI,36%的受訪者表示他們正在評估或測試它。
Meta AI由Meta的Llama大型語言模型(LLM)提供支持,用戶可以利用它在公司的應用程序中提供建議、回答問題、編輯圖像和提供翻譯。企業可以使用Meta AI來設置虛擬助手,這些助手可以:
? 自動化客戶互動,包括回答問題和提供個性化建議
? 在Meta的應用程序內促進交易
? 分析數據,以幫助企業創建有針對性的營銷活動
Meta AI已經與許多客戶在線花費大量時間的應用程序集成,但訪問客戶數據可能存在隱私和道德問題。
Dall-E 3
GenAI不僅僅關乎聊天機器人和虛擬助手。同樣來自OpenAI的DALL-E 3專注于根據文本描述生成視覺內容,沃頓商學院的調查顯示,30%的受訪者表示他們目前正在使用DALL-E 3,35%的受訪者表示他們正在評估或測試它。OpenAI于2021年推出了原始的DALL-E模型,而DALL-E 3深度學習模型則利用計算機視覺和自然語言處理來創建視覺內容。其潛在商業用途包括產品構思、應用程序原型設計、標志設計、為社交媒體帖子和教育材料創建圖像和視頻等。
在AI圖像生成器中,DALL-E 3的強項在于它與ChatGPT的集成,但許多用戶表示,它在逼真度方面存在困難,具有一種獨特的風格,使得很容易識別出模型生成的圖像。
RunwayML Gen-1和Gen-2
Runway利用文本、圖像和視頻輸入(包括由其他GenAI工具生成的內容)來生成視頻,沃頓商學院的調查顯示,25%的受訪者表示他們目前正在使用Gen-1和Gen-2,31%的受訪者表示他們正在評估或測試這些模型。
2023年發布的Gen-2模型擴展了Gen-1模型的功能,允許創建長達18秒的視頻。用戶可以指導相機的移動以定制內容,并將片段拼接在一起以創建更長的視頻。除此之外,企業還可以使用該工具來制作靜態資產的動畫、視覺效果和故事板。
Runway的某些功能學習曲線較陡峭,而且可能會占用大量資源。
Stable Diffusion
Stable Diffusion是Stability AI于2022年推出的一款深度學習模型,它可以根據文本和圖像提示生成高分辨率、逼真的圖像。它還可以創建視頻和動畫,沃頓商學院的調查顯示,24%的受訪者表示他們目前正在使用Stable Diffusion,33%的受訪者表示他們正在評估或測試它。
Stable Diffusion基于一種潛在擴散模型,該模型所需的處理能力遠低于一些競爭對手,因此它能夠在配備消費級GPU的臺式機和筆記本電腦上運行,而不局限于云服務。
Stable Diffusion的潛在商業用途包括醫學成像、為目錄生成視覺內容、設計數字原型、創建概念藝術和故事板,以及圖像編輯(包括色彩校正和降噪)。
Midjourney
Midjourney是一款根據自然語言提示生成圖像的工具。自2022年推出公開測試版以來,沃頓商學院的調查顯示,23%的受訪者表示他們目前正在使用Midjourney,32%的受訪者表示他們正在評估或測試它。
可以通過Discord通信平臺或該工具的官方網站訪問Midjourney。
通過Midjourney商業許可證創建的圖像可用于商業用途,但除非經過人類的重大改造,否則不能享有版權。因此,未經人類藝術家改造的Midjourney創建的圖像被視為公共領域。
Perplexity
Perplexity是Perplexity AI于2022年推出的一款基于AI的搜索引擎,它利用大型語言模型(LLMs)處理查詢并綜合響應,沃頓商學院的調查顯示,21%的受訪者表示他們目前正在使用Perplexity,33%的受訪者表示他們正在評估或測試它。
Perplexity建立在Microsoft Azure之上。免費版本利用OpenAI的GPT-3.5大型語言模型,但付費用戶可以選擇自己的模型。其用途包括:
? 內部搜索,用于同時在網絡和內部文檔中搜索內容
? 金融,包括實時股票報價、價格跟蹤、行業同行比較和基本財務分析工具
? Perplexity Assistant,一款適用于Android設備的基于AI的搜索助手
Claude
Claude是Anthropic于2023年推出的一款對話式AI聊天機器人,沃頓商學院的調查顯示,19%的受訪者表示他們目前正在使用Claude,34%的受訪者表示他們正在評估或測試它。
Claude遵循Anthropic開發的憲法AI(CAI)原則,這是一種訓練AI系統的方法,旨在解決透明度、安全性和無需依賴人類反饋即可做出決策方面的擔憂。CAI旨在為Claude設定道德界限,使其能夠拒絕回答可能造成傷害的查詢。
Claude是ChatGPT等其他通用產品的替代品,企業可以利用它來自動化和改進客戶服務、通過處理重復性查詢來簡化運營、生成報告、起草電子郵件以及創建產品描述。
Claude以其回復的清晰度而聞名,但也有冗長的傾向。