Claude 3 橫空出世,亞馬遜云科技攜手Anthropic引領企業級生成式 AI 新紀元?
原創2024 年 3 月,OpenAI 的主要競爭對手之一 Anthropic 推出最新的 Claude 3 大語言模型系列:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。自從 GPT-3.5 推出以來,業界對標 OpenAI 的企業很多,但 Claude 3 一經推出便得到了社會廣泛的關注,因為 Claude 3 在多項測評中都展現出優秀的水平,交付了“高分答卷”。 同時,亞馬遜對 Anthropic 進行高達 40 億美元的投資也引發了社會關注和討論。
不過,亞馬遜對 Anthropic 的支持不止于此。亞馬遜云科技還為 Anthropic 提供了強大的云服務能力以及 Amazon Trainium 和 Amazon Inferentia 芯片能力,幫助 Anthropic 建構 Claude 3 模型。
近日,亞馬遜云科技舉辦了以“亞馬遜云科技攜手 Anthropic 推進生成式 AI 創新”為主題的媒體溝通會。在會上,亞馬遜云科技大中華區產品部總經理陳曉建詳細介紹了 Claude 3 的優勢、應用場景,以及 Amazon Bedrock 如何將大模型的能力提供給企業。
Claude 3 強在哪里?為何能得到亞馬遜的大力支持?
首先從客觀、權威的多項 AI 系統評估基準測試結果來看,Claude 3 表現出了高超的水平,尤其是 Claude 3 Opus,在本科生水平專業知識(MMLU)、研究生水平專業推理(GPQA)、基礎數學(GSM8K)等測試中表現優異,創造了模型智能水平的新紀錄——在數學問題、編程練習和科學推理等標準評估中超越了所有現有模型。不僅如此,Claude 3 Opus 能夠在復雜任務中表現出優秀的理解能力和流暢性,走在了通用智能的最前沿。
在大模型價格高昂的時代,性能高也意味著價格高。但 Claude 3 不僅做到了性能優越,還做到了價格實惠。Claude 3 并不只有一個模型,而是系列模型,一共有三種:
- 具有幾乎即時響應能力的 Claude 3 Haiku;
- 在技能與速度之間達到理想平衡的 Claude 3 Sonnet;
- 為處理高度復雜任務設計的最智能模型 Claude 3 Opus。
用戶可以根據自己的商業需求,從中選擇最合適的功能、速度和價格組合。其中 Claude 3 Haiku 和 Claude 3 Sonnet 的價格低于業界同等智能模型,且并非一倍或兩倍的差別。
除了價格、推理、數學方面的優勢,Claude 3 在理解內容方面也有了很大的突破。
Claude 3 可以接收基于圖像的輸入,能力與其他前沿模型大致相同,但 Claude 3 更加擅長理解圖片、圖表、圖形、技術圖解及光學字符識別 (OCR),理解速度優于業界其他多模態模型的同時,延遲更低。根據評估顯示,Claude 3 Haiku的速度優于所有同一水平的前沿模型。
除了擅長理解圖形、圖表,Claude 3 在理解文字內容時也展現出驚人的準確性。Claude 3 系列模型均提供 200K 超長上下文準確召回,針對某些特殊場景,Claude 3 開放支持 1M token 的上下文窗口。并且 Claude 3 在“大海撈針”(Needle In A Haystack, NIAH)中的召回率表現優異。“大海撈針”是一種測試,能夠反映大模型長文本的理解能力。在媒體溝通會的現場,亞馬遜云科技技術專家為大家演示了這一能力——在《流浪地球》的節選內容中插入一句《三體》的內容,Claude 3 Sonnet 精準地找到了《三體》的內容。
而在大家比較關心的 AI 幻覺方面,Claude 3 目前能夠有效降低幻覺,尤其是在處理挑戰性開放問題 (100Q Hard) 時準確性明顯提升,減少錯誤答案。
以上都是 Claude 3 在理論層面上的優勢,而在實際的場景應用中,Claude 3 也更加貼近人類的思考方式。比如 Claude 3 的代碼輔助能力會更加貼近程序員的編寫習慣。Claude 3 不僅能夠提供建議的代碼,還能給出詳細的步驟,使程序員可以按照建議進行操作的同時輕松掌握該項代碼技能。
除此之外,Claude 3 能夠模仿指定作者的風格進行內容續寫;可以為根據電商商品的模特展示圖精準捕捉產品細節生成更準確的產品描述;還可以根據提供的相關服務文檔,準確回答該服務在不同區域的價格且信息提取更完整。
1+1>2, Amazon Bedrock + Claude 3 為企業提供超強 AI 能力
Claude 3 模型一經問世,亞馬遜云科技便在第一時間將 Claude 3 集成在 Amazon Bedrock,從而幫助企業更好地利用生成式 AI 進行業務創新。既然 Claude 3如此強大,為什么還要集成在 Amazon Bedrock 上?原因也很簡單,Amazon Bedrock + Claude 3 可以為企業提供更強大的 AI 能力。
首先,亞馬遜云科技認為“沒有一個模型可以適用于所有業務場景”,所以亞馬遜云科技在生成式 AI 領域提供三層技術棧,從最底層的高性能基礎設施,到中間層提供最廣泛的基礎模型選擇,再到上層應用 GenAI 技術的開箱即用的云服務,全方位幫助企業更好地使用 AI 能力。而 Amazon Bedrock 處于中間層,被視為云計算時代的“AI 操作系統”,集成了多種先進的大模型和工具鏈,企業可以在此基礎上定制模型,同時保持數據私有和安全,并與其他在亞馬遜云科技上的工作負載無縫集成。
其次,模型能力與實際運營生產之間需要更多的輔助能力。Amazon Bedrock 能夠提供除了大模型以外的能力,比如 Provisioned Throughput (預置吞吐量),企業可以獨享大模型能力的后臺資源,并在業務需要支持時享受穩定的服務保障。還有模型微調(fine-tunning)。企業要想產生業務差異化價值,則不能只是簡單地使用完全標準化的大模型,而是要將自身的業務數據與大模型結合,因此需要模型微調的能力來實現。除此之外,Guardrails 能夠全面監管大模型使用情況,不僅能夠通過適當的配置降低幻覺,還能提供全方位日志。
最后,企業使用大模型的目的是與自身業務結合產生更大的價值,這就意味著企業需要將自己的知識庫與大模型結合。目前,業界通常使用向量數據庫,也就是通過向量的方式存儲知識庫,這就需要非常強的數據底座來支撐。亞馬遜云科技能夠幫助企業管理自身的業務數據,并建立堅實的數據基石——Data Foundation。除此之外,亞馬遜云科技還能為企業大量提供針對構建數據庫的服務,并通過 zero-ETL 幫助企業無縫打通 OLTP 數據和 OLAP 數據。
在當今快速發展的 AI 時代,大模型技術無疑是推動企業創新和轉型的關鍵力量。然而,企業面臨的挑戰遠不止于簡單地引入和應用的大模型,還需要如何正確、合理、安全、高效地使用大模型。亞馬遜云科技通過自身綜合的產品和服務,為企業提供了一個堅實的技術基礎,使得企業不僅能夠引入大模型,還能確保模型在企業實際業務中發揮最大的效用。而 Claude 3 與 Amazon Bedrock 的結合,無疑將進一步推動企業級AI技術的發展,為企業帶來前所未有的價值和機遇。