成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

力壓GPT-4o!新王Claude 3.5 Sonnet來了,直接免費可用

人工智能
Claude 3.5 Sonnet 是 Anthropic 即將推出的 Claude 3.5 系列的首個版本。該模型提高了整個領域的智能水平,在絕大多數基準評估中都超越了競品大模型和自家前代最強 Claude 3 Opus。與此同時,運行速度、成本與自家前代 Claude 3 Sonnet 相當。

如今,大模型領域更卷了!

前腳 OpenAI 發布 GPT4o,硬控全場,后腳就被最大的競爭對手 Anthropic 超越了。

剛剛,Anthropic 發布了全新大模型 Claude 3.5 Sonnet,號稱是迄今為止最智能的模型。

圖片

據介紹,Claude 3.5 Sonnet 是 Anthropic 即將推出的 Claude 3.5 系列的首個版本。該模型提高了整個領域的智能水平,在絕大多數基準評估中都超越了競品大模型和自家前代最強 Claude 3 Opus。與此同時,運行速度、成本與自家前代 Claude 3 Sonnet 相當。

圖片

地址:https://claude.ai/

目前,Claude 3.5 Sonnet 已經在 Claude.ai 和 Claude iOS 應用程序上免費提供,而 Claude Pro 和 Team 計劃訂戶能夠以更高的速率訪問它。

此外,Claude 3.5 Sonnet 已經可以直接通過 Anthropic API、亞馬遜云科技 Bedrock 等渠道使用。每百萬個輸入 token 的價格為 3 美元,每百萬個輸出 token 的價格為 15 美元,上下文窗口為 200k token。

圖片

圖片

Claude、GPT、Gemini三個模型迭代發布時間線。

Anthropic 稱其目標是每隔幾個月大幅度改進性能、速度和成本之間的權衡曲線。今年晚些時候將發布 Claude 3.5 Haiku 和 Claude 3.5 Opus。

除了開發下一代大模型之外,Anthropic 正在開發新的模式和功能,以支持更多企業用例,包括與企業應用程序的集成。團隊還在探索諸如 Memory 之類的功能,使得模型能夠記住用戶的偏好和指定的交互歷史,從而實現更加個性化和高效的體驗。

比 GPT-4o 更智能

比 Claude 3 Opus 快兩倍

Claude 3.5 Sonnet 為研究生水平推理 (GPQA)、本科生水平知識 (MMLU) 和編碼能力 (HumanEval) 設定了新的行業基準。它在理解細微差別、幽默和復雜指令方面表現出顯著的進步,并且擅長以自然、親切的語氣撰寫高質量的內容。

Claude 3.5 Sonnet 的運行速度是 Claude 3 Opus 的兩倍。這種性能的提升加上實惠的價格,使 Claude 3.5 Sonnet 成為復雜任務的理想選擇。

在內部代理編碼評估中,Claude 3.5 Sonnet 解決了 64% 的問題,優于 Claude 3 Opus(解決了 38%)。Anthropic  評估測試了 Claude 3.5 Sonnet 根據自然語言描述的需求,修復錯誤或增加功能到開源代碼庫中的能力。

在獲得指導和相關工具后,Claude 3.5 Sonnet 可以獨立編寫、編輯和執行代碼,并具有復雜的推理和故障排除功能。Claude 3.5 Sonnet 可以輕松處理代碼轉換,這對于更新舊版應用程序和遷移代碼庫特別有效。

下表為 Claude 3.5 Sonnet 與其他模型的比較,評估基準包括推理、閱讀理解、數學、科學和編碼。在所有這些基準測試中,Claude 3.5 Sonnet 的表現均優于之前的前沿模型 Claude 3 Opus。

我們也可以看到表中 Claude3.5 與 GPT-4o 的對比數據,除了數學方面,得分都比 GPT-4o 高或者逼近

圖片

迄今為止最強視覺模型

Anthropic 表示,Claude 3.5 Sonnet 是其最強的視覺模型,在所有標準視覺基準測試中都超越了前代 Claude 3 Opus。

尤其是在需要視覺推理的任務中表現更為明顯,例如解釋圖表、圖形或者從不完美的圖像中轉錄文本,這是零售、物流和金融服務行業的核心功能。在這些領域,人工智能可以從圖像、圖形或插圖中收集到比單獨文本中更多的見解。

下圖為 Claude 3.5 Sonnet 與 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 在視覺數學推理、科學圖表、視覺問答、圖表 QA、文件視覺 QA 任務中的性能比較。

圖片

Artifacts—— 使用 Claude 的新方式

Anthropic 還在 Claude.ai 上推出了 Artifacts,這是一項擴展用戶與 Claude 交互方式的新功能。當用戶要求 Claude 生成代碼片段、文本文檔或網站設計等內容時,這些工件會出現在他們的對話旁邊的專用窗口中。這創建了一個動態工作空間,他們可以在其中實時查看、編輯和構建 Claude 的創作,將人工智能生成的內容無縫集成到他們的項目和工作流程中。

Artifacts 預覽功能標志著 Claude 從對話式 AI 向協作工作環境的演變,并將很快擴展到支持團隊協作。在不久的將來,團隊將能夠安全地將他們的知識、文檔和正在進行的工作集中在一個共享空間中,而 Claude 則按需充當隊友。

最后,Anthropic 表示他們對模型進行了嚴格的測試,并致力于減少其被濫用的可能性。

Anthropic 安全團隊對 Claude 3.5 Sonnet 在化學、生物、放射性和核(CBRN)風險、網絡安全和自主能力領域進行了一系列的評估,最后將 Claude 3.5 Sonnet 分類為 AI 安全等級 2(ASL-2)模型,表明它不會構成災難性傷害的風險。

此外,作為對安全和透明度承諾的一部分,Anthropic 還與外部專家合作測試和完善這一最新模型中的安全機制。

官博地址:https://www.anthropic.com/news/claude-3-5-sonnet

責任編輯:姜華 來源: 機器之心
相關推薦

2024-10-06 09:00:00

AI訓練數據

2024-06-21 09:51:17

2025-01-22 16:57:32

字節跳動豆包大模型

2024-06-28 18:13:05

2024-06-24 12:25:22

2024-07-11 16:38:15

2024-07-16 13:24:38

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2025-04-08 02:26:00

2024-06-21 09:57:00

2024-03-27 13:32:00

AI數據

2024-09-06 13:00:29

2024-06-27 12:45:30

2024-10-17 13:30:00

2025-01-06 13:15:02

2024-05-14 07:20:49

模型AI

2024-05-30 13:13:43

2024-08-14 14:30:00

AI訓練

2025-03-31 09:27:03

2025-05-26 02:15:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美在线一区二区三区 | www.国产.com| a视频在线观看 | 国产成人精品综合 | 日韩在线播放中文字幕 | 国产日韩欧美91 | 国产精品一区二区在线 | 99精品国产一区二区三区 | 亚洲欧美日韩精品久久亚洲区 | 中文字幕一区二区三区精彩视频 | 国产中文区二幕区2012 | 国产综合在线视频 | 国产精品成人一区 | 午夜影院普通用户体验区 | 久久国产秒 | 一级午夜aaa免费看三区 | 日本一区二区三区四区 | 美国黄色毛片 | 日韩欧美手机在线 | 亚洲国产一区二区在线 | 国产精品 欧美精品 | 国产成人精品999在线观看 | 午夜精品久久久久久久久久久久久 | 蜜桃视频成人 | 超碰婷婷 | 中文字幕不卡在线观看 | 国产91丝袜在线播放 | 伊人操| 精品真实国产乱文在线 | 日韩波多野结衣 | 午夜电影网 | 日韩中文字幕 | 成人免费视频一区二区 | 国产乱码久久久久久 | 欧美午夜视频 | 成人亚洲一区 | 日韩在线第一 | 国产一区二区欧美 | 免费在线观看一区二区三区 | 男女视频在线免费观看 | 久久久免费精品 |