成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

成本降低90%!Anthropic 推出新 Claude 提示緩存!開發人員將省去一大筆錢

原創 精選
人工智能
緩存提示與大型語言模型內存中的提示不同。例如,OpenAI 的 GPT-4o 提供了一個內存,模型可以在其中記住偏好或詳細信息。但是,它不會像提示緩存那樣,記住并存儲提示和對應的輸出。?

編輯 | 星璇

出品 | 51CTO技術棧(微信號:blog51cto)

Anthropic和OpenAI的競爭日趨白熱化,前不久OpenAI發布了更便于開發者定制輸出的json API,沒過多久Anthropic也開始發布了一項利好開發者的消息:終于不必重復調用同樣地提示了!

Anthropic在其 API 上引入了提示緩存,它可以記住 API 調用之間的上下文并允許開發人員避免重復提示。

簡單來講,新版API可以“記住”一整本書或整個代碼庫,不需要再重復輸入了。這樣一來,不僅處理長文本的延時更低,更是能節省最高90%的成本。

提示緩存功能已在 Claude 3.5 Sonnet 和 Claude 3 Haiku 的公開測試版中推出,但對最大的 Claude 模型 Opus 的支持即將推出。

早在2023 年,論文《PROMPT CACHE: MODULAR ATTENTION REUSE FOR LOW-LATENCY INFERENCE》中就提出了“提示緩存”的方法,它允許用戶在會話中保留常用的上下文。由于模型會記住這些提示,因此用戶可以添加額外的背景信息而不會增加成本。這在有人想在提示中發送大量上下文,然后在與模型的不同對話中引用它的情況下很有用。它還允許開發人員和其他用戶更好地微調模型響應。

圖片圖片

Anthropic 表示,早期用戶“已經看到了針對各種用例的提示緩存帶來的顯著速度和成本改進——從包括完整的知識庫到 100 個示例,再到在提示中包含每次對話”。

該公司表示,潛在的用例包括:降低對話代理的長指令和上傳文檔的成本和延遲、更快地自動完成代碼、為代理搜索工具提供多條指令以及在提示中嵌入整個文檔。

1.緩存提示定價高嗎?

緩存提示的一個優點是每個令牌的價格較低,Anthropic 表示使用緩存提示“比基本輸入令牌價格便宜得多”。

對于 Claude 3.5 Sonnet,編寫要緩存的提示將花費每 100 萬個令牌 (MTok) 3.75 美元,但使用緩存的提示將花費每 MTok 0.30 美元。Claude 3.5 Sonnet 模型的輸入基本價格為每 MTok 3 美元,因此,如果您預先多付一點錢,下次使用緩存的提示時,您可以預期節省 10 倍。

Claude 3 Haiku 用戶將為緩存支付 0.30 美元/MTok,使用存儲提示時支付 0.03 美元/MTok。

雖然 Claude 3 Opus 尚未提供即時緩存功能,但 Anthropic 已經公布了其價格。寫入緩存的費用為 18.75 美元/MTok,但訪問緩存的即時緩存費用為 1.50 美元/MTok。

然而,正如人工智能影響者 Simon Willison 在 X 上指出的那樣,Anthropic 的緩存僅有 5 分鐘的生命周期,并且每次使用時都會刷新。

當然,這并不是 Anthropic 第一次嘗試通過定價與其他 AI 平臺競爭。在 Claude 3 系列模型發布之前,Anthropic大幅下調了其Tokens價格。

在為基于其平臺進行開發的第三方開發者提供低價選項方面,它目前正與谷歌和OpenAI等競爭對手進行某種“競相壓價”的態勢。

2.呼聲極高的功能

其他平臺也提供提示緩存版本。LLM 推理系統 Lamina利用 KV 緩存來降低 GPU 成本。粗略瀏覽一下 OpenAI 的開發者論壇或 GitHub,就會發現有關如何緩存提示的問題。

緩存提示與大型語言模型內存中的提示不同。例如,OpenAI 的 GPT-4o 提供了一個內存,模型可以在其中記住偏好或詳細信息。但是,它不會像提示緩存那樣,記住并存儲提示和對應的輸出。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://m.ekrvqnd.cn/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2017-12-14 14:12:31

網絡推廣數據分析百度單價

2013-02-26 09:29:20

Linux人才Linux

2015-10-12 09:59:14

Polymer谷歌UI

2025-02-17 10:49:49

2018-02-25 08:42:33

數據物聯網SaaS

2022-12-06 09:31:19

Windows 11NeoWin

2019-09-03 08:00:00

電腦硬盤程序

2020-10-27 08:46:06

降低開發人員的生產力

2012-06-11 16:10:56

CDN互聯網

2021-10-27 10:43:24

開發技能代碼

2013-06-20 09:20:15

PaaS云計算SaaS

2010-02-24 13:45:40

Python開發人員

2013-06-14 08:47:45

2024-08-15 13:55:00

AI模型

2024-03-20 17:10:00

微軟ToC應用

2020-01-16 15:40:19

編程語言PythonJava

2009-05-04 09:42:51

IBM軟件開發社交網站

2009-09-03 17:58:34

Android開發人員

2012-05-30 15:15:42

ibmdw

2023-03-15 07:12:53

企業開發人員提供商
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲成人免费视频在线观看 | 亚洲午夜精品 | 亚洲精品久久久久中文字幕欢迎你 | 美女国内精品自产拍在线播放 | 欧美日韩福利视频 | 国产一区二区免费 | 蜜臀久久 | 午夜三区 | 啪啪av | 久久精品国产久精国产 | 亚洲国产第一页 | 久久精品久久久久久 | 91av精品 | 久久精品a级毛片 | 成年人视频免费在线观看 | 日本三级电影在线观看视频 | 99免费在线视频 | 亚洲视频中文字幕 | 亚洲精品一区在线 | 精品久久一区 | 久久久久久国产免费视网址 | 日韩高清在线 | 国产精品伦一区二区三级视频 | 成人综合视频在线观看 | 一区二区中文字幕 | 丁香五月网久久综合 | 999re5这里只有精品 | 一区二区精品 | 毛片a级| 综合色站导航 | 亚洲午夜精品视频 | 水蜜桃久久夜色精品一区 | 午夜精品一区二区三区在线观看 | 国产成人精品一区二区 | 精精国产xxxx视频在线野外 | 免费视频一区二区 | 国产成人免费在线 | 亚洲一区中文字幕 | 国产日韩欧美另类 | 一区二区三区久久 | 久久久这里都是精品 |