Grok-3四檔定價揭秘:低至0.3美元/百萬token,硬剛谷歌Meta
GenAI競爭,越來越激烈了。
據Similar Web統計,在日活躍用戶方面,Grok與Gemini展開了激烈競爭。兩者都已經超過50萬日活躍用戶,差距不足5萬。
就在昨天,谷歌面向開發者推出全新套餐體系,其中標準套餐對個人開發者免費開放,可免費使用 Gemini 代碼助手。
談及API價格策略,AI巨頭各出奇招:
- Grok-3 推出2款模型,支持2種調用模式,衍生出 4 種定價套餐;
- Anthropic推出100美元的Max套餐,主打高端服務;
- 谷歌Gemini 2.5 需付費解鎖使用限制,以高性價比吸引用戶;
- Meta開源Llama 3,成本優勢顯著,平均每百萬token僅需0.36 美元 。
Grok-3:4種模型,各取所需
xAI,正式向公眾開放了Grok 3系列API!
目前,Grok 3和 Grok 3 Mini均處于Beta測試階段,支持常規模式與快速模式。
- Grok 3 適用于企業應用場景,如數據抽取、編程、文本處理等。其價格為:每輸入100萬token收費3美元,每輸出100萬token收費15美元。
- Grok 3 MINI屬于輕量級模型,適用于對深度領域知識無需求的簡單任務。價格為:每輸入100萬token收費0.3美元,每輸出100萬token收費 0.5 美元。
Grok-3和Grok-3-fast使用的是相同的基座模型,提供相同的響應質量。
它們的區別在于服務方式:Grok-3-fast運行在更快的基礎設施上,響應速度顯著高于標準版grok-3,但其輸出token的成本也更高。
Grok-3和grok-3-fast指向的是相同的模型。
- 如果需要低延遲的應用,選擇grok-3-fast;
- 如果想降低成本,可以選擇grok-3。
對于grok-3-mini和grok-3-mini-fast也是如此。
它們本質上是相同的模型,唯一的區別是響應延遲。
可用模型列表:
grok-3-beta
(標準版):輸入3美元/百萬token,輸出15美元/百萬tokengrok-3-fast-beta
(標準版,快速響應):輸入5美元/百萬token,輸出25美元/百萬tokengrok-3-mini-beta
(輕量版):輸入0.3美元/百萬token,輸出0.5美元/百萬tokengrok-3-mini-fast-beta
(輕量版,快速響應):輸入0.6美元/百萬token,輸出4美元/百萬token
在文檔中,xAI展示了幾個示例。
比如對話補全,可以流式傳輸響應,用戶向xAI API端點發送請求。
API處理該請求后返回完整的響應。
import osfrom openai import OpenAIclient = OpenAI( api_key="<YOUR_XAI_API_KEY_HERE>", base_url="https://api.x.ai/v1",)completion = client.chat.completions.create( model="grok-3-latest", messages=[ {"role": "system", "content": "You are a PhD-level mathematician."}, {"role": "user", "content": "What is 2 + 2?"}, ],)print(completion.choices[0].message)
import os
from openai import OpenAI
client = OpenAI(
api_key="<YOUR_XAI_API_KEY_HERE>",
base_url="https://api.x.ai/v1",
)
completion = client.chat.completions.create(
model="grok-3-latest",
messages=[
{"role": "system", "content": "You are a PhD-level mathematician."},
{"role": "user", "content": "What is 2 + 2?"},
],
)
print(completion.choices[0].message)
響應:
ChatCompletionMessage( cnotallow='2 + 2 equals 4.', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None)
ChatCompletionMessage(
cnotallow='2 + 2 equals 4.',
refusal=None,
role='assistant',
audio=None,
function_call=None,
tool_calls=None
)
AI巨頭,各顯神通
Gemini系列模型推出了免費的Gemini 2.5 Pro、 2.0 Flash等最新模型。
而且除了使用的模型不同,以及部分功能每日請求次數的限制,免費版幾乎和付費版沒有什么不同
今天,Anthropic推出了Max套餐:最低100美元,專為那些重度使用Claude并且需要更多使用次數,完成重要工作的用戶設計。
Llama 4 Maverick 相較于平均水平更為便宜,定價為每百萬token為0.36美元。
- Llama 4 Maverick輸入令牌價格:每百萬個令牌0.20美元
- Llama 4 Maverick輸出令牌價格:每百萬個令牌0.82美元
在ARC-AGI的半私有評估中,Llama 4 Maverick非常具有性價比:
- ARC-AGI-1:每個任務只要0.0078美元
- ARC-AGI-2:每個任務只要0.0121美元
此前,o3被爆出在ARC-AGI測試中燒3萬美元解決一道題,試錯1024次!