剛剛,智譜一口氣開源6款模型,200 tokens/秒解鎖商用速度之最 | 免費
就在剛剛,智譜一口氣上線并開源了三大類最新的GLM模型:
- 沉思模型GLM-Z1-Rumination
- 推理模型GLM-Z1-Air
- 基座模型GLM-4-Air-0414
若是以模型大小(9B和32B)來劃分,更是可以細分為六款。
首先是兩個9B大小的模型:
- GLM-4-9B-0414:主攻對話,序列長度介于32K到128K之間
- GLM-Z1-9B-0414:主攻推理,序列長度介于32K到128K之間
還有四個32B大小的模型,它們分別是:
- GLM-4-32B-Base-0414:基座模型,序列長度介于32K到128K之間
- GLM-4-32B-0414:主攻對話,序列長度介于32K到128K之間
- GLM-Z1-32B-0414:主攻推理,序列長度介于32K到128K之間
- GLM-Z1-32B-Rumination-0414:主攻推理,序列長度為128K
而隨著一系列模型的開源,智譜也解鎖了一項行業(yè)之最——
推理模型GLM-Z1-32B-0414做到了性能與DeepSeek-R1等頂尖模型相媲美的同時,實測推理速度可達200 tokens/秒。
如此速度,已然是目前國內(nèi)商業(yè)模型中速度最快,而且它的高性價比版本價格也僅為DeepSeek-R1的1/30。
值得一提的是,本次開源的所有模型均采用寬松的MIT許可協(xié)議。
這就意味著上述的所有模型都可以免費用于商業(yè)用途、自由分發(fā),為開發(fā)者提供了極大的使用和開發(fā)自由度。
那么這些開源模型的效果又如何?
先看性能
首先來看下GLM-4-32B-0414。
它是一款擁有320億參數(shù)的基座大模型,其性能足以比肩國內(nèi)外規(guī)模更大的主流模型。
據(jù)了解,這個模型基于15T高質(zhì)量數(shù)據(jù)進行預訓練,其中特別融入了大量推理類合成數(shù)據(jù),為后續(xù)強化學習擴展提供了堅實基礎。
在后訓練階段,智譜團隊不僅完成了對話場景的人類偏好對齊,還運用拒絕采樣和強化學習等先進技術,重點提升了模型在指令理解、工程代碼生成、函數(shù)調(diào)用等關鍵任務上的能力,從而顯著增強了智能體執(zhí)行任務的核心素質(zhì)。
實際測試表明,GLM-4-32B-0414在工程代碼編寫、Artifacts生成、函數(shù)調(diào)用、搜索問答及報告撰寫等多個應用場景均展現(xiàn)出色表現(xiàn)。
部分基準測試指標已達到或超越 GPT-4o、DeepSeek-V3-0324(671B)等更大規(guī)模模型的水平。
從實測效果來看,GLM-4-32B-0414進一步提升了代碼生成能力,可處理并生成結構更復雜的單文件代碼。
例如來上這么一段Prompt:
用HTML模擬太陽系的行星運動。
再如:
設計一個支持自定義函數(shù)繪制的繪圖板,可以添加和刪除自定義函數(shù),并為函數(shù)指定顏色。
以及設計一個小游戲也是不在話下:
用HTML網(wǎng)頁實現(xiàn)2048小游戲。
圖片
再來看下GLM-Z1-32B-0414的性能,一款專為深度推理優(yōu)化的模型。
這個模型在GLM-4-32B-0414的基礎上,采用了冷啟動結合擴展強化學習的策略,并針對數(shù)學推導、代碼生成、邏輯推理等高難度任務進行了專項優(yōu)化,顯著提升了復雜問題的解決能力。
此外,它還通過引入基于對戰(zhàn)排序反饋的通用強化學習(RLHF),模型的泛化能力得到進一步強化。
盡管僅擁有32B參數(shù),GLM-Z1-32B-0414在部分任務上的表現(xiàn)已可媲美 671B 參數(shù)的DeepSeek-R1。
在AIME 24/25、LiveCodeBench、GPQA等權威基準測試中,該模型展現(xiàn)出卓越的數(shù)理推理能力,能夠高效應對更廣泛、更具挑戰(zhàn)性的復雜任務。
接下來,是更小規(guī)模的GLM-Z1-9B-0414,在技術上是沿用了上述模型的方法。
雖然只有9B大小,但它在數(shù)學推理及通用任務上展現(xiàn)出超越參數(shù)規(guī)模的卓越性能,綜合表現(xiàn)穩(wěn)居同量級開源模型前列。
尤其值得關注的是,在資源受限的應用場景中,該模型能夠高效平衡計算效率與推理質(zhì)量,為輕量化AI部署提供了極具競爭力的解決方案。
最后,再來看下沉思模型GLM-Z1-Rumination-32B-0414。
這個模型可以說是智譜對AGI未來形態(tài)的一個探索。
沉思模型采用與傳統(tǒng)推理模型截然不同的工作范式,通過多步深度思考機制有效應對高度開放性和復雜性問題。
其核心突破體現(xiàn)在三個方面:
- 在深度推理過程中智能調(diào)用搜索工具處理復雜子任務;
- 創(chuàng)新性地引入多維度規(guī)則獎勵體系,實現(xiàn)端到端強化學習的精準引導與擴展;
- 完整支持”問題發(fā)現(xiàn)→信息檢索→邏輯分析→任務解決”的研究閉環(huán)系統(tǒng)。
這些技術創(chuàng)新使該模型在學術寫作、深度研究等需要復雜認知能力的任務上展現(xiàn)出顯著優(yōu)勢。
例如讓它回答一個科學假設推演問題:
如果人類在火星地下發(fā)現(xiàn)液態(tài)湖泊中存在類似地球古菌的微生物,請推測:(1) 這些微生物可能如何適應極端環(huán)境?(2) 這一發(fā)現(xiàn)對‘生命起源泛種論’的支持/反駁證據(jù)有哪些?(3) 設計一個可驗證這些假說的空間實驗方案(預算限制5億美元)。
再看價格
除模型開源外,基座、推理兩類模型也已同步上線智譜MaaS開放平臺(bigmodel.cn),面向企業(yè)與開發(fā)者提供API服務。
本次上線的基座模型提供兩個版本:GLM-4-Air-250414和GLM-4-Flash-250414,其中GLM-4-Flash-250414完全免費。
上線的推理模型分為三個版本,分別滿足不同場景需求:
- GLM-Z1-AirX(極速版):定位國內(nèi)最快推理模型,推理速度可達 200 tokens/秒,比常規(guī)快 8 倍;
- GLM-Z1-Air(高性價比版):價格僅為 DeepSeek-R1 的 1/30,適合高頻調(diào)用場景;
- GLM-Z1-Flash(免費版):支持免費使用,旨在進一步降低模型使用門檻。
為了更加一目了然,價格表如下:
至于配置方面,32B基礎模型、32B推理模型、32B沉思模型(裸模型)的要求如下:
- 1張H100 / A100或者更先進的NVIDIA旗艦顯卡
- 4張4090/5090/3090
One More Thing
除了上述內(nèi)容之外,智譜這次還有一個亮點的動作——
拿下一個頂級域名Z.ai!
目前已經(jīng)上線了下面三款模型:
而且官方還亮出了一個比較有意思的slogan:
最后,縱觀智譜在大模型時代的發(fā)展,不得不感慨其更新迭代以及開源的速度。
這樣難怪它能成為第一家正式啟動IPO流程的“大模型六小龍”。
體驗地址:
z.ai