DeepSeek上線國家超算平臺!671B滿血版,三大運營商接入,平頭哥芯片適配
DeepSeek的含金量還在上升,一個半個周末過去發生這些大事:
- 國家超算互聯網平臺上線DeepSeek-R1,最高支持671B的滿血版。
- 達摩院玄鐵芯片成功適配DeepSeek-R1系列蒸餾模型,在RISC-V架構CPU和端側平臺打開新的應用空間。
再加上春節期間的三大運營商全面接入DeepSeek等消息,它的影響力已不僅限于AI和互聯網,正在往產業更深層進發。
總之,對于用戶和開發者來說不用再看“服務器繁忙”的臉色,可以多換幾個地方再試了。
隨著官方服務器不堪重負,以及DeepSeek-V3 API優惠結束恢復原價,各大云服務商也抓住機會卷了起來。
云服務卷價格,新式芯片卷速度
騰訊云率先上線支持聯網搜索的DeepSeek,結合自家旗下搜狗搜索提供搜索增強API。
同時支持集成私域知識庫,一鍵整合RAG。
商湯和阿里直接卷起了價格。
商湯大裝置平臺上3個月內可限時免費使用1000萬tokens,同時支持128K最大上下文長度限制。
阿里云為新用戶提供100萬免費tokens,同時蒸餾版模型價格也比較低。
與此同時,各類芯片正在輸出速度上展開激烈競爭。
通用GPU方面,AMD員工透露MI300X上的DeepSeek-R1滿血版速度比剛發布時已經快了3倍,并發布官方Docker Image鏡像。
在英偉達與CUDA生態之外,提供AMD與ROCm的另一種選擇。
三大新型AI推理芯片Groq、Cerebras、Sambanova已經把DeepSeek-R1-Distill Llama-70B搞到了每秒500-1500tokens。
快到你都看不清發生了什么,推理思維鏈完成了、代碼寫完了,一眨眼直接運行了。
△groq芯片運行DeepSeek-R1-Distill Llama-70B
One More Thing
還有一條有意思的消息,ai.com域名現在已定向到DeepSeek官網。
甚至有傳言稱是DeepSeek重金拿下了該域名。
不過一直關注大模型的朋友可能還記得,這個域名曾先后定位到ChatGPT和xAI。
大概率是域名所有人個人行為~
國家超算互聯網平臺https://www.scnet.cn/
騰訊云DeepSeek專題https://cloud.tencent.com/developer/special/deepseek
阿里云DeepSeek解決方案https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms
商湯大裝置https://www.sensecore.cn