成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型最快推理芯片一夜易主:每秒500tokens干翻GPU!谷歌TPU人馬打造,喊話奧特曼:你們也太慢了

人工智能 芯片
至于GPT-4這邊的表現(xiàn),內(nèi)容質(zhì)量自然更好,也體現(xiàn)了整個(gè)思路過程。但要完全生成超過了三十秒。單是讀后感內(nèi)容的生成,也有近二十秒鐘的時(shí)間。

太快了太快了。

一夜間,大模型生成已經(jīng)沒什么延遲了……來感受下這速度。

,時(shí)長00:06

眼花繚亂了吧,生成速度已經(jīng)接近每秒500 tokens。

還有更直觀的列表對比,速度最高能比以往這些云平臺廠商快個(gè)18倍吧。

圖片
(這里面還有個(gè)熟悉的身影:Lepton)

網(wǎng)友表示:這速度簡直就是飛機(jī)vs走路。

圖片

值得一提的是,這并非哪家大公司進(jìn)展——

初創(chuàng)公司Groq,谷歌TPU團(tuán)隊(duì)原班人馬,基于自研芯片推出推理加速方案。(注意不是馬斯克的Grok)

據(jù)他們介紹,其推理速度相較于英偉達(dá)GPU提高了10倍,成本卻降低到十分之一。

換言之,任何一個(gè)大模型都可以部署實(shí)現(xiàn)。

目前已經(jīng)能支持Mixtral 8x7B SMoE、Llama 2的7B和70B這三種模型,并且可直接體驗(yàn)Demo。

他們還在官網(wǎng)上喊話奧特曼:

你們推出的東西太慢了……

圖片

每秒接近500tokens

既然如此,那就來體驗(yàn)一下這個(gè)號稱「史上最快推理」的Groq。

先聲明:不比較生成質(zhì)量。

就像它自己說的那樣,內(nèi)容概不負(fù)責(zé)。

圖片

目前,演示界面上有兩種模型可以選擇。

圖片

就選擇Mixtral 8x7B-32k和GPT-4同擂臺對比一下。

提示詞:你是一個(gè)小學(xué)生,還沒完成寒假作業(yè)。請根據(jù)《星際穿越》寫一篇500字的讀后感。

結(jié)果啪的一下,只需1.76秒就生成了一長串讀后感,速度在每秒478Tokens。

圖片

不過內(nèi)容是英文的,以及讀后感只有三百六十多字。但后面也趕緊做了解釋說考慮到是小學(xué)生寫不了那么多……

圖片

至于GPT-4這邊的表現(xiàn),內(nèi)容質(zhì)量自然更好,也體現(xiàn)了整個(gè)思路過程。但要完全生成超過了三十秒。單是讀后感內(nèi)容的生成,也有近二十秒鐘的時(shí)間。

圖片

除了Demo演示外,Groq現(xiàn)在支持API訪問,并且完全兼容,可直接從OpenAI的API進(jìn)行簡單切換。

可以免費(fèi)試用10天,這期間可以免費(fèi)獲得100萬Tokens。

目前支持Llama 2-70B 和7B, Groq可以實(shí)現(xiàn)4096的上下文長度,還有Mixtral 8x7B這一型號。當(dāng)然也不局限于這些型號,Groq支持具體需求具體定制。

價(jià)格方面,他們保證:一定低于市面上同等價(jià)格。

圖片

不過可以看到,每秒500tokens似乎還不是終極速度,他們最快可以實(shí)現(xiàn)每秒750Tokens。

谷歌TPU團(tuán)隊(duì)創(chuàng)業(yè)項(xiàng)目

Groq是集軟硬件服務(wù)于一體的大模型推理加速方案,成立于2016年,創(chuàng)始團(tuán)隊(duì)中很多都是谷歌TPU的原班人馬。

公司領(lǐng)導(dǎo)層的10人中,有5人都曾有谷歌的工作經(jīng)歷,3人曾在英特爾工作。

創(chuàng)始人兼CEO Jonathan Ross,設(shè)計(jì)并實(shí)現(xiàn)了第一代TPU芯片的核心元件,TPU的研發(fā)工作中有20%都由他完成。

圖片

Groq沒有走GPU路線,而是自創(chuàng)了全球首個(gè)L(anguage)PU方案。

LPU的核心奧義是克服兩個(gè)LLM瓶頸——計(jì)算密度和內(nèi)存帶寬,最終實(shí)現(xiàn)的LLM推理性能比其他基于云平臺廠商快18倍。

據(jù)此前他們介紹,英偉達(dá)GPU需要大約10焦耳到30焦耳才能生成響應(yīng)中的tokens,而 Groq 設(shè)置每個(gè)tokens大約需要1焦耳到3焦耳。

因此,推理速度提高了10倍,成本卻降低了十分之一,或者說性價(jià)比提高了100倍。

圖片

延遲方面,在運(yùn)行70B模型時(shí),輸出第一個(gè)token時(shí)的延時(shí)僅有0.22秒。

圖片

甚至為了適應(yīng)Groq的性能水平,第三方測評機(jī)構(gòu)ArtificialAnalysis還專門調(diào)整了圖表坐標(biāo)軸。

圖片

據(jù)介紹,Groq的芯片采用14nm制程,搭載了230MB大SRAM來保證內(nèi)存帶寬,片上內(nèi)存帶寬達(dá)到了80TB/s。

算力層面,Gorq芯片的整型(8位)運(yùn)算速度為750TOPs,浮點(diǎn)(16位)運(yùn)算速度則為188TFLOPs。

圖片

Groq主要基于該公司自研的TSP架構(gòu),其內(nèi)存單元與向量和矩陣深度學(xué)習(xí)功能單元交錯(cuò),從而利用機(jī)器學(xué)習(xí)工作負(fù)載固有的并行性對推理進(jìn)行加速。

圖片

在運(yùn)算處理的同時(shí),每個(gè)TSP都還具有網(wǎng)絡(luò)交換的功能,可直接通過網(wǎng)絡(luò)與其他TSP交換信息,無需依賴外部的網(wǎng)絡(luò)設(shè)備,這種設(shè)計(jì)提高了系統(tǒng)的并行處理能力和效率。

結(jié)合新設(shè)計(jì)的Dragonfly網(wǎng)絡(luò)拓?fù)洌琱op數(shù)減少、通信延遲降低,使得傳輸效率進(jìn)一步提高;同時(shí)軟件調(diào)度網(wǎng)絡(luò)帶來了精確的流量控制和路徑規(guī)劃,從而提高了系統(tǒng)的整體性能。

圖片

Groq支持通過PyTorch、TensorFlow等標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)框架進(jìn)行推理,暫不支持模型訓(xùn)練。

此外Groq還提供了編譯平臺和本地化硬件方案,不過并未介紹更多詳情,想要了解的話需要與團(tuán)隊(duì)進(jìn)行聯(lián)系。

圖片

而在第三方網(wǎng)站上,搭載Groq芯片的加速卡售價(jià)為2萬多美元,差不多15萬人民幣。

圖片

它由知名電子元件生產(chǎn)商莫仕(molex)旗下的BittWare代工,同時(shí)該廠也為英特爾和AMD代工加速卡。

圖片

目前,Groq的官網(wǎng)正在招人。

技術(shù)崗位年薪為10萬-50萬美元,非技術(shù)崗位則為9萬-47萬美元。

圖片

“目標(biāo)是三年超過英偉達(dá)”

除此之外,這家公司還有個(gè)日常操作是叫板喊話各位大佬。

當(dāng)時(shí)GPTs商店推出之后,Groq就喊話奧特曼:用GPTs就跟深夜讀戰(zhàn)爭與和平一樣慢……陰陽怪氣直接拉滿~

圖片

馬斯克也曾被它痛斥,說“剽竊”自己的名字。

圖片

在最新討論中,他們疑似又有了新操作。

一名自稱Groq工作人員的用戶與網(wǎng)友互動(dòng)時(shí)表示,Groq的目標(biāo)是打造最快的大模型硬件,并揚(yáng)言:

三年時(shí)間內(nèi)趕超英偉達(dá)。

圖片

這下好了,黃院士的核武器有新的目標(biāo)了。

參考鏈接:
[1]https://wow.groq.com/
[2]https://news.ycombinator.com/item?id=39428880?

責(zé)任編輯:姜華 來源: 量子位
相關(guān)推薦

2024-02-20 12:30:53

AI訓(xùn)練

2024-02-21 14:08:00

AI數(shù)據(jù)

2021-08-20 15:32:14

機(jī)器人人工智能系統(tǒng)

2024-02-20 13:31:26

AI訓(xùn)練

2024-04-30 10:09:00

模型訓(xùn)練

2025-05-21 09:40:11

2023-05-26 17:15:40

AI搜索

2024-03-18 13:21:13

2024-02-22 10:09:00

開源模型

2024-10-23 09:20:00

2024-08-28 13:34:13

2025-04-10 09:43:01

2023-04-11 08:37:30

TPUAI芯片

2019-03-05 10:03:17

阿里云云廠商硬盤

2024-05-21 13:07:38

2025-06-11 08:56:54

2024-04-01 12:09:16

模型數(shù)據(jù)

2023-07-19 09:00:00

模型AI

2015-07-14 11:39:08

Docker容器DevOps虛擬機(jī)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 岛国午夜 | 国产精品一区二区无线 | 99re视频精品| 国产馆| 久久黄色网 | 日本精品国产 | 亚洲欧美一区二区三区在线 | 在线成人www免费观看视频 | 久久久精品久久 | 免费三级黄 | 亚洲精品一二区 | 亚洲精品成人网 | 亚洲高清av| 国产一级在线观看 | 久久久美女 | 日韩精品免费 | 精品少妇一区二区三区日产乱码 | 欧美成人精品二区三区99精品 | 亚洲一区二区视频在线观看 | 国产精品久久久久久高潮 | 伊人久久综合 | 中文字幕精品一区二区三区在线 | 亚洲在线一区 | 国产精品波多野结衣 | 精品免费在线 | 亚洲黄色网址视频 | 日本免费黄色一级片 | 日韩欧美视频 | 一区二区三区久久 | 国产精品国产三级国产aⅴ中文 | 中文精品视频 | 久久久国产一区二区三区四区小说 | 欧美一级淫片免费视频黄 | 午夜免费电影 | 在线观看日韩av | 久久毛片 | 天天操天天射综合 | 久久精品国产99国产精品 | 亚洲视频一 | 国产成人一区二区三区精 | 一区二区三区精品在线 |