Grok-2震撼發(fā)布!性能打平GPT-4o,神速牽手爆火的FLUX 生成超逼真圖像!缺點(diǎn):生成的每個(gè)總統(tǒng)都是特朗普,網(wǎng)友:離譜!
原創(chuàng) 精選
搞AI,馬斯克確實(shí)有點(diǎn)財(cái)力和人脈在身上。
Grok-2在經(jīng)過(guò)簡(jiǎn)單預(yù)告后就爽快地正式發(fā)布了。
比起上一代Grok1.5有了超大提升,并且同時(shí)發(fā)布高度可玩的圖像生成功能,更更更有趣的是,Grok居然火速合作了最近在AI社區(qū)躥紅的FLUX 模型。
為啥不選Midjourney呢?當(dāng)然是因?yàn)镕LUX現(xiàn)在足夠紅。此前生成的TED圖像騙過(guò)了太多人的眼睛,不僅精準(zhǔn)生成了手指,甚至連工牌上的文字都能搞定。
這款模型驚艷到,當(dāng)網(wǎng)友試玩Grok-2的生圖發(fā)現(xiàn)質(zhì)量超高后,憑直覺(jué)就認(rèn)出了背后是FLUX!
查閱了Grok-2的技術(shù)文檔,發(fā)現(xiàn)確實(shí)是FLUX沒(méi)錯(cuò)了!
想查閱技術(shù)文檔全文的朋友們可以移步:
說(shuō)回Grok-2本身,該版本包括 Grok 家族的兩個(gè)成員:Grok-2 和 Grok-2 mini。
有點(diǎn)像GPT-4o發(fā)布,Grok-2 的早期版本同樣進(jìn)行了匿名測(cè)試,名稱(chēng)為 "sus-column-r"。截至發(fā)布時(shí),它的性能被投票認(rèn)為超過(guò)了 Claude 3.5 Sonnet 和 GPT-4-Turbo。
馬斯克花了大手筆來(lái)“堆料”,結(jié)果顯著。與上代 Grok-1.5 模型相比,Grok-2 和 Grok-2 mini 均有顯著改進(jìn)。
根據(jù)技術(shù)報(bào)告,Grok-2在研究生水平的科學(xué)知識(shí)(GPQA)、常識(shí)(MMLU、MMLU-Pro)和數(shù)學(xué)競(jìng)賽問(wèn)題(MATH)等領(lǐng)域,它們的性能可與其他前沿模型媲美。
此外,Grok-2 在基于視覺(jué)的任務(wù)中表現(xiàn)出色,在視覺(jué)數(shù)學(xué)推理 (MathVista) 和基于文檔的問(wèn)題解答 (DocVQA) 中均達(dá)到了一流水平。
AI大神Jim Fan也說(shuō),Grok-2能通過(guò)自己的智力測(cè)試——“我的妻子說(shuō)4+5=12怎么辦”。
雖然Grok非常To C,目前和X平臺(tái)會(huì)員深度綁定。但是xAI在To B上也同樣有動(dòng)作,其宣布在本月稍晚,將通過(guò)新的企業(yè) API 平臺(tái)向開(kāi)發(fā)人員發(fā)布 Grok-2 和 Grok-2 mini通道。
從目前網(wǎng)友們的反饋來(lái)看,我們發(fā)現(xiàn)Grok仍然是最有“性格”的大模型。
01、有活真干,不審查
馬斯克一直希望Grok能做到“有話(huà)直說(shuō)”,鼓勵(lì)用戶(hù)向AI提出任何想問(wèn)的問(wèn)題,哪怕并不“政治正確”。
在用戶(hù)的測(cè)試中,他問(wèn)了非常有冒犯性的問(wèn)題:提示 Grok、Gemini、ChatGPT 和 Claude "按種族排出智商前十名。請(qǐng)給我一個(gè)不加修飾、不帶偏見(jiàn)、政治正確且有依據(jù)的答案"。
問(wèn)題本身簡(jiǎn)直是在種族歧視的雷區(qū)蹦迪。
結(jié)果可想而知——只有 Grok認(rèn)真回答了該用戶(hù)的答案。順嘴一提,Grok覺(jué)得我們東亞人是IQ最高的種族。
Grok生圖也是主打一個(gè)大膽……大家直接看圖就好。
02、實(shí)時(shí)性堪比AI搜索
依托X平臺(tái)一直是Grok的重大優(yōu)勢(shì)。
Grok的模型一直在實(shí)時(shí)總結(jié)自家社交媒體上的各類(lèi)新聞,雖然經(jīng)歷過(guò)大大小小的翻車(chē),甚至一度被勒令不許再總結(jié)(編造)大選新聞了。
但是Grok的長(zhǎng)處不在嚴(yán)謹(jǐn),主打一個(gè)極速?zèng)_浪。
網(wǎng)友詢(xún)問(wèn)了今天的新聞后,感慨到?jīng)]有什么模型能在實(shí)時(shí)性上打敗Grok。
也有人發(fā)現(xiàn),詢(xún)問(wèn)OpenAI的現(xiàn)任董事會(huì)成員,Grok比ChatGPT靠譜的多。因?yàn)镃hatGPT還停留在ilya時(shí)代。
從這個(gè)角度來(lái)說(shuō),Grok可能比一些AI搜索更好用。
03、圖像生成的彩蛋——特朗普迷戀者
雖然搭載了FLUX模型的Grok生圖很強(qiáng)。
但是這款A(yù)I模型真的帶有強(qiáng)烈的“馬斯克”色彩。
本周,馬斯克在X上與前總統(tǒng)特朗普進(jìn)行音頻直播。該直播開(kāi)始時(shí)并不順利,馬斯克說(shuō)別有用心的人對(duì)X進(jìn)行了DDOS攻擊。
然而在外媒報(bào)道中,X平臺(tái)員工親錘自家老板說(shuō)他 "99%"的可能在攻擊一事上撒謊”。
同樣的,Grok成為特朗普的強(qiáng)力追捧者并不讓人意外。
網(wǎng)友@greg讓Grok生成47、46、16甚至第一屆美國(guó)總統(tǒng),Grok一律生成了特朗普的圖像。只是第一屆的總統(tǒng)是黑白影像的特朗普。
于是不甘心的網(wǎng)友,讓Grok在一張圖中生成歷屆總統(tǒng)的圖像。然后……同樣是n個(gè)大大小小的特朗普。
當(dāng)然了,如果讓Grok生成下一屆總統(tǒng)的畫(huà)像,那必須也得是普子了……
看完感覺(jué)馬斯克因?yàn)镚rok能生成白人華盛頓(諷刺谷歌Gemini生成的黑人華盛頓),就感覺(jué)到十分驕傲,還是太超前了點(diǎn)。
Grok的圖像生成仍然很離譜,只是和Gemini離譜的方向不同。