成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI實力榜大洗牌!OpenAI谷歌強勢領跑,Anthropic節節敗退

人工智能 新聞
AI市場風起云涌!Poe最新報告揭曉:OpenAI的GPT-4o稱霸文本生成,谷歌的Gemini 2.5 Pro領跑推理,Kling在視頻領域異軍突起,企業如何在這場AI競賽中搶占先機?

最近,Poe發布了最新的使用報告,報告顯示,OpenAI和谷歌的地位越來越穩,勢頭很猛。

Anthropic就沒那么好運,有點掉隊了。

AI模型的推理能力,已經成為了各大公司競爭的關鍵戰場。

根據Poe發布的數據,2025年1月到5月這段時間,AI各個主要領域,市場份額都重新洗牌了。

主要結果如下:

  • 文本生成:GPT-4o以35.8%穩居榜首,Claude和Gemini緊隨其后。
  • 推理:Gemini-2.5.Pro以31.5%登頂,Claude、DeepSeek-R1、最近推出的o3和o4-mini榜上有名。
  • 圖像生成:Imagen3、GPT-Image-1和Flux系列三分天下。
  • 視頻生成:Runway暫列第一,Kling-2.0-Master來勢洶洶,Veo-2排名第三。
  • 智能體:o3拔得頭籌,戰勝了Anthropic的Claude和谷歌的Gemini。

圖片

截至2025年5月不同類別的AI模型排名

o3驅動的智能體拔得頭籌,Claude和Gemini緊隨其后。

圖片

文本:GPT-4o穩坐頭把交椅,新模型來勢洶洶

在文本生成這個領域,OpenAI的GPT-4o是穩穩的第一,用戶占比達到35.8%,占據主導地位。

OpenAI新出的GPT-4.1系列也不容小覷,發布沒幾周,就拿下了9.4%的份額。

谷歌的Gemini 2.5 Pro表現也不錯,剛上線不久,就有大約5%的用戶選擇它。

圖片

不過,Anthropic的Claude可就有點慘了,這段時間它的市場份額下降了10%,被OpenAI和谷歌搶走了不少用戶。

雖說現在Claude 3.7 Sonnet更受大家歡迎,取代了Claude 3.5 Sonnet,但老版本也還有12%的人在用。

還有DeepSeek,今年年初一炮而紅。后來其他公司也推出了不少價格實惠、功能又強的推理模型。

DeepSeek R1的用戶占比從2月中旬7%的最高點,下跌到4月底,只剩3%了。

推理:會解難題成了「制勝法寶」

專門用來推理的模型越來越受歡迎了。

2025年年初開始,推理模型的比例從2%一下子漲到了10%。

圖片

Nick Huber表示,這些推理模型別看還在發展初期,但解決復雜問題的能力特別強,給出的答案也更準確。那些喜歡嘗鮮的用戶發現了它的好處,就算用的時候成本高一點、花的時間長一點,他們也愿意,就為了能得到更好的結果。

在推理模型這個熱門領域,谷歌的Gemini 2.5 Pro一騎絕塵。

上線才六周,就占了31%的市場份額,把Claude那些專門做推理的模型都比下去了。

圖片

OpenAI在推理模型方面一直在創新。2025年前4個月,就推出了好多款新的推理模型,像o1-pro、o3-mini。

Poe的用戶特別愿意嘗試OpenAI的新模型,很快就從老版本換成新版本了。

還出現了一些新的混合推理模型,像Gemini 2.5 Flash Preview和Qwen 3,它們能在聊天的時候根據情況調整推理的深度。

不過目前用這些新模型的用戶還不多,只占推理模型用戶總數的1%左右。

有行業分析師就說了,現在大家都在卷推理能力,這說明AI市場在慢慢成熟。

基礎的文本生成功能已經沒什么差異化了,想脫穎而出,就得靠這種更高級的能力。

圖像:谷歌Imagen 3「攪局」

圖像生成這個領域現在也是競爭白熱化。

谷歌的Imagen 3系列模型一路逆襲,2025年市場份額從10%左右漲到了30%,已經能和黑森林實驗室的FLUX系列模型「掰掰手腕」了。

到4月下旬,FLUX系列模型的市場份額也就35%左右。

OpenAI的GPT-Image-1也不甘示弱,4月下旬剛接入API,才過了兩周,就有17%的用戶用它來生成圖像了,和它之前在ChatGPT里爆火的情況差不多。

雖然FLUX系列模型在Poe的圖像生成領域還是用的人最多,但從數據上也能看出,它的市場份額從45%掉到35%了,被谷歌和OpenAI搶了不少用戶。

以前圖像生成是Midjourney和Stable Diffusion的天下,現在谷歌、OpenAI和黑森林實驗室三足鼎立,競爭特別激烈。

現在圖像生成的質量越來越好,對用戶給的提示理解得更準,生成速度也更快,已經成為競爭最激烈的戰場之一了。

從行業數據能看出,最近這半年,企業對圖像生成技術的需求暴增。好多公司的營銷部門還有創意機構,都開始用這些技術做設計了。

視頻:黑馬Kling攪局

在視頻生成領域,中國快手實驗室新出的Kling系列模型就像一匹黑馬,直接拿下了30%左右的市場份額。

其中Kling-2.0-Master最厲害,4月底發布,才過了三周,在Poe上的使用占比就達到21%了。

圖片

谷歌的Veo2自從2月發布以來,一直保持著20%左右的份額,表現挺穩定。

但這個領域最早的開拓者Runway就沒那么幸運了,在報告期里,它的市場份額從60%大幅下降到20%。

Kling系列能這么快打開市場,說明在新興的AI領域,就算是一開始領先的公司,如果不持續進步,很快就會被新公司超越。

視頻生成特別耗性能,哪怕生成一小段視頻,也得需要很強的處理能力。所以和文本、圖像生成比起來,用視頻生成模型的人相對少一些。

不過現在技術發展快,成本在下降,視頻質量在提高,估計2025年用的人會越來越多。

現在已經有不少廣告公司、社交媒體博主還有教育平臺開始用AI生成視頻了,雖然這項技術還有些不足,但大家都看到了它的潛力。

語音:ElevenLabs稱霸,新公司另辟蹊徑

在語音領域,ElevenLabs還是穩穩的王者,報告期內,差不多80%的用戶都用它來做文本轉語音。

不過,Cartesia、Unreal Speech 這些新公司也來分蛋糕了,它們提供了很多不一樣的語音選擇,還有各種音效,價格也各有優勢。

圖片

和其他領域的競爭很分散不同,語音AI基本被ElevenLabs壟斷了。

專家分析,這是因為它進入市場早,語音庫特別豐富,而且一直都在優化,技術比其他公司厲害。

新公司也有自己的辦法,它們不跟ElevenLabs正面硬剛,而是找一些細分市場。

比如Unreal Speech就專門給播客和有聲書制作方提供服務,能模擬各種專業配音演員的聲音,還能表現出不同的情感。

Cartesia則主打多語言、帶真實口音的語音,受到很多跨國企業和教育平臺的歡迎。

隨著文本轉語音技術越來越成熟,越來越接近真人說話的水平,在客服、無障礙服務,還有內容創作這些場景用得越來越多。

語音AI對性能要求不高,用起來更方便,預計2025年這個市場還會繼續擴大。

o3智能體拔得頭籌

在一項針對AI智能體的聯網研究測試中,ChatGPT最新的o3模型戰勝了Anthropic的Claude和谷歌的Gemini。

不過話說回來,最牛的智能體和人類專家相比,還是有不小的差距。

圖片FutureSearch讓11個主流的大模型完成了總共89項實際研究任務,并對每個模型在查找原始資料來源、搜尋數據、收集證據、匯編數據以及驗證主張等能力進行了評估。

最后打分結果出來,最高分才0.51,而滿分預計是0.8。

也就是說,現在最牛的AI智能體,專業研究人員花點時間,也能輕松「碾壓」它們。

這次測評的成績單如下:

  • o3(OpenAI):0.51
  • Claude 3.7 Sonnet(Think):0.49
  • Claude 3.7 Sonnet(Std):0.48
  • Gemini 2.5 Pro:0.45
  • GPT-4.1L:0.42
  • DeepSeek-R1:0.31
  • Mistral Small:0.30
  • GPT-4 Turbo:0.27
  • Gemma 3:0.20

對比去年GPT-4 Turbo才0.27的分數,在一年時間里,優秀通才研究人員和前沿智能體之間的差距縮小了約45%。

此外,像DeepSeek這樣價格便宜的智能體,與來自OpenAI的付費高端產品相比,差距并不大。

OpenAI的o3暫時領跑,Claude和Gemini緊跟其后。

目前看來,閉源模型在搞研究這塊更有優勢,但開源模型也在瘋狂上分。

不過智能體的「短板」也很明顯。

跟人類研究員相比,它們在戰略規劃、全面性、評估資料來源質量等方面更遜一籌,還特別容易忘事,任務做到一半就把之前查到的東西拋腦后了。

更要命的是,好多AI都有「擺爛」傾向,找到差不多能用的答案就收手,不愿意再深挖找更好的。

ChatGPT的o3能拿第一,就是因為它更較真,驗證答案特別仔細,也不會輕易放過更好的解決方案。

照這趨勢,說不定過不了幾年AI就能反超人類研究員了。

不過最近,ChatGPT新版本還因為太過諂媚被吐槽過。AI要想穩定變強,還有很長的路要走。

現在AI智能體給出的結果,還是得自己再檢查一遍,可別偷懶直接抄作業!

企業如何應對快速變化的AI市場?

AI市場變得這么快,對那些想用AI的企業來說,既是機會也是挑戰。

已經在大規模用AI的企業,要建立一套靠譜的評估體系,別只盯著一家供應商。因為說不定這個月最好用的模型,下個月就不是了。

推理能力越來越重要,以前可能更看重速度和成本,現在大家更關注處理復雜任務時準不準、靠不靠譜。

現在前沿的AI公司不停地推出更厲害的模型,企業很糾結:到底是選定一個平臺長期用,還是保持靈活性?

很多企業的AI負責人都選擇兩手抓,不同的任務用不同的模型,一旦有更好的技術出現,馬上就能切換。

從報告里能看出,現在圖像、視頻、音頻這些多媒體相關的AI能力競爭也很激烈。

以后可能得更注重發展一個全面、平衡的AI生態系統,圖像、視頻、音頻生成和文本生成等都很重要。

對企業來說,如果想在AI浪潮里站穩腳跟,最好根據自己的實際需求去挑選AI模型,別盲目追新。

同時,企業也要搭建好技術框架,這樣一旦有更好的技術出現,就能馬上用起來。

那些只守著過去的AI明星產品的公司,說不定很快就會被市場淘汰。


責任編輯:張燕妮 來源: 新智元
相關推薦

2010-01-15 10:26:06

微軟Linux手機操作系統

2022-06-27 09:54:38

編程語言JavaC++

2024-06-13 17:34:52

2025-04-23 09:55:37

2025-06-25 13:46:16

OpenAIAI谷歌

2024-11-14 14:20:00

生成式AI數據

2025-05-23 09:05:00

2012-07-03 09:25:35

2025-04-10 10:41:36

2023-11-21 07:56:23

2015-01-09 11:24:30

2013-09-16 10:39:57

智能AndroidiPhone

2023-10-28 09:59:30

2025-01-09 09:00:00

訓練數據AI

2017-10-17 09:47:01

2025-02-27 10:33:36

2023-10-19 08:30:56

模型搜索

2024-03-05 11:17:40

AI模型

2023-10-20 10:13:52

2025-04-07 09:10:00

谷歌AI模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产亚洲一级 | 日本亚洲一区 | 国产一区二区三区 | 免费成人午夜 | 久久久久久亚洲国产精品 | 亚洲欧美国产一区二区三区 | 国产精品美女一区二区 | 久久久久久成人 | 99亚洲精品 | 亚洲高清成人 | 亚洲福利 | 欧美日韩三级在线观看 | 欧美影院 | 免费亚洲网站 | 国产a视频 | 播放一级黄色片 | 国产真实乱全部视频 | 男人天堂999 | 在线观看国产 | 一级毛片在线看 | 国产精品国产三级国产aⅴ原创 | 亚洲 中文 欧美 日韩 在线观看 | 国产精品伦理一区二区三区 | 国产精品高潮呻吟久久av黑人 | 青青草视频免费观看 | 成人在线视频免费观看 | 亚洲视频一区在线观看 | 一区二区三区亚洲精品国 | 中文字幕国 | 成人福利网 | 午夜成人在线视频 | 国产精品一区二区久久久久 | 成人毛片在线视频 | 中文字幕免费视频 | 精品99爱视频在线观看 | www.99re| 美女久久视频 | 中文字幕第7页 | 国产亚洲精品久久久久动 | 三级黄色大片网站 | 日韩国产欧美一区 |