成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸;一手實測R1熱門問題,各有千秋!

原創 精選
人工智能
剛剛,它的預覽版正式發布和上線體驗——就是這個QwQ-Max-Preview!一眼看去,我愿稱之為最萌的推理模型,看blog主頁的名稱,感覺思維鏈中的模型正在很努力的思考中……

編輯 | 伊風

出品 | 51CTO技術棧(微信號:blog51cto)

吳泳銘親自預告過的,阿里旗艦推理模型,新消息來了。

剛剛,它的預覽版正式發布和上線體驗——就是這個QwQ-Max-Preview!

一眼看去,我愿稱之為最萌的推理模型,看blog主頁的名稱,感覺思維鏈中的模型正在很努力的思考中……

圖片圖片

Qwen Chat 中已經可以體驗預覽版模型:https://chat.qwen.ai/

點進模型的blog,發現這里有一個隱藏彩蛋,內容是由QwQ-Max-Preview自己寫的,我們可以看到AI做自我介紹時的思維鏈:

首先,該模型屬于 Qwen 系列,是基于 Qwen2.5-Max 構建的。這是一個 預覽版,所以他們可能希望強調它是在正式發布前的 搶先體驗。它的主要優勢包括 深度推理、數學、編程、通用領域任務,以及在 Agent 相關任務 中的出色表現。他們還提到了 未來的更新 以及 計劃以 Apache 2.0 許可證開源。

圖片圖片

blog地址:https://qwenlm.github.io/blog/qwq-max-preview/

預覽版已經來了,QwQ-Max正式版還會遠嗎?我們先來看一波預覽版的搶先體驗夠不夠精彩:

官方給的栗子1:編寫一個腳本,在一個球體內模擬 100 個彈跳的黃色小球,確保正確處理碰撞檢測。讓球體緩慢旋轉,并確保小球始終保持在球體內部。

效果已經很驚艷,如果要挑刺的話,那就是有幾個小球的運動速度略顯奇怪:

官方給的栗子2:做個俄羅斯方塊 和 2048 結合的游戲。(PS:Grok 3發布時也測了一個類似的例子,是把俄羅斯方塊和寶石迷陣相結合的。)

你別說,看上去還挺好玩,就是感覺難度有一點點大:

此外,QwQ-Max-Preview 將配備多種Agent,例如推理生圖、火車票查找、代碼解釋器等等。

看這幾個Agent的細分程度,盲猜QwQ-Max在Agent會有很大的動作,而且下圖中的Tools工具似乎可以在一次詢問中多選,讓人對正式版的使用效果期待拉滿了。

圖片圖片

官方也給了一個推理畫圖的例子,還順便畫了個淘寶二維碼。掃了一下果然就跳轉成功了:

1.一手實測:QwQ-Max-Preview回答R1熱門問題,是否各有千秋?

到實測這個Part,小編覺得如果還是測一把“草莓”和“9.9>9.11”,就有點太無聊了。

畢竟DeepSeek R1之所以如此出圈,不是因為能答對這幾個案例,而是真的能幫助用戶解決生活中的問題,甚至解答人生中的困惑。

上圖:雖說如此,但還是測了這個案例,QwQ-Max-Preview輕松通關上圖:雖說如此,但還是測了這個案例,QwQ-Max-Preview輕松通關

然后在小紅書看看,用戶都在使用DeepSeek R1問些什么吧。

我們就以有1w+筆記的“如何當父母才不累”,以及第二名“普通人如何利用信息差搞錢”這兩個問題來橫向比較下兩個推理模型吧。

圖片圖片

使用如何“如何當父母才不累”這個話題進行實測,QwQ-Max-Preview能夠分析用戶的具體情況、深層需求,并提供實用建議,進行了完整的思考。

圖片圖片

兩個模型在輸出的內容上大概方向一致,QwQ-Max-Preview更注重提供建議。此外,R1在思維鏈中特別指出要“保持口語化”,提供的答案更有“情緒”一些也相對詳細。

上圖:兩個模型都提到了“接受不完美”上圖:兩個模型都提到了“接受不完美”

而在第二個問題上,QwQ-Max-Preview同樣能完成接地氣、具有邏輯的思考。同時千問還不忘和自家的產品“夢幻聯動”一把,提供了“拼多多進貨,批量采購后在淘寶加價賣出”“閑魚搜索‘倒閉庫存’”等建議。

圖片圖片

在這個回答上,R1做的稍微好的一點是區分了“低門檻起步方式”“進階變現模式”等層次,看起來更有操作性。

當然,QwQ-Max-Preview畢竟只是預覽版,從實測體驗上,其回答問題更加流暢絲滑。不會像R1那樣需要等待才開始思考,也不會提心吊膽會彈出“服務器繁忙”。

對了,千問團隊今天宣布,QwQ-Max也是要做APP的(推特消息是面向海外用戶的,不知道國內是更新通義上,還是也單做APP ?)。期待正式版的QwQ-Max,能在輸出問題的格式和口語化方面繼續進步,繼續締造AI應用的傳奇!

圖片圖片

2.旗艦推理模型的基座——Qwen2.5-Max

這里在幫朋友們回顧下QwQ-Max-Preview的基座,Qwen2.5-Max。

Qwen2.5-Max在除夕夜發布,是阿里家的超大規模MoE模型,采用超過20萬億tokens的預訓練數據。

該模型在多個基準測試中超越DeepSeek V3、GPT-4o等領先AI,支持指令模型和基座模型。

也就是說QwQ-Max的推理模型,其基座是強于DeepSeek R1的基座V3的。

另外,今天推出的預覽版并非阿里首個推理模型。

去年通義就有了QwQ系列,不過是一個32B小模型的預覽版。

https://huggingface.co/Qwen/QwQ-32B-Preview

圖片圖片

3.寫在最后

這周的大模型更新已經到了神仙打架的級別了。

從預覽版來看,QwQ-Max正式版絕對值得一看,尤其是正式版后開放的Agent功能,期待能給智能體的市場帶來一些顛覆性的創新。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://m.ekrvqnd.cn/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2016-11-09 15:18:04

大數據數據市場

2025-03-06 09:55:49

2013-08-22 10:03:38

谷歌Facebook數據挖掘

2010-06-09 12:26:46

世界杯布線

2013-12-26 09:53:46

全閃存陣列全閃存存儲

2011-11-10 09:48:49

2014-11-28 14:55:57

WiFi藍牙

2010-07-05 09:12:39

戴爾服務器新品

2010-08-03 09:48:42

PythonRuby

2025-03-06 17:29:21

2012-07-18 09:44:56

2015-06-25 18:58:36

Win10

2025-03-06 10:14:39

2017-09-19 13:12:38

5G電信移動

2015-07-14 09:16:57

Windows 10ISO

2016-01-06 19:38:25

2019-05-22 15:55:41

NginxTomcat服務器

2025-03-28 11:06:10

視覺推理模型阿里通義千問AI

2023-04-22 09:56:28

博睿數據運維

2025-01-21 11:53:53

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲午夜视频 | 国产探花在线精品一区二区 | 精品蜜桃一区二区三区 | 欧美精品一二三区 | 亚洲免费大片 | 一级欧美一级日韩片 | 在线免费观看黄a | 视频一区二区在线 | 国产日韩欧美精品一区二区 | www.日韩| 国产农村妇女毛片精品久久麻豆 | 黄片毛片免费观看 | 一二三四在线视频观看社区 | 日本黄色高清视频 | 日韩亚洲一区二区 | 免费精品| 免费黄色av | 日韩精品在线看 | 欧美精品啪啪 | 欧美激情在线播放 | 狠狠久| 午夜日韩视频 | 日本成人在线免费视频 | 黄色片在线观看网址 | 蜜桃传媒av| 这里只有精品999 | 久久国内精品 | 国产福利资源在线 | 亚洲顶级毛片 | 日韩国产中文字幕 | 日本高清中文字幕 | 午夜影视大全 | 欧美一区二区三区在线看 | 91麻豆精品国产91久久久久久 | 久久机热 | 亚洲国产成人精品女人久久久 | 国产黄色在线 | av网站免费观看 | 黄色一级大片在线免费看产 | 国产精品免费视频一区 | 精品久久久久久久久久久久 |