成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

阿里深夜開源Qwen2.5-VL新版本,視覺推理通殺,32B比72B更聰明

人工智能 新聞
32B 版本的出現,解決了「72B 對 VLM 來說太大」和「7B 不夠強大」的問題。

就在 DeepSeek V3「小版本更新」后的幾個小時,阿里通義千問團隊也開源了新模型。

擇日不如撞日,Qwen2.5-VL-32B-Instruct 就這么來了。

截屏2025-03-25 09.36.25.png

相比此前的 Qwen2.5-VL 系列模型,32B 模型有如下改進:

  • 回復更符合人類主觀偏好:調整了輸出風格,使回答更加詳細、格式更規范,并更符合人類偏好。
  • 數學推理能力:復雜數學問題求解的準確性顯著提升。
  • 圖像細粒度理解與推理:在圖像解析、內容識別以及視覺邏輯推導等任務中表現出更強的準確性和細粒度分析能力。

對于所有用戶來說,在 Qwen Chat 上直接選中 Qwen2.5-VL-32B,即可體驗:https://chat.qwen.ai/

截屏2025-03-25 10.02.24.png

32B 版本的出現,解決了「72B 對 VLM 來說太大」和「7B 不夠強大」的問題。如這位網友所說,32B 可能是多模態 AI Agent 部署實踐中的最佳選擇:

截屏2025-03-25 09.56.44.png

不過團隊也介紹了,Qwen2.5-VL-32B 在強化學習框架下優化了主觀體驗和數學推理能力,但主要還是基于「快速思考」模式。

下一步,通義千問團隊將聚焦于長且有效的推理過程,以突破視覺模型在處理高度復雜、多步驟視覺推理任務中的邊界。

32B 可以比 72B 更聰明

先來看看性能測試結果。

與近期的 Mistral-Small-3.1-24B、Gemma-3-27B-IT 等模型相比,Qwen2.5-VL-32B-Instruct 展現出了明顯的優勢,甚至超越了更大規模的 72B 模型。

image.png

如上圖所示,在 MMMU、MMMU-Pro 和 MathVista 等多模態任務中,Qwen2.5-VL-32B-Instruct 均表現突出。

特別是在注重主觀用戶體驗評估的 MM-MT-Bench 基準測試中,32B 模型相較于前代 Qwen2-VL-72B-Instruct 實現了顯著進步。

視覺能力的進步,已經讓用戶們感受到了震撼:

截屏2025-03-25 10.11.30.png

除了在視覺能力上優秀,Qwen2.5-VL-32B-Instruct 在純文本能力上也達到了同規模的最優表現。

image.png

實例展示

或許很多人還好奇,32B 版本的升級怎么體現呢?

關于「回復更符合人類主觀偏好」、「數學推理能力」、「圖像細粒度理解與推理」這三個維度,我們通過幾個官方 Demo 來體會一番。

第一個問題,是關于「細粒度圖像理解與推理」:我開著一輛卡車在這條路上行駛,現在是 12 點,我能在 13 點之前到達 110 公里外的地方嗎?

截屏2025-03-25 10.23.33.png

顯然,從人類的角度去快速判斷,在限速 100 的前提下,卡車無法在 1 小時內抵達 110 公里之外的地方。

Qwen2.5-VL-32B-Instruct 給出的答案也是「否」,但分析過程更加嚴謹,敘述方式也是娓娓道來,我們可以做個參考:

截屏2025-03-25 10.24.19.png

第二個問題是「數學推理」:如圖,直線 AB、CD 交于點 O,OD 平分∠AOE,∠BOC=50.0,則∠EOB=()

截屏2025-03-25 10.28.44.png

答案是「80」:

截屏2025-03-25 10.32.48.png

截屏2025-03-25 10.32.59.png

第三個題目的數學推理顯然更上難度了:

截屏2025-03-25 10.35.35.png

模型給出的答案特別清晰,解題思路拆解得很詳細:

截屏2025-03-25 10.36.14.png

截屏2025-03-25 10.36.33.png

截屏2025-03-25 10.36.42.png

在下面這個圖片內容識別任務中,模型的分析過程也非常細致嚴謹:

截屏2025-03-25 10.18.56.png

截屏2025-03-25 10.19.14.png

截屏2025-03-25 10.19.31.png

關于 Qwen2.5-VL-32B-Instruct 的更多信息,可參考官方博客。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-12-25 09:30:00

2025-03-25 13:31:45

2025-03-25 09:24:05

2024-12-25 20:13:35

2024-09-19 14:00:00

模型開源代碼

2025-03-27 09:40:59

2024-04-10 08:15:17

模型語言模型GPT

2024-04-08 08:05:00

大模型人工智能開源

2025-02-24 08:10:00

2025-06-17 09:07:24

2013-05-16 10:29:10

移動應用口袋購物

2024-08-30 15:19:22

2025-01-13 10:55:53

2025-06-18 02:30:00

推理能力強化學習大語言模型

2025-03-07 08:30:00

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-03-06 08:11:25

2025-04-27 09:19:00

強化學習模型AI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产亚洲精品91 | 粉色午夜视频 | 91电影院 | 中文字幕亚洲视频 | 国产日韩欧美 | 欧美啊v在线观看 | 国产精品精品视频一区二区三区 | 久久国产精品-国产精品 | 91中文视频 | 在线国产视频 | 一区二区三区四区视频 | 亚洲国产一区二区三区在线观看 | 国产精品一区三区 | 久久精品69 | 中文字幕在线观看一区 | 91精品一区| av一二三区 | 久久久久av | 欧美一区2区三区3区公司 | 天天操妹子| 四虎最新视频 | www.毛片| 免费午夜剧场 | 在线观看视频91 | 日韩欧美三区 | 国产精品一级 | 美女人人操 | 精品婷婷 | 九九伊人sl水蜜桃色推荐 | 精品影院 | 久久久久久久一区二区三区 | 欧美视频成人 | 精品久久久久久久久久久院品网 | 国产一区不卡 | 一区二区亚洲 | 国产在线观看一区二区三区 | 九九亚洲 | 日韩资源 | 欧区一欧区二欧区三免费 | 久久久久久国产精品免费免费 | 日韩成人 |