成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Mistral AI兩連發:7B數學推理專用、Mamba2架構代碼大模型

人工智能 新聞
網友很好奇,Mathstral能不能搞定「9.11和9.9誰大」這一問題。

昨天,AI圈竟然被「9.11和9.9誰大」這樣簡單的問題攻陷了,包括OpenAI GPT-4o、Google Gemini等在內的大語言模型都翻了車。

圖片

圖片

這讓我們看到,大語言模型在處理一些數字問題時并不能像人類那樣理解并給出正確的答案。

對于數字以及復雜的數學問題,專用模型更術業有專攻。

今天,法國大模型獨角獸 Mistral AI 發布了一個專注于數學推理和科學發現的7B大模型「Mathstral」,來解決需要復雜、多步驟邏輯推理的高級數學問題。

該模型基于 Mistral 7B 構建,支持的上下文窗口長度為32k,遵循的開源協議為Apache 2.0 license。

Mathstral在構建時追求出色的性能與速度權衡,這是 Mistral AI積極推廣的一種開發理念,尤其是微調功能。

圖片

同時,Mathstral是一個指令型模型,可以使用它或者對它進行微調。模型權重已經放在了HuggingFace上。

  • 模型權重:https://huggingface.co/mistralai/mathstral-7B-v0.1

下圖為 Mathstral 7B和Mistral 7B之間的MMLU性能差異(按學科劃分)。

Mathstral在各種行業標準基準上都達到其規模范圍內的 SOTA 推理性能。尤其是在MATH數據集上,它取得了 56.6%的通過率,在MMLU上取得了63.47%的通過率。

圖片

同時,Mathstral在MATH上的通過率(56.6%)比 Minerva 540B 高出 20% 以上。此外,Mathstral 在MATH 上以多數投票@64的成績得分為68.4%,使用獎勵模型的成績為 74.6%。

圖片

這一成績也讓網友好奇,Mathstral能不能搞定「9.11和9.9誰大」這一問題。

圖片

代碼大模型:Codestral Mamba

圖片

  • 模型權重:https://huggingface.co/mistralai/mamba-codestral-7B-v0.1

與Mathstral 7B一同發布的,還有一款專門用于代碼生成的Codestral Mamba模型,使用的是Mamba2架構,同樣遵循Apache 2.0 license開源協議。這是一個指導模型,有70多億參數,研究者可以免費使用、修改和分發。

值得一提的是,Codestral Mamba是在Mamba作者Albert Gu、Tri Dao幫助下設計完成的。

一直以來,Transformer 架構撐起了AI領域的半壁江山,然而,與 Transformer 不同的是,Mamba 模型具有線性時間推理優勢,并且理論上能夠對無限長度的序列進行建模。該架構允許用戶廣泛地與模型互動,并且響應迅速,而不受輸入長度的限制。這種效率對于代碼生成尤其重要 。

在基準測試中,Codestral Mamba 在 HumanEval 測試中的表現優于競爭對手開源模型 CodeLlama 7B、CodeGemma-1.17B 和 DeepSeek。 

圖片

Mistral 測試了該模型,該模型可以在 Mistral 的 la Plateforme API 上免費使用,可處理多達 256,000 個token的輸入——是 OpenAI 的 GPT-4o 的兩倍。

隨著Codestral Mamba發布,就有網友在 VSCode中用起來了,很是絲滑。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-07-17 16:12:22

2024-07-17 13:40:01

2024-03-04 08:20:00

谷歌架構AI

2024-03-25 08:00:00

2024-10-23 09:30:00

2024-09-13 09:14:32

2024-06-03 10:43:34

2024-07-22 09:00:00

2024-02-04 08:00:00

Zephyr 7B大語言模型算法

2025-03-20 08:34:14

2024-08-13 12:49:29

2024-06-11 14:30:18

2024-03-25 00:05:00

開源模型AI

2025-04-03 09:23:08

大模型強化學習開源

2024-04-02 09:17:50

AI數據開源

2024-05-09 08:33:33

2024-09-05 14:25:00

訓練代碼

2023-10-13 19:58:33

Mistral7B模型

2024-06-04 14:06:00

2024-02-07 12:39:00

AI數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产一级视频免费播放 | 欧美视频成人 | 日韩在线综合 | 国产一区精品 | 精品一区电影 | 日日日操 | 久久精品免费观看 | 涩涩导航| 99riav3国产精品视频 | 国产欧美日韩一区 | 在线观看成人 | 日本一区二区高清不卡 | 精品欧美一区二区三区久久久小说 | 日韩精品一区二区三区四区 | 亚洲精品视频一区二区三区 | 色综合天天网 | 中文字幕在线精品 | 久久av一区二区三区 | 1000部精品久久久久久久久 | 欧美激情精品久久久久久 | 日韩成人专区 | 日韩1区2区 | 在线91| 日韩欧美精品在线 | 91久久久精品国产一区二区蜜臀 | 依人成人 | 精品久久香蕉国产线看观看亚洲 | 日韩欧美二区 | 亚洲国产一区二区三区在线观看 | 中文字幕电影在线观看 | 国产91久久久久久久免费 | 国产激情视频网 | 国产精品久久精品 | 日韩在线视频免费观看 | 中文字幕成人 | 日本一区二区不卡视频 | 成人精品在线观看 | 欧美精品在线播放 | 草草草久久久 | 国产精品色哟哟网站 | 国产精品高潮呻吟久久 |