成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

馬斯克突發Grok 1.5!上下文長度至128k、HumanEval得分超GPT-4

人工智能
新版本Grok有啥突破?一是上下文長度飆升,從8192增長到128k,和GPT-4齊平。二是推理性能大幅提升,數學能力直接漲點50%之多、HumanEval數據集上得分超過GPT-4。

就在剛剛,馬斯克Grok大模型宣布重大升級。

難怪之前突然開源了Grok-1,因為他有更強的Grok-1.5了,主打推理能力。

來自xAI的官方推送啥也沒說,直接甩鏈接。主打一個“字少事大”

圖片圖片

新版本Grok有啥突破?

一是上下文長度飆升,從8192增長到128k,和GPT-4齊平。

二是推理性能大幅提升,數學能力直接漲點50%之多、HumanEval數據集上得分超過GPT-4。

消息一出,評論區立刻就躁起來了。

圖片圖片

具體跑分結果如何,咱們立馬來看。

Grok-1.5來了

首先,對于上下文窗口。

這次是一把直接提升到之前的16倍,來到128k量級。

這也就意味著Grok可以處理更長和更復雜的提示,同時保持其遵循指令的能力。

在“大海撈針”(NIAH)測試中,Grok-1.5在128K token的上下文中完美檢索嵌入的文本。

整個圖一水兒的藍色(100%的檢索深度):

圖片圖片

其次,推理方面。

Grok-1.5處理編程和數學相關任務的能力大幅提升,全面超越Grok-1、Mistral Large、Claude 2。

數學方面,Grok-1.5在MATH基準測試上得分50.6%,超越中杯Claude 3 Sonnet;GSM8K上得分90%。

編程方面,Grok-1.5在HumanEval基準測試上得分74.1%,超越中杯Claude 3 Sonnet、Gemini Pro1.5、GPT-4,僅次于大杯Claude 3 Opus。

圖片圖片

看起來,Grok這次的實力也是不可小覷。

Grok系列與其他大模型相比還有一個特色,不使用通用的Python語言+Pytorch框架。

據官方介紹,Grok 1.5采用分布式訓練架構,使用Rust、JAX+Kubernetes構建。

為了提高訓練可靠性和維持正常運行時間,團隊提出了自定義訓練協調器,可自動檢測到有問題的節點,然后剔除。

除此之外,他們還優化了checkpointing、數據加載和訓練重啟等流程,最大限度地減少故障停機時間。

這,才速速有了現在的Grok 1.5~

更多信息官方也暫時還沒有披露。

可以確定的是,新版本未來幾天會先推送給早期測試者。并按照“老規矩”,很快將在??平臺上線。

網友們表示:Grok進步真的相當迅速。

圖片圖片

不提別的,Grok新版本各指標已經全面超越Claude 2。而xAI成立僅一年,只比Anthropic落后9個月。因此:

打賭12個月后,xAI完全有可能成為領導者。

圖片圖片

還有人評價更高,認為馬斯克這是發了另一個“GPT-4等效模型”,喊著:

OpenAI搞快點啊。

圖片圖片

你期待新版本的Grok嗎?

參考鏈接:[1]https://twitter.com/xai/status/1773510159740063860[2]https://x.ai/blog/grok-1.5

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-03-29 12:48:00

數據訓練

2024-03-29 14:04:00

模型訓練

2024-04-01 13:06:52

Grok-1.5GPT-4人工智能

2023-11-17 18:06:15

2023-12-06 13:59:00

數據訓練

2025-06-11 04:25:00

上下文窗口系統

2023-08-27 14:44:04

代碼編程語言

2024-09-02 08:30:00

大模型AI

2023-11-13 08:03:33

2023-05-19 10:16:27

AIGPT-4

2024-04-10 14:07:00

數據AI

2023-03-20 13:30:00

GPT-4AI

2023-03-29 13:58:08

GPT-4AI 開發

2023-11-07 08:03:43

AIGPT-4

2024-04-12 17:41:28

GPT-4TurboClaude

2025-03-05 08:50:00

模型AI數據

2025-06-30 01:00:00

2023-12-13 08:46:33

人工智能ChatGPT機器人

2024-02-29 12:49:37

2023-08-14 08:04:13

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美精品福利 | 亚洲色欧美另类 | 涩涩视频在线观看 | 国产日产精品一区二区三区四区 | 国产精品国产成人国产三级 | 欧美高清视频 | 免费一区二区三区 | 成人亚洲一区 | 男人的天堂在线视频 | 午夜一区 | 99久久日韩精品免费热麻豆美女 | 欧美三级视频在线观看 | 久久久九九 | 视频在线亚洲 | 日韩免费一区二区 | 国产成人精品一区二 | 亚洲电影一区 | 成人免费黄色 | 久久精品国产一区二区电影 | 狠狠色综合网站久久久久久久 | 久久亚洲一区二区三区四区 | 亚洲国产成人精品久久 | 精品视频久久久久久 | 久久不射网 | 日韩欧美一区二区三区免费观看 | 91亚洲国产成人久久精品网站 | 国产日韩欧美精品 | 日本不卡视频在线播放 | 国产在线精品一区二区 | 欧美a v在线 | 黑人巨大精品欧美一区二区免费 | 成人午夜网站 | 国产伊人久久久 | 精品久久久久久久久久久久久 | 久久伊人一区二区 | 国产一区二区三区精品久久久 | 一区二区三区国产 | 国产97碰免费视频 | 欧美精品在线一区二区三区 | 人人干天天干 | 亚洲精品视频在线 |