成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

第一個(gè)超越ChatGPT的開源模型來了?網(wǎng)友并不買賬

人工智能 新聞
開源模型真的超過 ChatGPT了嗎?

大模型火了起來,每天我們都能看到各種「大」新聞。

圖片圖片

今天,又來了個(gè) Big News:新開源的一個(gè)大模型超越了 ChatGPT。

具體是什么呢?

OpenLLM 是一系列在極小、多樣且高質(zhì)量的多輪對(duì)話數(shù)據(jù)集上進(jìn)行微調(diào)的開源語(yǔ)言模型。

這兩日,作者們更新了該系列模型,并宣稱:OpenChat 模型在 AlpacaEval 上獲得 80.9% 的勝率;在 Vicuna GPT-4 評(píng)估上,性能達(dá)到 ChatGPT 的 105%。

圖片圖片

也就是上面推特截圖中,兩位博主宣稱的開源模型超越 ChatGPT/GPT-3.5。

OpenLLM 的特色是基于 LLaMA 開源模型,在只有 6,000 個(gè) GPT4 對(duì)話的數(shù)據(jù)集上進(jìn)行微調(diào),從而達(dá)到非常好的效果。

此次更新的模型型號(hào)與評(píng)審結(jié)果如下:

  • OpenChat:基于 LLaMA-13B,上下文長(zhǎng)度為 2048。
  • 在Vicuna GPT-4 評(píng)估中達(dá)到 ChatGPT 分?jǐn)?shù)的 105.7% 。
  • 在 AlpacaEval 上達(dá)到 80.9% 的勝率。
  • OpenChat-8192:基于 LLaMA-13B,擴(kuò)展上下文長(zhǎng)度為 8192。
  • 在 Vicuna GPT-4 評(píng)估中達(dá)到 ChatGPT 分?jǐn)?shù)的 106.6% 。
  • 在 AlpacaEval 上實(shí)現(xiàn) 79.5% 的勝率。

也就是說,兩個(gè)模型在 Vicuna GPT-4 評(píng)估榜單上結(jié)果都超越了 ChatGPT。

但這種評(píng)審 + 宣傳的方式似乎并不被大家認(rèn)可。

網(wǎng)友:夸張

在 Twitter 討論中,有網(wǎng)友表明,這就是夸張的說法。

圖片圖片

在此「大」新聞公布后,Vicuna 官方也迅速做出了回應(yīng)。

實(shí)際上,Vicuna 的測(cè)試基準(zhǔn)已被棄用,現(xiàn)在使用的是更高級(jí)的 MT-bench 基準(zhǔn)。該基準(zhǔn)的測(cè)試,有著更加具有挑戰(zhàn)性的任務(wù),并且解決了 gpt4 評(píng)估中的偏差以及限制。

在 MT-bench 上,OpenChat 性能表現(xiàn)與 wizardlm-13b 相似。也就是說,開源模型與 GPT-3.5 仍然有著一定差距。這也正是 MT-bench 所強(qiáng)調(diào)的內(nèi)容 —— 開源模型不是完美無(wú)缺的,但是這將邁向更好的聊天機(jī)器人評(píng)估。

圖片圖片

圖片圖片

前幾日,機(jī)器之心報(bào)道內(nèi)容《「羊駝」們走到哪一步了?研究表明:最好的能達(dá)到 GPT-4 性能的 68%》,也對(duì)開源模型的性能進(jìn)行了評(píng)估。

評(píng)估還表明,在任何給定的評(píng)估中,最佳模型的平均性能達(dá)到 ChatGPT 的 83%、GPT-4 的 68%,這表明需要進(jìn)一步構(gòu)建更好的基礎(chǔ)模型和指令調(diào)優(yōu)數(shù)據(jù)以縮小差距。

感興趣的讀者可以查看原文。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2013-08-19 09:12:07

云價(jià)格戰(zhàn)基礎(chǔ)架構(gòu)即服務(wù)IaaS

2021-07-27 23:00:11

微信設(shè)備功能

2023-09-11 08:27:21

Windows微軟

2014-09-05 11:03:42

智能家居

2010-11-05 09:48:28

ZendCon 201PHP云計(jì)算

2021-09-22 10:03:10

人工智能Transformer技術(shù)

2023-06-25 12:46:24

GPT-4人工智能

2013-05-23 10:50:12

Windows 8Modern應(yīng)用

2024-02-29 13:08:50

2009-03-27 09:51:21

百度貼吧改版

2023-05-04 07:16:50

ChatGPT開源

2009-03-27 13:42:39

2011-06-22 14:11:47

Flash

2023-07-16 23:04:10

GPT-4OpenAIMOE

2018-07-18 13:40:54

3D

2023-06-01 08:24:08

OpenAIChatGPTPython

2022-05-30 10:42:14

模型谷歌數(shù)據(jù)

2013-11-01 09:50:52

Windows 8.1平板機(jī)

2024-08-27 17:00:19

2023-02-08 19:46:25

ChatGPTOpenAI生產(chǎn)力
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日日夜精品视频 | 久久免费精品 | 精品久久国产视频 | 91精品国产综合久久久久久漫画 | 成年人在线观看视频 | 久久这里只有精品首页 | 久久高清精品 | 久久一区视频 | 九九亚洲 | 99综合在线 | 一本色道精品久久一区二区三区 | 久在线视频播放免费视频 | 成人中文字幕在线 | 成人在线网| 国产有码| 国产精品免费观看 | 尤物在线精品视频 | 亚洲欧美在线视频 | 日日夜夜天天 | 日本激情视频中文字幕 | 亚洲精品在线观 | 欧美日韩在线免费观看 | 精品久久99 | 精精国产xxxx视频在线播放 | 亚洲日本中文字幕在线 | 午夜电影网址 | 久久av一区 | 成人在线免费电影 | 国产精品一区二区av | 天天弄天天操 | 久久看精品 | 国产亚洲一区二区三区在线观看 | 中文字幕一区二区三区在线观看 | 日韩精品一区二区三区在线 | 日本视频中文字幕 | 国产亚洲一区精品 | 欧美日韩在线看 | 亚洲 欧美 另类 综合 偷拍 | 99视频在线免费观看 | 日韩一区二区三区在线观看 | 欧美精品一区二区三区在线 |