成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Newbing為什么與其他生成式AI如此不同

人工智能
大模型因為訓練成本昂貴并且無法增量訓練(增量只能做微調(diào)),因此想要把層出不窮的新知識不斷的添加到模型中去是不大現(xiàn)實的。通過RAG做本地知識庫的向量嵌入,或者通過AutoPrompt來優(yōu)化提問是彌補這一缺陷的有效辦法,目前已經(jīng)被大量的商用。

自從用上Newbing后,我就放棄CHATGPT 3.5了。昨天寫完文章后,我又試了下ChatGPT,沒想到去年被封的賬號居然又可以用了,不過只能用3.5版本,要用4.0必須升級到PRO,每個月20美金。于是我沒有嘗試去付款,因為Newbing對我來說已經(jīng)夠用了。

我前幾天發(fā)那篇關于多個公共大模型回答數(shù)據(jù)庫問題的性能比較的文章后,有個朋友給我留言說用Newbing去和其他通識大模型做PK有點不公平,因為Newbing是一個工程化的系統(tǒng),使用RAG+LLM的方式來提供服務,首先通過搜索查找到相關知識,再向大模型提問,性能肯定會比其他LLM要好。可能這個朋友是我對比的幾種國產(chǎn)大模型的成員,因此他比較在意我的測試的公正性。事實確實是如此,因為其他大模型提供給我們的接口也是工程化的,不過并沒有微軟做得好,我也只能暫時這么比較了。

從上面的文字,很多朋友可能已經(jīng)意識到了,通識大模型直接用于運維支撐,其性能是不足的,必須通過本地知識庫的嵌入才能獲得比較好的效果。這是因為在專業(yè)技術領域,通識大模型往往缺乏足夠的專業(yè)領域知識,因此對于很多問題,它們只能照貓畫虎去瞎猜,性能肯定是不足的。

圖片圖片

從去年11月份OpsEval發(fā)布運維大模型基準來看,通識大模型在OPS領域的表現(xiàn)不如人意。最主要的問題是幻覺問題,我們可以看出GPT 4.0的3-shot Cot這個標志Few shot思維鏈的指標也僅僅為88.70,只比Yi-34B-Chat這種參數(shù)規(guī)模小得多的模型搞出不到10%。這種水準無法作為權威提供服務,只能給人以參考。而對于Zero-shot的性能,就更加可憐了。Yi-34B僅僅為65%,也就是說大約1/3的大模型沒有學習過的知識的回答是錯誤的。通識大模型對于需要精準回答的運維領域來說是能力不夠的。

大模型因為訓練成本昂貴并且無法增量訓練(增量只能做微調(diào)),因此想要把層出不窮的新知識不斷的添加到模型中去是不大現(xiàn)實的。通過RAG做本地知識庫的向量嵌入,或者通過AutoPrompt來優(yōu)化提問是彌補這一缺陷的有效辦法,目前已經(jīng)被大量的商用。

我前陣子也說過,對于搞技術的人來說,擁有一個能夠隨時給大家提供幫助的知識庫十分重要。雖然說目前Newbing已經(jīng)能夠給我提供很好的幫助,不過在很多時候我依然覺得擁有一個私有知識庫是十分必要的。

圖片圖片

從去年開始我就一直在關注著螞蟻的開源項目DB-GPT,這個在12GB顯卡上就可以進行推理的大模型框架是DBA建立自己私有智能助理的不錯的選擇。經(jīng)過一年的迭代,這個開源項目已經(jīng)較為成熟了,對于想做這方面工作的朋友,所需的就是做自己的知識庫就行了。


責任編輯:武曉燕 來源: 白鱔的洞穴
相關推薦

2023-12-18 16:14:01

生成式AIIT

2019-08-06 10:05:03

Linux操作系統(tǒng)C語言

2024-03-29 16:02:02

生成式AI人工智能

2023-08-29 08:01:39

2023-10-30 11:13:55

2012-12-11 09:16:07

Go

2012-04-09 13:35:10

Instagram

2020-10-22 17:56:40

神經(jīng)網(wǎng)絡生成式對抗網(wǎng)絡

2017-07-26 10:21:46

DockerLinux容器

2022-06-01 23:27:38

區(qū)塊鏈加密貨幣數(shù)字資產(chǎn)

2020-06-02 19:14:59

Kubernetes容器開發(fā)

2020-11-05 10:50:09

物聯(lián)網(wǎng)數(shù)據(jù)技術

2022-11-28 09:00:03

編程bug開發(fā)

2024-08-26 08:16:13

2021-03-12 18:07:07

比特幣加密貨幣貨幣

2013-04-19 13:59:00

Apache Hado

2021-10-26 10:12:04

技術債務軟件開發(fā)應用程序

2022-11-21 18:02:04

前端測試

2021-03-29 16:32:03

軟件代碼程序員

2011-10-14 09:20:48

Lisp
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文在线视频观看 | 欧美一区二区二区 | 国产精品久久二区 | 色爱av| 国产精品免费看 | 亚洲97 | 久久国产区 | 久久不卡 | 国产日韩一区二区 | 成人在线免费视频 | 国产成人99久久亚洲综合精品 | 国产日韩精品视频 | 久久久激情视频 | 不卡的av在线 | 日韩欧美中文 | 欧美国产日韩在线观看成人 | 欧美一卡二卡在线 | 久久久久久99 | 国产精品成人国产乱一区 | av毛片| 亚洲高清网 | 日韩欧美字幕 | 国产成人免费视频网站高清观看视频 | 91亚洲精品久久久电影 | 成人精品一区二区三区中文字幕 | 视频精品一区 | 成人久久久 | 久久精品国产亚洲a | 97久久久久久久久 | 中文成人在线 | 久在线观看 | 午夜精品久久久久久久久久久久久 | 免费毛片网站 | 国产一区二区三区久久 | 国产一区二 | 精品一区二区三区四区 | 国产欧美精品 | 精品美女在线观看视频在线观看 | 国产精品久久久久久久久久久新郎 | 国产精品1区| 欧美日韩在线观看视频网站 |