成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

LACIE:大語(yǔ)言模型中用于置信度校準(zhǔn)的聽(tīng)眾感知微調(diào)

發(fā)布于 2024-6-6 07:53
瀏覽
0收藏

LACIE:大語(yǔ)言模型中用于置信度校準(zhǔn)的聽(tīng)眾感知微調(diào) -AI.x社區(qū)

LLM(大語(yǔ)言模型)通常存在校準(zhǔn)不良和過(guò)度自信的問(wèn)題,無(wú)論是顯性的(例如,“我百分之百確定”)還是隱性的,例如提供詳細(xì)信息或權(quán)威語(yǔ)調(diào)。

為了解決這個(gè)問(wèn)題,研究人員采用了一種實(shí)用的說(shuō)話者-聽(tīng)眾多代理方法。通過(guò)多代理RSA(Rational Speech Acts)和啟發(fā)式的偏好優(yōu)化來(lái)實(shí)現(xiàn)這一點(diǎn):說(shuō)話者生成答案,聽(tīng)眾根據(jù)答案的聽(tīng)起來(lái)如何來(lái)接受或拒絕它們。

LACIE:大語(yǔ)言模型中用于置信度校準(zhǔn)的聽(tīng)眾感知微調(diào) -AI.x社區(qū)

人們更喜歡自信且正確或不自信且不正確的答案,不喜歡不匹配的答案。通過(guò)使用引導(dǎo)的偏好數(shù)據(jù),研究人員對(duì)LLMs進(jìn)行微調(diào),使其在隱性和顯性上都能夠進(jìn)行校準(zhǔn)。

通過(guò)模擬聽(tīng)眾,研究人員在校準(zhǔn)(+20.7 AUROC,-7.8 ECE)和準(zhǔn)確性(+18%)方面取得了突破。

LACIE:大語(yǔ)言模型中用于置信度校準(zhǔn)的聽(tīng)眾感知微調(diào) -AI.x社區(qū)

LACIE:大語(yǔ)言模型中用于置信度校準(zhǔn)的聽(tīng)眾感知微調(diào) -AI.x社區(qū)

LACIE:大語(yǔ)言模型中用于置信度校準(zhǔn)的聽(tīng)眾感知微調(diào) -AI.x社區(qū)

更重要的是,這些進(jìn)展對(duì)人類也是有效的,在人類評(píng)估中接受的錯(cuò)誤答案減少了47%。關(guān)鍵是,LACIE不僅僅優(yōu)化真實(shí)性,即對(duì)聽(tīng)眾考慮的實(shí)用訓(xùn)練是關(guān)鍵。

LACIE:大語(yǔ)言模型中用于置信度校準(zhǔn)的聽(tīng)眾感知微調(diào) -AI.x社區(qū)

研究人員還展示了LACIE的好處在其他數(shù)據(jù)上也是有效的,當(dāng)在TriviaQA上訓(xùn)練時(shí),在TruthfulQA上取得了顯著的真實(shí)性提升!從定性上講,經(jīng)過(guò)LACIE微調(diào)后,模型在正確和錯(cuò)誤答案之間的自信度有了更好的區(qū)分。

LACIE還會(huì)在模型錯(cuò)誤時(shí)表現(xiàn)出更多的猶豫和詳細(xì)/顯性自信的答案。最后,可以觀察到一些有趣的出現(xiàn)特性:LACIE訓(xùn)練導(dǎo)致放棄答案的顯著增加,盡管在訓(xùn)練數(shù)據(jù)中沒(méi)有這種情況。

調(diào)整還會(huì)導(dǎo)致模型有點(diǎn)刻薄。當(dāng)模型自信時(shí),它們會(huì)說(shuō)一些像“當(dāng)然”或“顯然”的話來(lái)表達(dá)自信

論文:https://arxiv.org/abs/2405.21028

代碼:https://github.com/esteng/pragmatic_calibration


本文轉(zhuǎn)載自公眾號(hào)AIGC最前線   

原文鏈接:??https://mp.weixin.qq.com/s/-aAbe8AVnZ09_8g8QlvBeQ??


收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 91se在线| 夜夜摸夜夜操 | 国产免费让你躁在线视频 | 精品中文字幕久久 | 久草久草久草 | 羞羞网站在线观看 | 亚洲精品成人网 | 久久青青 | 日韩国产在线 | 成人精品高清 | 欧美日韩在线精品 | 亚洲一区二区三区在线观看免费 | 天天干天天爱天天 | 日韩欧美网 | 亚洲九九| 国产日产精品一区二区三区四区 | 日本精品裸体写真集在线观看 | 日韩一区二区三区av | 国产精品高潮呻吟久久久久 | 天天躁日日躁狠狠躁白人 | 欧美日韩一区在线观看 | 亚洲在线 | 亚洲国产一区二区三区在线观看 | 欧美福利 | 国产日韩欧美 | 在线观看亚洲专区 | 国产一区二区精品在线观看 | 亚洲视频在线观看 | 久久国际精品 | 综合久久综合久久 | 欧美日韩视频在线 | 一区二区三区韩国 | 亚洲精品在线视频 | 久草网站 | 亚洲国产精品久久 | a级大片免费观看 | a国产一区二区免费入口 | 国产精品一区二区视频 | 久久er精品 | 国产黄色在线观看 | 香蕉视频91 |