成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI:如GPT-5太危險,董事會有權阻止奧特曼發布

人工智能
OpenIA還透露已開創一項新的研究,衡量風險如何隨模型規模擴大而演變,提前預測風險,嘗試解決“未知的未知”。

OpenAI發布新公告:董事會現在有權否決奧特曼的決定

特別是針對GPT-5等前沿模型安全風險是否過高,是否對外發布等關鍵問題。

圖片圖片

作為上個月內訌的后果之一,總裁Greg Brockman與前首席科學家Ilya Sutskever已退出董事會,公司管理層無人再兼任董事會成員,兩種角色完全分離

現在公司管理層做決策,董事會有權推翻。

圖片圖片

上一屆董事會指責奧特曼“溝通不誠懇”,并稱這是解雇他的主要原因。

這次專門成立了安全顧問團隊,每個月同時向公司管理層和董事會匯報,確保所有決策者充分了解情況。

圖片圖片

除此之外,這份“前沿風險防范框架”還給OpenAI自己的技術開發設立了諸多限制。如針對不同種類的AI風險,必須確保模型安全得分達標后才能進入下一個開發階段。

有OpenAI員工表示:一般情況下不要相信公司說的“價值觀”,除非他們真的花高昂代價展開了行動。

而且是增加內部摩擦力、給競爭對手超車機會這種對自己沒有明顯好處的事。

圖片圖片

但不少用戶依舊不買賬:以安全的名義,現在ChatGPT的表現就像個土豆

圖片圖片

隨公告發布的還有一個動態文檔,會不斷更新對風險的跟蹤、評估、預測和防范流程。

總之看起來,對AI可能帶來災難性風險這回事,他們是認真的。

圖片圖片

三個安全團隊,分管當下和未來

對于不同時間尺度的AI風險,OpenAI成立了三個團隊來分別應對。

圖片圖片

安全系統團隊(Safety Systems)負責當下,減少現有模型如ChatGPT的濫用,由翁麗蓮領導。

圖片圖片

新成立準備團隊(Preparedness)負責不久的將來,識別和管理GPT-5等正在開發的前沿模型帶來的新風險,由MIT教授Aleksander Madry領導。

圖片圖片

超級對齊團隊(Superalignment)負責遙遠的未來,給超越人類的超級智能安全性奠定基礎,由Ilya SutskeverJan Leike領導。

圖片圖片

四種安全風險,最高災難級

對于開發中的前沿模型,OpenAI主要跟蹤4個類別的安全風險:

  • 網絡安全
  • CBRN(化學、生物、放射性、核威脅)
  • 說服能力
  • 模型自主性

評估期間將增加2倍的有效計算量把模型推向極限,并制作“記分卡”,分為“低、中、高、重大危險”四個等級。

網絡安全風險,定義為利用模型破壞計算機系統的機密性、完整性、可用性。

圖片圖片

CBRN風險,專注于與模型輔助創建化學、生物、放射性和/或核威脅相關的風險。

圖片圖片

說服風險,側重于與說服人們改變他們的信念或采取行動有關的風險。

通常強大的說服力很少見,需要大量人力(例如一對一對話,或者精心制作的媒體內容);然而,模型可以在能力范圍內使所有內容幾乎零成本生成。

圖片圖片

模型自主性風險就是比較科幻的那種,AI改進自己、阻止自己被關機、逃出實驗室了。

圖片圖片

采取緩解措施后,四個方面得分取最高值作為一個模型的總評分。

  • 只有緩解后風險評分為“中”或更低時才能部署
  • 只有緩解后風險評分為“高”或更低時才能進一步開發
  • 對緩解前為“高”或“重大風險”的模型采取額外安全措施

下圖僅為示例模板,不代表當前模型的評分。

圖片圖片

此外準備團隊還將定期安全演習,對業務和公司自身文化進行壓力測試,發現緊急問題并快速響應。

也將延續開發GPT-3.5和GPT-4時的傳統,邀請第三方組成紅隊,對模型做獨立評估。

最后,OpenIA還透露已開創一項新的研究,衡量風險如何隨模型規模擴大而演變,提前預測風險,嘗試解決“未知的未知”。

參考鏈接:
[1]https://openai.com/safety/preparedness
[2]https://twitter.com/OpenAI/status/1736809603311280489

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-12-19 07:24:37

2023-11-18 09:29:55

AI數據

2023-12-19 13:22:42

2024-03-20 12:43:57

2024-01-22 13:57:00

模型訓練

2023-11-23 14:00:07

OpenAI奧特曼

2024-03-21 06:56:03

2023-11-21 16:46:44

2023-11-20 08:30:47

AI科技

2025-02-10 01:00:00

OpenAIGPT-5GPT-4.5

2023-11-22 15:26:44

2023-06-08 07:58:29

2025-02-13 10:52:56

2024-05-11 08:24:16

OpenAIAI語音助手人工智能

2024-04-26 00:00:00

OpenAIGPT-5超算

2023-11-30 17:34:55

OpenAI微軟

2023-11-20 07:33:41

OpenAI奧特曼

2024-03-11 16:14:54

2024-01-18 12:30:03

2025-02-13 09:10:47

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产乱码精品1区2区3区 | 免费一级欧美在线观看视频 | 成人特级毛片 | 欧美激情视频一区二区三区在线播放 | 精品欧美一区二区精品久久久 | 521av网站 | 国产欧美一区二区三区另类精品 | 一区二区三区四区av | 中文字幕中文字幕 | 一区二区在线 | 久久成人一区 | 手机在线不卡av | 国产综合久久 | 欧美日韩久久精品 | 91视视频在线观看入口直接观看 | 国产精品区一区二区三区 | 久久精品国产清自在天天线 | 久久久久久国产精品免费免费狐狸 | 国产成人免费观看 | 一级片成人 | 国产欧美视频一区 | 色婷婷久久综合 | 久久尤物免费一区二区三区 | 国产视频精品免费 | 久草网址 | 国产日韩欧美一区二区 | 成人免费视频网 | 男人av在线播放 | 最新免费黄色网址 | 午夜精品一区 | 黑人精品欧美一区二区蜜桃 | 国产一区在线免费 | 中文字幕精品一区久久久久 | 国产激情免费视频 | 日韩在线免费播放 | 日韩欧美在线不卡 | 精品中文在线 | 特黄特黄a级毛片免费专区 av网站免费在线观看 | 久久88| 欧美a v在线 | 在线视频国产一区 |