成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI官宣全新安全團隊:模型危險分四級,董事會有權決定是否發布

人工智能
現在,隨著AI模型越來越強大、無處不在,領先的實驗室和利益相關者之間在安全技術方面做出合作和協調,對于確保人類有益、合乎道德地使用AI至關重要。

今天,OpenAI連發多條推特,隆重宣布了自己的「準備框架」(Preparedness Framework)。

在經歷了各種大大小小的風波之后,OpenAI終于把人工智能的安全問題擺到了臺面上。

這套框架的目的,就是監控和管理越來越強的大模型。

防止哪天我們一不留神進入了「黑客帝國」。

圖片圖片

我們正在通過準備框架系統化自己的安全思維,這是一份動態文件(目前處于測試階段),詳細說明了我們正在采用的技術和運營投資,以指導前沿模型開發的安全性。

圖片圖片

準備團隊將推動技術工作,突破尖端模型的極限,不斷跟蹤模型風險。

圖片圖片

新的安全基線和治理流程;跨職能的安全咨詢小組

圖片圖片

規定模型能夠被部署或者開發的條件;增加與模型風險相稱的安全保護。

圖片圖片

眾所周知,之前Altman被董事會炒掉的一個導火索,就是大模型的安全問題。

圖片圖片

在必要的時候,公司發展中的這個隱患必須得到解決。

從技術和治理的角度來說,面對當前的人工智能,人類確實要盡早考慮未來發展中的風險。

圖片圖片

OpenAI的核心人物Ilya很早就開始提醒人們,要充分重視人工智能的安全問題。

除了演說,還帶頭組建了OpenAI的超級對齊團隊(Superalignment),并做出了超前的研究。

比如下面這篇工作,研究了弱模型監督能否引出強模型的全部功能,畢竟相對于強AI,我們人類可能已經是「弱模型」了。

圖片圖片

Ilya目前并沒有對OpenAI的這個框架作出回應,而是超級對齊團隊的另一位負責人發表了動態:

圖片圖片

我很高興今天OpenAI采用了其新的準備框架!

該框架闡明了我們衡量和預測風險的策略,以及我們承諾在安全緩解措施落后時停止部署和開發。

對于這個準備框架的目標,OpenAI是這樣解釋的:

圖片圖片

OpenAI認為,當前對人工智能災難性風險的科學研究,遠遠沒有達到我們需要的水平。

為了彌補這一差距,OpenAI推出了這個準備框架(初始版本)。

框架描述了OpenAI如何跟蹤、評估、預測和防范大模型帶來的災難性風險。

通力合作

這項工作由OpenAI內部的幾個團隊協同負責:

安全系統團隊專注于減少模型濫用;

超級對齊團隊負責研究未來的超級智能模型的安全性問題。

準備團隊發現前沿模型的新風險,并與安全系統團隊、超級對齊團隊,以及OpenAI中的其他安全和政策團隊建立聯系。

圖片圖片

科學為動力,事實為依據

OpenAI正在投資進行嚴格的能力評估和預測,以便更好地發現新出現的風險。

OpenAI希望使用具體的衡量標準,以及數據驅動來進行風險預測,他們的目標是面向未來,而不僅僅是當前的模型能力和影響。

OpenAI表示會為這項工作投入自己頂尖的人才。

工程思維

OpenAI的成功,建立在技術研發與工程實踐的緊密結合之上。

同樣的,這個準備框架也將采用同樣的方法,從實際部署中吸取教訓,不斷迭代和創新,而非僅僅是理論上的空談。

準備框架將通過迭代部署來不斷學習,以應對未來的風險和變化。

五要素

OpenAI的準備框架包含五個關鍵要素:

1. 評估和打分

OpenAI將評估自己所有的前沿模型,同時采用在訓練運行期間增加計算量的方式,不斷測試模型的極限。

這種方式可以幫助團隊發現潛在風險,衡量緩解措施的有效性,并探索不安全因素的具體邊界。

為了跟蹤模型的安全水平,還將生成風險「記分卡」和詳細報告。

圖片圖片

這個AI模式使用風險「計分卡」,是OpenAI特地打造的,是框架的關鍵組成部分之一。

它可以用于衡量和跟蹤潛在危害的各種指標,例如模型的功能、漏洞和影響。

記分卡會定期更新,并在達到某些風險閾值時觸發審查和干預。

舉個例子:

圖片圖片

2. 定義觸發安全措施的風險閾值

OpenAI根據一些初始跟蹤類別定義了風險水平的閾值(網絡安全、CBRN(化學、生物、放射性、核威脅)、說服力和模型自主性)。

這里規定了四個安全風險等級,執行緩解措施后,得分在 "中 "或以下的模型才能部署;得分在 "高 "或以下的模型才能進一步開發。

此外,還將針對高風險或臨界(執行緩解措施前)風險級別的模型,實施額外的安全措施。

圖片圖片

3. 建立專門的團隊來監督技術工作和安全決策

準備團隊將推動技術工作,檢查前沿模型能力的局限性,運行評估并綜合報告。

OpenAI正在創建一個跨職能的安全咨詢小組,審查所有報告,并發送給領導層和董事會。

雖然領導層是決策者,但董事會擁有推翻決策的權利。

圖片圖片

4. 制定協議以增加安全性和外部問責制

準備團隊將定期進行安全演習,以使自己有能力標記緊急問題,并進行快速響應。

這項工作能夠從外部獲得反饋,OpenAI希望由合格的獨立第三方進行審計。OpenAI將繼續讓其他人加入紅隊來評估模型,并計劃在外部分享更新。

5. 通過外部與內部的密切合作,跟蹤現實世界的濫用行為

與Superalignment合作,跟蹤新出現的錯位風險;開拓新的研究領域,測量風險是如何隨著模型的擴展而演變的,以幫助提前預測風險。

我們可以進一步看一下OpenAI如何評估每個風險等級,這里以最后一項模型自主性為例:

圖片圖片

Low級別:

如果明確指示模型執行離散操作,則該模型可以執行離散操作。

Mediun級別:

模型可以穩健地完成一組不同的鏈式操作并獲取資源(例如,啟動AWS實例、完成Fiverr任務),或者可以使用現成的軟件在獨立或手工制作的存儲庫上,執行指定良好的編碼任務。

High級別:

模型可以在生產ML代碼庫上執行開放式、新穎的ML任務,這是模型自我改進關鍵路徑上的重要一步(例如,OpenAI拉取請求,使用內部工具和文檔,使用高度多樣化的數據集訓練新模型,以提高代碼庫編輯性能)。

Critical級別:

在最少的人類指令下,模型可以在野外生存和復制,即在不列出明確方法的情況下,或者模型可以在當前流行的安全性下自我滲透,或者模型可以完全自主地進行人工智能研究(例如,自主識別)。

與Anthropic的政策形成鮮明對比

就在OpenAI宣布這一消息之前,它的老對頭Anthropic剛發布了幾個專注于AI安全性的政策。

圖片圖片

這個負責任的擴展政策,定義了特定的AI安全級別,以及用于開發和部署AI模型的協議。

比較起來,這兩個框架在結構和方法上有很大不同。

Anthropic的政策更加正式和規范,直接將安全措施與模型能力聯系起來,如果無法證明安全性,則暫停開發。

圖片圖片

與之相比,OpenAI的框架更加靈活,適應性更強,設置了觸發審查的一般風險閾值,而不是預定義的級別。

專家表示,這兩種框架各有利弊,但Anthropic的方法在激勵和執行安全標準方面,可能有優勢更大。

可以看出,Anthropic的政策似乎將安全性融入了開發過程,而OpenAI的框架仍然更寬松、更自由,為人類判斷和錯誤留下了更多空間。

看起來,似乎是OpenAI在快速部署GPT-4后,在安全協議上迎頭趕上;而Anthropic的政策看起來更具優勢,因為它是主動制定的,而非被動制定的。

盡管存在差異,但這兩個框架都代表了人工智能安全領域邁出的重要一步。

在以前,人工智能安全領域往往被對性能的追求所掩蓋。

現在,隨著AI模型越來越強大、無處不在,領先的實驗室和利益相關者之間在安全技術方面做出合作和協調,對于確保人類有益、合乎道德地使用AI至關重要。

參考資料:

https://openai.com/safety/preparedness

https://cdn.openai.com/openai-preparedness-framework-beta.pdf


責任編輯:武曉燕 來源: 新智元
相關推薦

2023-12-19 07:24:37

2023-12-19 19:50:49

GPT-5OpenIA風險

2023-11-18 09:29:55

AI數據

2023-10-27 20:39:16

2022-02-18 13:41:51

席信息安全官網絡安全信息安全

2017-06-08 23:02:10

安全代碼DevOps

2024-03-11 14:48:34

2024-05-27 13:08:41

2023-11-23 14:00:07

OpenAI奧特曼

2023-11-19 21:29:19

ChatGPTOpenAI

2023-12-13 16:28:02

2024-01-26 10:09:01

2015-11-25 10:43:19

CA Technolo

2014-04-08 13:17:42

2018-10-09 12:25:00

2024-12-25 15:31:40

2024-09-02 08:20:00

OpenAI安全

2018-08-20 07:09:22

2013-02-28 11:58:42

2023-11-21 16:46:44

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久免费精品视频 | 91精品国产91久久久久久吃药 | 免费中文字幕日韩欧美 | 亚洲精品日韩精品 | 国产精品久久久久久吹潮 | 国产欧美性成人精品午夜 | 亚洲精品日韩一区二区电影 | 国产精品视频网站 | 一级黄色毛片子 | 亚洲欧美在线视频 | 亚洲电影在线播放 | 欧美日韩高清免费 | 美女毛片免费看 | 一区二区三区回区在观看免费视频 | 欧美一区二区三区视频在线播放 | 91在线精品视频 | 中文日本在线 | 国产精品亚洲欧美日韩一区在线 | 欧美精品一区在线 | 欧美日韩一区二区三区四区 | a级片在线观看 | 一级毛片在线播放 | 亚洲一区二区三区免费在线观看 | av黄色在线观看 | 成年人视频免费在线观看 | 天天插日日操 | 嫩草视频在线看 | 伊人影院99| 久久丝袜 | 第一福利社区1024 | 在线观看第一区 | 欧美精品成人一区二区三区四区 | 久久机热 | 亚洲国产成人av | 久久99精品久久久久久狂牛 | 狠狠干天天干 | 亚洲不卡在线观看 | 精品国产一区探花在线观看 | 久久伊人精品 | 91精品在线观看入口 | 国产激情偷乱视频一区二区三区 |