成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI開源了:Transformer自動Debug工具上線GitHub

人工智能 新聞
今天一早,OpenAI 機器學習研究員 Jan Leike 宣布,OpenAI 開放了自己內部一直用于分析 Transformer 內部結構的工具。

最近時常被吐槽不夠開源的 OpenAI,突然開放了一次。

今天一早,OpenAI 機器學習研究員 Jan Leike 宣布,OpenAI 開放了自己內部一直用于分析 Transformer 內部結構的工具。

圖片

GitHub 鏈接:https://github.com/openai/transformer-debugger

該項目開放才幾個小時,雖然沒有經過太多宣傳,star 數量上漲得也挺快。

Transformer Debugger 介紹

Transformer Debugger (TDB) 是 OpenAI 對齊團隊(Superalignment)開發的一種工具,旨在支持對小體量語言模型的特定行為進行檢查。據介紹,該工具把自動可解釋性技術與稀疏自動編碼器進行了結合。

具體來說,TDB 能夠在需要編寫代碼之前進行快速探索,并能夠干預前向傳遞,幫助人們查看它是如何影響模型特定行為的。TDB 可用于回答諸如「為什么模型在此提示(prompt)中輸出 token A 而不是 token B?」之類的問題或「為什么注意力頭 H 會在這個提示下關注 token T?」

它通過識別對行為有貢獻的特定組件(神經元、注意力頭、自動編碼器 latents),顯示自動生成的解釋來分析導致這些組件最強烈激活的原因,并跟蹤組件之間的連接以幫助人們發現聯系,以此來幫助人們進行 Transformer 的 debug 工作。

OpenAI 放出了幾段視頻概述了 TDB 的能力,并展示了如何使用它來進行論文《Interpretability in the Wild: a Circuit for Indirect Object Identification in GPT-2 small》中的工作:

本次,OpenAI 的開源內容包括:

  • Neuron viewer:一個 React 應用程序,用于托管 TDB 以及包含有關各個模型組件(MLP 神經元、注意力頭和兩者的自動編碼器 latents)信息的頁面。
  • Activation server:對主題模型進行推理,為 TDB 提供數據的后端服務器。它還從公共 Azure 存儲桶讀取和提供數據。
  • Models:GPT-2 模型及其自動編碼器的簡單推理庫,帶有捕獲激活的 hook。
  • 整理好的激活數據集:包含 MLP 神經元、注意力頭和自動編碼器 latents 的頂級激活數據集示例。

安裝設置

請按照以下步驟安裝存儲庫。請注意,在此之前你需要 python/pip 以及 node/npm。

雖然不是必要,但 OpenAI 建議使用虛擬環境進行操作:

# If you're already in a venv, deactivate it.
deactivate# Create a new venv.
python -m venv ~/.virtualenvs/transformer-debugger# Activate the new venv.
source ~/.virtualenvs/transformer-debugger/bin/activate

設置好環境后,請按照以下步驟操作:

git clone git@github.com:openai/transformer-debugger.gitcd transformer-debugger
# Install neuron_explainer
pip install -e .
# Set up the pre-commit hooks.
pre-commit install
# Install neuron_viewer.
cd neuron_viewer
npm installcd ..

要運行 TDB 應用程序,你需要按照說明設置激活服務器后端和神經元查看器前端。

要驗證更改,你需要:

  • 運行 pytest;
  • 運行 mypy —cnotallow=mypy.ini;
  • 運行激活服務器和神經元查看器,并確認 TDB 和神經元查看器頁面等基本功能仍然有效。

Jan Leike 表示,TDB 目前仍然是一個早期階段的研究工具,OpenAI 希望通過開源的方式讓更多人受益,并期待社區在其基礎上不斷改進。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-05-19 17:04:29

Python阿里自動化工具

2020-04-26 11:40:18

工具開源騰訊

2025-05-26 04:00:00

2024-12-13 11:22:01

2024-03-12 13:33:40

2024-03-13 08:03:44

LLM人工智能技術

2016-08-04 11:15:24

GitHubMySQLSchema

2014-11-13 14:32:53

2013-07-17 10:16:57

Github項目許可證

2019-06-30 15:10:45

GitHub中文版程序員

2020-10-05 22:17:39

GitHub代碼開發者

2018-05-18 17:16:04

開發工具 操作

2021-06-24 13:15:35

開源技術 圖像識別

2024-10-12 12:30:18

2020-09-18 14:27:26

GitHub代碼開發者

2023-06-20 08:28:17

2024-08-26 08:00:00

模型AI

2023-03-02 12:32:36

2014-09-10 09:20:01

2019-12-04 10:15:10

GitHub代碼開發者
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品欧美一区二区精品久久久 | 欧美一级二级在线观看 | 欧美在线观看一区 | 亚洲精品免费在线 | 亚洲一区二区三区免费在线观看 | 精品免费 | 久久蜜桃精品 | 在线午夜电影 | 欧州一区二区三区 | 免费簧片视频 | 中文天堂在线一区 | 久久噜噜噜精品国产亚洲综合 | 99精品欧美一区二区三区综合在线 | 精品国产一区二区三区性色av | 久操伊人 | 欧美一级二级三级视频 | 久艹网站 | 亚洲视频在线看 | 国产成人综合av | 成年男女免费视频网站 | 欧美日韩不卡 | 国产999精品久久久 午夜天堂精品久久久久 | 久久九七 | 欧美日韩一 | 国产在线观看不卡一区二区三区 | 欧美日韩在线免费 | 成人在线视频网址 | 91玖玖 | 亚洲天堂999 | 久久久亚洲 | 欧美极品在线观看 | 国产美女在线观看 | 国产亚洲精品成人av久久ww | 亚州国产| 91视频进入 | 天堂综合 | 天天操夜夜操 | 成人一级黄色毛片 | 在线播放国产一区二区三区 | 国产精品精品久久久久久 | 一区二区三区四区视频 |