成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

蘋果智能背后模型公布:3B模型優于Gemma-7B,服務器模型媲美GPT-3.5-Turbo

人工智能 新聞
在這篇博客中,蘋果用大量篇幅介紹了他們是如何開發高性能、快速且節能的模型;如何進行這些模型的訓練;如何為特定用戶需求微調適配器;以及如何評估模型在提供幫助和避免意外傷害方面的表現。

在剛剛結束的全球開發者大會上,蘋果宣布了 Apple intelligence, 這是一款深度集成于 iOS 18、iPadOS 18 和 macOS Sequoia 的全新個性化智能系統。 

圖片

Apple Intelligence 由多種高度智能的生成模型組成,這些模型專為用戶的日常任務設計。在蘋果剛剛更新的博客中,他們詳細介紹了其中兩款模型:

  • 一個擁有約 30 億參數的設備端語言模型;
  • 一個更大的基于服務器的語言模型,該模型通過私有云計算在蘋果服務器上運行。

這兩個基礎模型是蘋果生成模型家族的一部分,蘋果表示,他們會在不久的將來分享更多關于這一模型家族的信息。 

在這篇博客中,蘋果用大量篇幅介紹了他們是如何開發高性能、快速且節能的模型;如何進行這些模型的訓練;如何為特定用戶需求微調適配器;以及如何評估模型在提供幫助和避免意外傷害方面的表現。 

圖片

蘋果基礎模型的建模概覽

預訓練

基礎模型是在 AXLearn 框架上訓練而成的,這是蘋果在 2023 年發布的一個開源項目。該框架建立在 JAX 和 XLA 之上,使得用戶能夠在各種硬件和云平臺上高效且可擴展地訓練模型,包括 TPU 以及云端和本地的 GPU。此外,蘋果使用數據并行、張量并行、序列并行和 FSDP 等技術,沿著多個維度(如數據、模型和序列長度)擴展訓練。

蘋果在訓練其基礎模型時,使用了經過授權的數據,這些數據包括為了增強某些特定功能而特別選擇的數據,以及由蘋果的網頁爬蟲 AppleBot 從公開的網絡上收集的數據。網頁內容的發布者可以通過設置數據使用控制,選擇不讓他們的網頁內容被用來訓練 Apple Intelligence。 

蘋果在訓練其基礎模型時,從不使用用戶的私人數據。為了保護隱私,他們會使用過濾器去除公開在互聯網上的個人可識別信息,比如信用卡號碼。此外,他們還會過濾掉粗俗語言和其他低質量的內容,以防這些內容進入訓練數據集。除了這些過濾措施之外,Apple 還會進行數據提取和去重,并使用基于模型的分類器來識別并選擇高質量的文檔用于訓練。 

后訓練

蘋果發現數據質量對模型至關重要,因此在訓練流程中采用了混合數據策略,即人工標注數據和合成數據,并進行全面的數據管理和過濾程序。蘋果在后訓練階段開發了兩種新算法:(1) 帶有「teacher committee」的拒絕采樣微調算法,(2) 使用帶有鏡像下降策略優化以及留一優勢估計器的從人類反饋中進行強化學習(RLHF)算法。這兩種算法顯著提高了模型的指令跟隨質量。 

優化

除了保證生成模型本身的高性能,Apple 還采用了多種創新技術,在設備端和私有云上對模型進行優化,以提升速度和效率。特別是,他們對模型在生成第一個 token(單個字符或詞語的基本單位)和后續 token 的推理過程都進行了大量優化,以確保模型的快速響應和高效運行。 

蘋果在設備端模型和服務器模型中都采用了分組查詢注意力機制,以提高效率。為了減少內存需求和推理成本,他們使用了共享的輸入和輸出詞匯嵌入表,這些表在映射時沒有重復。設備端模型的詞匯量為 49,000,而服務器模型的詞匯量為 100,000。

對于設備端推理,蘋果使用了低位 palletization,這是一個關鍵的優化技術,能夠滿足必要的內存、功耗和性能要求。為了保持模型質量,蘋果還開發了一個新的框架,使用 LoRA 適配器,結合了混合的 2 位和 4 位配置策略 —— 平均每個權重 3.5 位 —— 以實現與未壓縮模型相同的準確率。 

此外,蘋果還使用交互式模型延遲和功耗分析工具 Talaria,以及激活量化和嵌入量化,并開發了一種在神經引擎上實現高效鍵值 (KV) 緩存更新的方法。

通過這一系列優化,在 iPhone 15 Pro 上, 當模型接收到一個提示詞時,從接收到這個提示詞到生成第一個 token 所需的時間約為 0.6 毫秒,這個延遲時間非常短,表明模型在生成響應時非常快速生成速率為每秒 30 個 token。

模型適配

蘋果將基礎模型針對用戶的日常活動進行了微調,并且可以動態地專門針對當前的任務。

研究團隊利用適配器(可以插入預訓練模型各個層的小型神經網絡模塊)來針對特定任務微調模型。具體來說,研究團隊調整了注意力矩陣、注意力投影矩陣和逐點(point-wise)前饋網絡中的全連接層。

通過僅微調適配器層,預訓練基礎模型的原始參數保持不變,保留模型的一般知識,同時定制適配器層以支持特定任務。

圖 2:適配器是覆蓋在公共基礎模型上的模型權重的小型集合。它們可以動態加載和交換 —— 使基礎模型能夠動態地專門處理當前的任務。Apple Intelligence 包括一組廣泛的適配器,每個適配器都針對特定功能進行了微調。這是擴展其基礎模型功能的有效方法。

研究團隊使用 16 bit 表征適配器參數的值,對于約 30 億參數的設備模型,16 適配器的參數通常需要 10 兆字節。適配器模型可以動態加載、臨時緩存在內存中以及交換。這使基礎模型能夠動態地專門處理當前的任務,同時有效地管理內存并保證操作系統的響應能力。

為了促進適配器的訓練,蘋果創建了一個高效的基礎設施,以在基本模型或訓練數據更新時快速重新訓練、測試和部署適配器。

性能評估

蘋果在對模型進行基準測試時,專注于人類評估,因為人類評估的結果與產品的用戶體驗高度相關。

為了評估特定于產品的摘要功能,研究團隊使用了針對每個用例仔細采樣的一組 750 個響應。評估數據集強調產品功能在生產中可能面臨的各種輸入,并包括不同內容類型和長度的單個文檔和堆疊文檔的分層混合。實驗結果發現帶有適配器的模型能夠比類似模型生成更好的摘要。

作為負責任開發的一部分,蘋果識別并評估了摘要固有的特定風險。例如,摘要有時會刪除重要的細微差別或其他細節。然而,研究團隊發現摘要適配器沒有放大超過 99% 的目標對抗樣本中的敏感內容。

圖 3:摘要用例的「好」和「差」響應占比。

除了評估基礎模型和適配器支持的特定功能之外,研究團隊還評估了設備上模型和基于服務器的模型的一般功能。具體來說,研究團隊采用一組全面的現實世界 prompt 來測試模型功能,涵蓋了頭腦風暴、分類、封閉式問答、編碼、提取、數學推理、開放式問答、重寫、安全、總結和寫作等任務。

研究團隊將模型與開源模型(Phi-3、Gemma、Mistral、DBRX)和規模相當的商業模型(GPT-3.5-Turbo、GPT-4-Turbo)進行比較。結果發現,與大多數同類競爭模型相比,蘋果的模型更受人類評估者青睞。例如,蘋果的設備上模型具有約 3B 參數,其性能優于較大的模型,包括 Phi-3-mini、Mistral-7B 和 Gemma-7B;服務器模型與 DBRX-Instruct、Mixtral-8x22B 和 GPT-3.5-Turbo 相比毫不遜色,同時效率很高。

圖 4:蘋果基礎模型與可比較模型的評估中首選響應比例。

研究團隊還使用一組不同的對抗性 prompt 來測試模型在有害內容、敏感主題和事實方面的性能,測量了人類評估者評估的模型違規率,數字越低越好。面對對抗性 prompt,設備上模型和服務器模型都很強大,其違規率低于開源和商業模型。

圖 5:有害內容、敏感主題和事實性的違規響應比例(越低越好)。當面對對抗性 prompt 時,蘋果的模型非常穩健。

考慮到大型語言模型的廣泛功能,蘋果正在積極與內部和外部團隊進行手動和自動紅隊合作,以進一步評估模型的安全性。

圖 6:在安全 prompt 方面,蘋果基礎模型與同類模型的并行評估中首選響應的比例。人類評估者發現蘋果基礎模型的響應更安全、更有幫助。

為了進一步評估模型,研究團隊使用指令跟蹤評估 (IFEval) 基準來將其指令跟蹤能力與同等大小的模型進行比較。結果表明,設備上模型和服務器模型都比同等規模的開源模型和商業模型更好地遵循詳細指令。

圖 7:蘋果基礎模型和類似規模模型的指令跟蹤能力(使用 IFEval 基準)。

蘋果還評估了模型的寫作能力,涉及各種寫作指令。

圖片

圖 8:寫作能力(越高越好)。

最后,我們看一下蘋果對于 Apple Intelligence 背后技術的介紹視頻。



責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-08-01 12:44:58

2023-03-02 22:46:48

2024-07-18 13:22:31

2024-10-17 18:52:41

2024-06-04 14:09:00

2024-03-27 09:09:57

模型AI開源

2024-01-17 13:32:46

AI代碼代碼生成工具

2024-07-04 15:32:13

2024-12-18 07:10:00

2023-02-16 13:48:56

模型論文

2023-08-23 13:27:00

SQLCoder開源開發

2024-01-17 12:08:32

模型訓練

2025-02-10 14:30:00

模型數據開源

2023-11-18 09:37:49

2023-12-26 08:17:23

微軟GPT-4

2024-06-03 10:43:34

2023-12-24 13:56:37

2024-04-24 12:47:17

模型AI機器人

2024-08-01 13:30:00

2025-06-25 09:14:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美一区永久视频免费观看 | 国产精品a久久久久 | 国产精品爱久久久久久久 | 中文字幕在线免费视频 | 国产免费拔擦拔擦8x高清 | 亚洲成人精品一区二区 | 91精品国产综合久久久久久 | 日韩中文字幕视频在线 | 国产精品日韩在线观看 | 91大神xh98xh系列全部 | 日本电影韩国电影免费观看 | 在线视频亚洲 | 日韩精品一区二区三区免费视频 | 视频一区二区国产 | 激情 婷婷| 成人一区二区视频 | 成人午夜免费视频 | 久久精品国产一区 | 国产精品成人一区二区三区 | 性色av网站 | 正在播放一区二区 | 999视频 | 精品日韩一区 | 中文字幕在线二区 | 婷婷色婷婷 | 国产日韩精品一区 | 免费av手机在线观看 | 中文字幕精品一区二区三区精品 | 久热国产在线 | 国产精品观看 | 精品影院 | 日韩精品一二三 | 色婷婷久久久久swag精品 | 国产精品久久精品 | 精品一区二区三区在线播放 | 国产久| 久久精品中文字幕 | 噜噜噜噜狠狠狠7777视频 | 精品亚洲永久免费精品 | 一区二区三区四区在线播放 | av大片 |