成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

字節Seed提出序貫策略優化方法,突破同傳“質量-延遲”權衡問題

人工智能 新聞
香港中文大學、字節跳動Seed和斯坦福大學研究團隊出手,提出了一種面向同聲傳譯的序貫策略優化框架 (Sequential Policy Optimization for Simultaneous Machine Translation,?SeqPO-SiMT)。

AI字幕總是慢半拍,質量和延遲難以平衡是業界老問題了。

為此,香港中文大學、字節跳動Seed和斯坦福大學研究團隊出手,提出了一種面向同聲傳譯的序貫策略優化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)。

在70億參數(7B)規模上實現SOTA。

圖片

實驗結果顯示,SeqPO-SiMT的翻譯質量不僅優于監督微調(SFT)的離線模型及LLaMA-3-8B,其表現甚至能媲美乃至超越Qwen-2.5-7B的離線翻譯水平。

方法:SeqPO-SiMT序貫策略優化

針對以上難點,研究團隊提出SeqPO-SiMT框架。其核心思想是將同聲傳譯任務建模為一個序貫決策問題,綜合評估整個翻譯流程的翻譯質量和延遲,并對整個決策序貫進行端到端的優化。

該方法的主要特點是:它不再孤立地評估每一步決策的好壞,而是將一整句話的翻譯過程視為一個整體,即形成一個完整決策序貫,更符合人類對同傳的評估過程。

同聲傳譯采樣階段

該框架使用一個大語言模型(LLM)充當策略模型圖片,在每個時間步t,模型會接收新的源語言文本塊圖片,并基于已有的所有源文本圖片和之前的翻譯歷史圖片,來生成當前的翻譯塊圖片

這個決策過程可以被形式化地表示為:圖片

該框架的一個關鍵靈活性在于,如果模型決定等待更多上下文,輸出的圖片可以為空,其長度完全由策略模型圖片自行決定。

圖片

優化階段

獎勵函數:對于一個batch內的第i個樣本,系統會通過一個在最終步驟T給予的融合獎勵圖片來評估整個過程的優劣。這個獎勵同時評估翻譯質量(Quality)和延遲(Latency)。

具體而言,首先計算出原始的質量分圖片和延遲分圖片,然后對兩者進行歸一化處理以統一量綱得到圖片圖片,最終的獎勵被定義為:圖片

其中,圖片是一個超參數,用于權衡質量與延遲的重要性。

優化目標:模型的最終優化目標最大化期望獎勵圖片,同時為了保證訓練的穩定性,目標函數中還引入了KL散度作為約束項,防止策略模型圖片與參考模型圖片偏離過遠。

這個結合最終獎勵和穩定性約束的優化過程,使得模型能夠端到端地學會一個兼顧翻譯質量與延遲的最優策略

圖片

圖片

結果與分析:翻譯質量媲美Qwen-2.5-7B離線翻譯水平

研究團隊在多個公開的英漢互譯測試集上進行了實驗,并與多種現有同傳模型進行對比。實驗結果顯示:在低延遲水平下,SeqPO-SiMT框架生成的譯文質量相較于基線模型有明顯提升。

圖片

與多個高性能模型的離線翻譯結果進行對比,結果顯示,SeqPO-SiMT的翻譯質量不僅優于監督微調(SFT)的離線模型及LLaMA-3-8B,其表現甚至能媲美乃至超越Qwen-2.5-7B的離線翻譯水平。這表明該方法在70億參數(7B)規模上實現了業界頂尖(SoTA)的性能

圖片

SeqPO-SiMT為解決同聲傳譯中的“質量-延遲”權衡問題提供了一個新的視角,它強調了對決策“序貫”進行整體優化的重要性。該方法對于需要進行實時、連續決策的自然語言處理任務具有一定的參考意義,并為未來開發更高效、更智能的同聲傳譯系統提供了有價值的探索。

論文鏈接:https://arxiv.org/pdf/2505.20622

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-29 09:10:00

2023-09-20 08:37:33

語音翻譯同傳翻譯

2025-01-22 09:48:07

2025-06-24 11:50:37

模型數據開源

2015-07-02 11:17:30

MySQLSlave延遲優化

2014-11-27 10:30:38

云管理企業云云管理工具

2021-07-16 23:01:03

SQL索引性能

2025-05-12 09:00:00

2025-01-23 17:07:07

2021-07-26 18:23:23

SQL策略優化

2023-12-03 08:57:54

開源模型

2023-12-04 13:23:00

數據訓練

2024-01-16 17:17:30

模型訓練

2022-11-21 18:00:26

GraphQLAPI開發

2017-12-28 08:48:53

DRAM延遲問題

2013-09-23 09:18:16

云網絡延遲云網絡內容交付網絡

2024-05-24 08:59:15

2024-11-11 10:34:55

2025-06-27 08:50:40

2024-09-30 14:40:00

AI強化學習框架
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人网视频 | www.色五月.com | 精国产品一区二区三区 | 农村真人裸体丰满少妇毛片 | 免费视频成人国产精品网站 | 国产精品一区二区三 | 亚洲视频在线观看免费 | 亚洲精品1区 | 一区二区三区四区av | 欧洲色 | 欧美一区免费 | 亚洲日韩中文字幕一区 | 欧美 日韩 国产 成人 在线 91 | 日本精品一区二区三区在线观看 | 中文字幕第三页 | 国产小视频在线 | 欧美在线日韩 | 国产成在线观看免费视频 | 日本一区二区三区免费观看 | 2018天天干天天操 | av一区二区在线观看 | 玖玖免费 | 成人性生交大片 | 日韩久久久一区二区 | 日韩在线成人 | 免费观看av网站 | 久久久久久黄 | 久久久亚洲 | 日韩免费视频一区二区 | 国产视频久久 | 欧美一区二区三区视频在线 | 国产欧美视频一区 | 免费精品久久久久久中文字幕 | 欧美日韩精品一区二区天天拍 | 欧美精品tv | 国产日韩一区二区三区 | 91精品国产乱码久久久 | 日韩高清www| 成人av一区 | 欧美日韩精品久久久免费观看 | 国产成都精品91一区二区三 |