成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

超越最新視頻壓縮標(biāo)準(zhǔn)H.266,字節(jié)跳動(dòng)編碼讓視頻縮小13%

新聞
聯(lián)合視頻專家組 JVET 官網(wǎng)顯示,字節(jié)跳動(dòng)設(shè)立在美國的研發(fā)團(tuán)隊(duì)于今年初發(fā)起了一項(xiàng)視頻壓縮技術(shù)提案,并命名為 DAM(Deep-filtering with Adaptive Model-selection)。

 聯(lián)合視頻專家組 JVET 官網(wǎng)顯示,字節(jié)跳動(dòng)設(shè)立在美國的研發(fā)團(tuán)隊(duì)于今年初發(fā)起了一項(xiàng)視頻壓縮技術(shù)提案,并命名為 DAM(Deep-filtering with Adaptive Model-selection)。相比 H.266/VVC 最新標(biāo)準(zhǔn),DAM 能夠?yàn)橐曨l編碼性能帶來顯著提升,亮度信號(hào) Y 可實(shí)現(xiàn) 10.28% 的性能增益。兩個(gè)色度信號(hào) U 和 V 的性能增益也分別達(dá)到 28.22% 和 27.97%。這是業(yè)界公開的單個(gè)智能編碼工具的最佳性能增益。

[[386997]]

視頻編解碼是視頻應(yīng)用的底層核心技術(shù),作用是對(duì)圖像進(jìn)行壓縮和數(shù)字編碼,以盡可能小的帶寬傳送盡可能高質(zhì)量的視頻數(shù)據(jù)。H.264 是現(xiàn)在被廣泛使用的視頻編解碼標(biāo)準(zhǔn),在同等視頻質(zhì)量下,H.265/HEVC 標(biāo)準(zhǔn)可以讓視頻體積減小一半。H.265 尚未完全普及,新一代標(biāo)準(zhǔn) H.266/VVC 比 H.265 讓視頻又減小一半。

這并不是視頻編碼技術(shù)的盡頭。

今年初,字節(jié)跳動(dòng)先進(jìn)視頻團(tuán)隊(duì)(AVG)向聯(lián)合視頻專家組 JVET 發(fā)起了一項(xiàng) JVET-U0068 技術(shù)提案,可以為視頻壓縮的三個(gè)顏色分量(Y, U, V)分別實(shí)現(xiàn)約 10%、28%、28% 的性能增益,這是業(yè)界公開的單個(gè)智能編碼工具的最佳性能增益。在優(yōu)化壓縮質(zhì)量的同時(shí),視頻體積相比 H.266 最新標(biāo)準(zhǔn)至少還可以縮小 13%。就其實(shí)際效果而言,如果新技術(shù)得以應(yīng)用,與現(xiàn)在主流的 H.264 標(biāo)準(zhǔn)相比,我們看同樣質(zhì)量的視頻,大約只需要 22% 的帶寬和存儲(chǔ)空間。

這項(xiàng)技術(shù)名為 DAM(Deep-filtering with Adaptive Model-selection),它是通過深度學(xué)習(xí)技術(shù)構(gòu)建減少視頻壓縮失真的濾波器,主干是基于殘差單元堆疊的深度卷積神經(jīng)網(wǎng)絡(luò),輔以自適應(yīng)模型選擇以最大程度適應(yīng)特性復(fù)雜的自然視頻。該技術(shù)由字節(jié)跳動(dòng) AVG 的美國加州研發(fā)團(tuán)隊(duì)實(shí)現(xiàn),成員來自高通、英特爾、微軟等巨頭以及海內(nèi)外多家頂級(jí)院校。

我們先從下圖示例中對(duì)比 H.264 與 H.266+DAM 的視頻壓縮效果:

超越最新視頻壓縮標(biāo)準(zhǔn)H.266,字節(jié)跳動(dòng)編碼讓視頻縮小13%

可以看到,相同壓縮比條件下,H.266+DAM 編碼壓縮質(zhì)量遠(yuǎn)遠(yuǎn)優(yōu)于 H.264。

除了視頻壓縮質(zhì)量提升之外,應(yīng)用 DAM 技術(shù)可以比H.266再縮小 13% 的數(shù)據(jù)體積,以下圖片來自國際標(biāo)準(zhǔn)組織的測試視頻。其中,圖(左)為原圖,每像素 12 字節(jié);圖(中)使用 VTM11.0 壓縮(qp=42),每像素 0.00216字節(jié),峰值信噪比 27.78dB;圖(右)使用 VTM11.0+DAM(qp=42),每像素 0.00184 字節(jié),峰值信噪比 28.02dB。

對(duì)比圖(中)和圖(右)可以看出,應(yīng)用 DAM 技術(shù)后,圖(右)壓縮比更高,峰值信噪比(客觀質(zhì)量)更好,主觀質(zhì)量也相對(duì)更好。

超越最新視頻壓縮標(biāo)準(zhǔn)H.266,字節(jié)跳動(dòng)編碼讓視頻縮小13%

圖1. 左:原圖, 12bpp,中:VTM-11.0壓縮,QP42,0.00216bpp,27.78dB,右:VTM-11.0+DAM,QP42, 0.00184bpp,28.02dB

技術(shù)細(xì)節(jié)

DAM 的構(gòu)建方法

提案 JVET-U0068 所介紹的 DAM 是字節(jié)跳動(dòng) AVG 此前一項(xiàng)提案 JVET-T0088 的擴(kuò)展版本。

在具體實(shí)現(xiàn)上,為了減輕深度網(wǎng)絡(luò)的訓(xùn)練難度,DAM 算法利用殘差單元作為基本模塊,并多次堆疊來構(gòu)建最終網(wǎng)絡(luò)。所謂殘差單元是指通過引入跳層連接,允許網(wǎng)絡(luò)把注意力放在變化的殘差上。為了處理不同類型的內(nèi)容,新技術(shù)針對(duì)不同類型的 slice 和質(zhì)量級(jí)別訓(xùn)練不同網(wǎng)絡(luò)。此外,還引入了一些新特性來提高編碼性能。

超越最新視頻壓縮標(biāo)準(zhǔn)H.266,字節(jié)跳動(dòng)編碼讓視頻縮小13%

圖 1:(a)是卷積神經(jīng)網(wǎng)絡(luò)濾波器的架構(gòu),M 代表特征圖的數(shù)量,N 代表特征圖的空間分辨率;(b)是(a)中殘差塊的結(jié)構(gòu)。

DAM 濾波方法的主干如上圖 1 所示,為了增加感受野,降低復(fù)雜度,此方法包含一個(gè)步幅為 2 的卷積層,該層將特征圖的空間分辨率在水平方向和垂直方向都降低到輸入大小的一半,這一層輸出的特征圖會(huì)經(jīng)過若干順序堆疊的殘差單元。最后一個(gè)卷積層以最后一個(gè)殘差單元的特征圖作為輸入,輸出 4 個(gè)子特征圖。最后,shuffle 層會(huì)生成空間分辨率與輸入相同的濾波圖像。

與此架構(gòu)相關(guān)的其他細(xì)節(jié)如下:

  • 對(duì)于所有卷積層,使用 3x3 的卷積核。對(duì)于內(nèi)部卷積層,特征圖數(shù)量設(shè)置為 128。對(duì)于激活函數(shù),使用 PReLU;
  • 針對(duì)不同 slice 類型訓(xùn)練不同的模型;
  • 當(dāng)為 intra slice 訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)濾波器時(shí),預(yù)測和分塊信息也被輸入網(wǎng)絡(luò)。

新特性:自適應(yīng)模型選擇

在 JVET-T0088 的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上,JVET-U0068 引入了以下幾種新特性:

  • 首先,每個(gè) slice 或 CTU 單元可以決定是否使用基于卷積神經(jīng)網(wǎng)絡(luò)的濾波器;
  • 其次,當(dāng)某個(gè) slice 或者 CTU 單元確定使用基于卷積神經(jīng)網(wǎng)絡(luò)的濾波器時(shí),可以進(jìn)一步確定使用三個(gè)候選模型中的哪個(gè)模型。為此目的,使用 {17,22,27,32,37,42} 中的 QP 數(shù)值訓(xùn)練不同模型。將編碼當(dāng)前 slice 或 CTU 的 QP 記作 q,那么候選模型由針對(duì) {q,q-5,q-10} 訓(xùn)練的三個(gè)模型構(gòu)成。選擇過程基于率失真代價(jià)函數(shù),然后將相關(guān)模式表征信息寫入碼流;
  • 第三,基于卷積神經(jīng)網(wǎng)絡(luò)的濾波器在所有層都被啟用;
  • 最后,現(xiàn)有濾波器中的去塊濾波和 SAO 被關(guān)掉,而 ALF(和 CCALF)則被置于基于卷積神經(jīng)網(wǎng)絡(luò)濾波器后面。

在線推斷及訓(xùn)練

推斷過程中使用 PyTorch 在 VTM 中執(zhí)行 DAM 深度學(xué)習(xí)的在線推斷,下表 1 是根據(jù) JVET 建議給出的網(wǎng)絡(luò)信息:

超越最新視頻壓縮標(biāo)準(zhǔn)H.266,字節(jié)跳動(dòng)編碼讓視頻縮小13%

表 1。

訓(xùn)練過程中以 PyTorch 為訓(xùn)練平臺(tái),采用 DIV2K 和 BVI-DVC 數(shù)據(jù)集,分別訓(xùn)練針對(duì) intra slice 和 inter slice 的卷積神經(jīng)網(wǎng)絡(luò)濾波器,并且訓(xùn)練不同的模型以適應(yīng)不同的 QP 點(diǎn),訓(xùn)練階段的網(wǎng)絡(luò)信息根據(jù) JVET 建議列于下表 2 中。

注意,當(dāng)訓(xùn)練 inter slice 濾波器時(shí),預(yù)測信息也被用作輸入,而在 JVET-T0088 中,它僅用于 intra slice。

超越最新視頻壓縮標(biāo)準(zhǔn)H.266,字節(jié)跳動(dòng)編碼讓視頻縮小13%

表 2。

下圖 2 給出了訓(xùn)練集和驗(yàn)證集損失函數(shù)的一個(gè)示例。

超越最新視頻壓縮標(biāo)準(zhǔn)H.266,字節(jié)跳動(dòng)編碼讓視頻縮小13%

圖 2。

實(shí)驗(yàn)結(jié)果:三個(gè)顏色分量(亮度 Y 和色度 Cb、Cr)性能增益顯著

考慮到 VTM-9.0 和 VTM-10.0 之間的微小差異,并根據(jù) JVET 定義的常規(guī)測試條件,在 VTM-9.0 上測試了字節(jié)跳動(dòng) AVG 的 DAM 技術(shù)提案,測試結(jié)果如下表 3 和表 4 所示。

結(jié)果顯示,在 RA 構(gòu)型下,Y、Cb 和 Cr 的 BD-rate 節(jié)省分別為 10.28%、28.22% 和 27.97%;在 AI 配置下,對(duì) Y、Cb 和 Cr 分別可帶來 8.33%、23.11% 和 23.55% 的 BD-rate 節(jié)省。

超越最新視頻壓縮標(biāo)準(zhǔn)H.266,字節(jié)跳動(dòng)編碼讓視頻縮小13%

表 3:AVG 提案在 VTM9.0(RA)上的性能表現(xiàn)。

超越最新視頻壓縮標(biāo)準(zhǔn)H.266,字節(jié)跳動(dòng)編碼讓視頻縮小13%

表 4:AVG 提案在 VTM9.0(AI)上的性能表現(xiàn)。

總結(jié)

實(shí)測證明,字節(jié)跳動(dòng) AVG 的這項(xiàng)視頻編碼技術(shù)創(chuàng)新,可以讓視頻的數(shù)據(jù)體積相比 H.266 最新國際標(biāo)準(zhǔn)再縮小 13%。對(duì)視頻服務(wù)商來說,存儲(chǔ)和帶寬成本將顯著降低;對(duì)用戶來說,在網(wǎng)速較慢的情況下也可以流暢觀看高清視頻。

但正如前文所述,早在 2013年正式通過的 H.265,如今還沒有完全普及。一方面,高昂的專利授權(quán)費(fèi)用導(dǎo)致生產(chǎn)硬件設(shè)備和生產(chǎn)內(nèi)容的廠商無法承擔(dān),用戶也只能買并不支持 H.265 標(biāo)準(zhǔn)的設(shè)備;另一方面,H.265 的專利收費(fèi)很復(fù)雜,想要使用 H.265 得分別多次繳專利費(fèi)。因此,目前最常見的還是 18 年前的 H.264 標(biāo)準(zhǔn)。

盡管 H.266 新一代標(biāo)準(zhǔn)的推廣還有很長的路要走,字節(jié)跳動(dòng) AVG 的技術(shù)探索并不會(huì)停止,其研究成果也會(huì)通過自主研發(fā)的 BVC 編碼器投入應(yīng)用,為抖音、西瓜視頻、今日頭條等 App 的視頻類內(nèi)容處理,以及云計(jì)算、云游戲等基礎(chǔ)架構(gòu)領(lǐng)域創(chuàng)造更高清畫質(zhì)、更流暢播放的視頻體驗(yàn)。

 

責(zé)任編輯:張燕妮 來源: 機(jī)器之心Pro
相關(guān)推薦

2021-03-01 15:51:56

AVG視頻技術(shù)

2021-11-17 13:44:31

數(shù)字化

2021-07-20 10:20:55

騰訊云音視頻超高清

2021-10-25 21:34:37

AI

2020-07-07 09:52:32

網(wǎng)絡(luò)數(shù)據(jù)技術(shù)

2009-08-29 11:03:10

2020-12-10 08:20:24

5GH.266標(biāo)準(zhǔn)通信技術(shù)

2017-05-08 10:52:09

2024-04-08 11:32:12

深度學(xué)習(xí)圖像

2024-01-11 12:45:12

AI訓(xùn)練

2024-07-05 08:27:07

2023-11-09 19:12:43

AIoTel視頻編碼

2021-08-11 15:38:28

谷歌視頻技術(shù)

2024-12-30 13:40:00

2009-08-06 08:50:27

視頻壓縮技術(shù)谷歌On2

2022-08-16 16:22:07

計(jì)算機(jī)視覺

2017-03-28 15:22:46

高清視頻
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 成年人在线视频 | 亚洲精品 在线播放 | 国产精品欧美日韩 | www.夜夜骑| 国产高清一区二区三区 | 国产97人人超碰caoprom | 久久久国产精品 | 精品一区二区三区中文字幕 | 久久精品久久精品久久精品 | 在线视频 亚洲 | 国产精品高潮呻吟久久 | 免费观看黄色片视频 | 色免费视频 | 911精品美国片911久久久 | 亚洲精品欧美 | 成人精品国产一区二区4080 | 婷婷二区 | 亚洲精品视频免费观看 | 久久久美女 | 羞羞视频网站在线观看 | 亚洲精品久久久一区二区三区 | 欧美国产日韩精品 | 欧美一区二区三区国产 | 久草视频在 | 97热在线| 日韩福利在线 | 一区二区亚洲 | 91看国产 | 亚洲九九 | 色播久久 | a级黄色片在线观看 | 亚洲草草视频 | 国产一二区视频 | 成人一级黄色毛片 | xx视频在线观看 | 人人玩人人添人人澡欧美 | 欧美精品一区二区三区视频 | 国产在线www | 国产精品一区二区欧美黑人喷潮水 | 欧美 日韩 国产 成人 在线 | 国产午夜精品理论片a大结局 |