成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

新聞 人工智能
插幀、過擬合、語義感知、GAN……你想過這些“腦洞”或AI算法,也能被用到編解碼器上面嗎?

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

用AI搞視頻編解碼器,現在路子有點“野”。

插幀、過擬合、語義感知、GAN……你想過這些“腦洞”或AI算法,也能被用到編解碼器上面嗎?

例如,原本的算法每幀壓縮到16.4KB后,樹林開始變得無比模糊:

但在用上GAN后,不僅畫面更清晰,每幀圖像還更小了,只需要14.5KB就能搞定!

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

又例如,用插幀的思路結合神經編解碼器,能讓最新壓縮算法效果更好……

這一系列算法的思路,背后究竟是什么原理,用AI搞編解碼器,潛力究竟有多大?

我們采訪了高通工程技術副總裁、高通AI研究方向負責人侯紀磊博士,了解了高通一些AI編解碼器中的算法細節和原理。

編解碼器標準逐漸“內卷”

當然,在了解AI算法的原理之前,需要先了解視頻到底是怎么壓縮的。

如果不壓縮,1秒30幀、8bit單通道色深的480p視頻,每秒就要傳輸80+Mbps數據,想在網上實時看高清視頻的話,幾乎是不可能的事情。

目前,主要有色度子采樣、幀內預測(空間冗余)和幀間預測(時間冗余)幾個維度的壓縮方法。

色度子采樣,主要是基于我們眼睛對亮度比對顏色更敏感的原理,壓縮圖像的色彩數據,但視覺上仍然能保持與原圖接近的效果。

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

幀內預測,利用同一幀中的大片相同色塊(下圖地板等),預測圖像內相鄰像素的值,得出的結果比原始數據更容易壓縮。

[[427514]]

幀間預測,用來消除相鄰幀之間大量重復數據(下圖的背景)的方法。利用一種名叫運動補償的方法,用運動向量(motion vector)和預測值計算兩幀之間像素差:

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

這些視頻壓縮的方法,具體到視頻編解碼器上,又有不少壓縮工作可以進行,包括分區、量化、熵編碼等。

然而,據侯紀磊博士介紹,從H.265到H.266,壓縮性能雖然提升了30%左右,但這是伴隨著編碼復雜度提高30倍、解碼復雜度提高2倍達成的。

這意味著編解碼器標準逐漸進入了一個“內卷”的狀態,提升的壓縮效果,本質上是用編解碼器復雜度來交換的,并不算真正完成了創新。

因此,高通從已有壓縮方法本身的原理、以及編解碼器的構造入手,搞出了幾種有意思的AI視頻編解碼方法。

3個方向提升壓縮性能

具體來說,目前的AI研究包括幀間預測方法、降低解碼復雜度和提高壓縮質量三個方向。

“預判了B幀的預判”

從幀間預測來看,高通針對B幀編解碼提出了一種新思路,論文已經登上ICCV 2021。

I幀:幀內編碼幀(intra picture)、P幀:前向預測編碼幀(predictive-frame)、B幀:雙向預測內插編碼幀(bi-directional interpolated prediction frame)

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

目前的編解碼大多集中在I幀(幀內預測)和P幀上,而B幀則是同時利用I幀和P幀的雙向運動補償來提升壓縮的性能,在H.265中正式支持(H.264沒有)。

雖然用上B幀后,視頻壓縮性能更好,但還是有兩個問題:

一個是視頻需要提前加載(必須提前編碼后面的P幀,才能得到B幀);另一個是仍然會存在冗余,如果I幀和P幀高度相關,那么再用雙向運動補償就顯得很浪費。

打個比方,如果從I幀→B幀→P幀,視頻中只有一個球直線運動了一段距離,那么再用雙向運動補償的話,就會很浪費:

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

這種情況下,用插幀似乎更好,直接通過時間戳就能預測出物體運動的狀態,編碼計算量也更低。

但這又會出現新的問題:如果I幀和P幀之間有個非常大的突變,例如球突然在B幀彈起來了,這時候用插幀的效果就很差了(相當于直接忽略了B幀的彈跳)。

因此,高通選擇將兩者結合起來,將基于神經網絡的P幀壓縮和插幀補償結合起來,利用AI預測插幀后需要進行的運動補償:

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

別說,效果還確實不錯,比谷歌之前在CVPR 2020上保持的SOTA紀錄更好,也要好于當前基于H.265標準實現開源編解碼器的壓縮性能。

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

除此之外,高通也嘗試了一些其他的AI算法。

用“過擬合”降低解碼復雜度

針對編解碼器標準內卷的情況,高通也想到了用AI做自適應算法,來像“過擬合”一樣根據視頻比特流更新一個模型的權重增量,已經有相關論文登上ICLR 2021。

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

這種方法意味著針對單個模型進行“過擬合”,對比特流中的權重增量進行編碼,再與原來的比特流進行一個比較。如果效果更好的話,就采用這種傳輸方式。

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

事實證明,在不降低壓縮性能的情況下,這種方法能將解碼復雜度降低72%,同時仍然保持之前B幀模型達到的SOTA結果。

當然,除了視頻壓縮性能以外,單幀圖像被壓縮的質量也需要考慮,畢竟視覺效果也是視頻壓縮追求的標準之一。

用語義感知和GAN提高壓縮質量

用語義感知和GAN的思路就比較簡單了。

語義感知就是讓AI基于人的視覺來考慮,選出你在看視頻時最關注的地方,并著重那部分的比特分配情況。

例如你在看網球比賽時,往往并不會關注比賽旁邊的觀眾長什么樣、風景如何,而是更關注球員本身的動作、擊球方法等。

那么,就訓練AI,將更多的比特放到目標人物身上就行,像這樣:

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

從結構上來講也比較簡單,也就是我們常見的語義分割Mask(掩膜):

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

這種方法能很好地將受關注的局部區域幀質量提升,讓我們有更好的觀看效果,而不是在視頻被壓縮時,看到的整幅圖像都是“打上馬賽克”的樣子。

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

據高通表示,這種語義感知的圖像壓縮,目前已經在擴展到視頻壓縮上了,同樣是關注局部的方法,效果也非常不錯。

而基于GAN的方法,則更加致力于用更少的比特數生成視覺效果同樣好的圖像質量:

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

據高通表示,數據集來自CVPR中一個針對圖像壓縮的Workshop CLIC,提供了大約1600張的高清圖片,利用自研的模型,能在上面訓練出很好的效果:

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

也就是開頭的圖片效果,即使在大小被壓縮后,基于GAN的圖像還是能取得更好的視覺質量:

用AI打破編解碼器內卷,高通最新幾篇頂會論文腦洞有點大

期待這些技術能馬上應用到手機等設備上,讓我們看視頻的時候真正變得不卡。

相關論文:
[1]https://arxiv.org/abs/2104.00531
[2]https://arxiv.org/abs/2101.08687

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2021-08-03 08:38:21

Netty解碼器使用

2021-07-13 09:27:20

AI 解碼視頻

2024-07-05 08:27:07

2021-04-07 13:52:57

GoogleLyra編譯器

2022-10-10 10:38:22

FedoraopenSUSE視頻編解碼

2021-12-25 16:20:38

微軟WindowsWindows 10

2020-02-19 19:15:27

UbuntuLinux媒體編解碼器

2023-06-20 08:34:33

SVT-AV1開源

2020-10-10 15:22:33

Windows 功能系統

2021-10-08 09:38:57

NettyChannelHand架構

2022-02-15 21:42:23

嵌入式系統音頻編解碼器開發

2021-08-18 10:41:24

GoogleSoundStream神經網絡

2023-07-26 16:31:09

Windows 10Windows 11微軟

2021-04-22 11:21:03

Windows 10Windows微軟

2024-02-28 08:22:07

2023-07-05 11:16:59

2025-04-10 10:15:30

2021-08-11 10:03:07

iOS 14.8蘋果iOS 15

2021-08-20 13:12:18

Google 開源技術
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: av片网| 亚洲网站在线观看 | 亚洲人成在线播放 | 99av成人精品国语自产拍 | 欧美jizzhd精品欧美巨大免费 | 欧美一区二区三区的 | 亚洲一区二区不卡在线观看 | 国产成人午夜高潮毛片 | 欧美 日韩 中文 | 欧美一区二区三区在线看 | 国产有码 | 欧美美乳| 亚洲精品中文字幕av | 毛片网站免费观看 | 日韩中文一区二区三区 | 国产精品一区久久久 | 中国美女av | 久色视频在线 | av一区二区三区四区 | 91精品国产一区二区三区蜜臀 | 韩三级在线观看 | 香蕉av免费 | 天天操操 | 国产精品视频久久久 | 亚洲www.| 视频一区二区三区中文字幕 | 国产一区二区久久 | 国产精品久久久久久福利一牛影视 | 99视频免费 | 国产精品久久久久久中文字 | 久久久av | 97成人在线| 国产999精品久久久久久绿帽 | 久久久久久久久国产成人免费 | 99精品一区 | 亚洲一区二区三区在线播放 | 久久精品青青大伊人av | 亚洲一区二区三区久久 | 日韩av一区二区在线 | 成年人黄色一级毛片 | 99婷婷 |