成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌AI良心開源:一部手機就能完成3D目標檢測,還是實時的那種

新聞 人工智能
在2D圖像中做3D目標檢測很難?現在,拿著一部手機就能做到,還是實時的那種。這就是谷歌AI今天發布的MediaPipe Objectron,一個可以實時3D目標檢測的pipeline。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

在2D圖像中做3D目標檢測很難?

現在,拿著一部手機就能做到,還是實時的那種。

這就是谷歌AI今天發布的MediaPipe Objectron,一個可以實時3D目標檢測的pipeline。

分開來看:

MediaPipe是一個開源的跨平臺框架,用于構建pipeline來處理不同模式的感知數據。

Objectron在移動設備上實時計算面向對象的3D邊界框。

日常生活中的物體,它都可以檢測,來看下效果。

谷歌AI良心開源:一部手機就能完成3D目標檢測,還是實時的那種

它可以在移動端設備上,實時地確定物體的位置、方向和大小。

谷歌AI良心開源:一部手機就能完成3D目標檢測,還是實時的那種

這個pipeline檢測2D圖像中的物體,然后通過機器學習模型,來估計它的姿態和大小。

那么,它具體是怎么做到的呢?

獲取真實世界中的3D數據

我們知道,3D數據集相對于2D來說,非常有限。

為了解決這個問題,谷歌AI的研究人員使用移動增強現實(AR)會話數據(session data),開發了新的數據pipeline。

目前來說,大部分智能手機現在都具備了增強現實的功能,在這個過程中捕捉額外的信息,包括相機姿態、稀疏的3D點云、估計的光照和平面。

為了標記groud truth數據,研究人員構建了一個新的注釋工具,并將它和AR會話數據拿來一起使用,能讓注釋器快速地標記對象的3D邊界框。

這個工具使用分屏視圖來顯示2D視頻幀,例如下圖所示。

左邊是覆蓋的3D邊界框,右邊顯示的是3D點云、攝像機位置和檢測平面的視圖。

谷歌AI良心開源:一部手機就能完成3D目標檢測,還是實時的那種

注釋器在3D視圖中繪制3D邊界框,并通過查看2D視頻幀中的投影來驗證其位置。

對于靜態對象,只需要在單幀中注釋一個對象,并使用來自AR會話數據的ground truth攝像機位姿信息,將它的位置傳播到所有幀。

這就讓該過程變得非常高效。

AR合成數據生成

為了提高預測的準確性,現在比較流行的一種方法,就是通過合成的3D數據,來“填充”真實世界的數據。

但這樣往往就會產生很不真實的數據,甚至還需要大量的計算工作。

谷歌AI就提出了一種新的方法——AR合成數據生成 (AR Synthetic Data Generation)。

這就允許研究人員可以利用相機的姿勢、檢測到的平面、估計的照明,來生成物理上可能的位置以及具有與場景匹配的照明位置 。

這種方法產生了高質量的合成數據,與真實數據一起使用,能夠將準確率提高約10%。

谷歌AI良心開源:一部手機就能完成3D目標檢測,還是實時的那種

用于3D目標檢測的機器學習pipeline

為了達到這個目的,研究人員建立了一個單階段的模型,從一個RGB圖像預測一個物體的姿態和物理大小。

模型主干部分有一個基于MobileNetv2的編碼器-解碼器架構。

谷歌AI良心開源:一部手機就能完成3D目標檢測,還是實時的那種

還采用一種多任務學習方法,通過檢測和回歸來共同預測物體的形狀。

對于形狀任務,根據可用的ground truth注釋(如分割)來預測對象的形狀信號;對于檢測任務,使用帶注釋的邊界框,并將高斯分布擬合到框中,以框形質心為中心,并與框的大小成比例的標準差。

檢測的目標是預測這個分布,它的峰值代表了目標的中心位置。

回歸任務估計邊界框8個頂點的2D投影。為了獲得邊界框的最終3D坐標,還利用了一個成熟的姿態估計算法(EPnP),可以在不知道物體尺寸的前提下恢復物體的3D邊界框。

有了3D邊界框,就可以很容易地計算出物體的姿態和大小。

谷歌AI良心開源:一部手機就能完成3D目標檢測,還是實時的那種

這個模型也是非常的輕量級,可以在移動設備上實時運行。

在MediaPipe中進行檢測和跟蹤

在移動端設備使用這個模型的時候,由于每一幀中3D邊界框的模糊性,模型可能會發生“抖動”。

為了緩解這種情況,研究人員采用了最近在“2D界”發布的檢測+跟蹤框架。

這個框架減少了在每一幀上運行網絡的需要,允許使用更大、更精確的模型,還能保持在pipeline上的實時性。

為了進一步提高移動pipeline的效率,每隔幾幀只讓運行一次模型推斷。

谷歌AI良心開源:一部手機就能完成3D目標檢測,還是實時的那種

最后,這么好的項目,當然已經開源了!

戳下方傳送門鏈接,快去試試吧~

傳送門

GitHub項目地址:
https://github.com/google/mediapipe/blob/master/mediapipe/docs/objectron_mobile_gpu.md

谷歌AI博客:
https://ai.googleblog.com/2020/03/real-time-3d-object-detection-on-mobile.html

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-12-11 12:48:12

模型訓練

2023-01-09 13:08:45

AI

2020-12-23 18:06:33

Vlog華為Nova8

2022-07-06 14:26:35

數據采集3D

2021-09-14 10:11:46

谷歌3D舞蹈生成模型FACT

2012-05-05 09:02:27

手機

2020-02-05 11:15:24

谷歌Android開發者

2022-12-15 21:59:56

AIVR場景

2021-03-08 15:40:46

開源技術 軟件

2021-12-16 22:51:03

手機功能定位

2015-12-28 10:32:14

5G4G

2020-08-20 11:14:19

高德地圖AR駕車新版本

2021-10-15 14:10:41

手機電腦技術

2022-12-29 11:57:43

3D框架

2020-03-19 10:31:14

AI 數據人工智能

2012-08-13 17:11:37

Silverlight

2023-10-09 09:42:18

自動駕駛模型

2011-07-28 09:07:52

創富Android谷歌

2019-08-21 20:08:34

人工智能手勢識別谷歌

2023-12-07 13:07:59

3D模型訓練
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品免费在线 | 免费国产一区二区视频 | 99久久国产精 | 农村妇女毛片精品久久久 | 久久精品一区 | 天堂影院av | 欧美性受xxxx | 婷婷色在线 | 一级黄a视频| 韩国av影院| 欧美精品一区三区 | 亚洲免费观看视频网站 | 亚洲一区免费视频 | 国产精品一区在线 | 国产精品美女久久久久久免费 | 国产精品美女久久久久久不卡 | 有码一区 | 亚洲欧美在线视频 | 中国91av | 风间由美一区二区三区在线观看 | 国产精品久久久久久久免费大片 | 国产一区免费视频 | 久久精品a级毛片 | 免费观看色 | 婷婷一级片 | a黄视频| 成人精品视频在线 | 天天天天操 | 偷拍自拍在线观看 | 在线观看成人精品 | 国产美女精品 | 中文天堂在线一区 | 免费在线观看成人 | 婷婷二区 | 成年人国产在线观看 | 国产激情在线看 | 亚洲日本欧美 | 国产区一区二区三区 | 91视在线国内在线播放酒店 | 亚洲一区二区中文字幕 | 国产成人精品免费 |