揭秘冬奧會上的一項AI黑科技,正從神壇走向大眾
現代體育賽事是運動員之間爭分奪秒的比拼,更是賽場背后各種高科技大比武。近年來,我們看到每屆奧運會都有各種新科技亮相,不僅給人們帶來了更刺激的觀賽體驗,而且一次次幫助運動員突破身體極限,生動詮釋了“更快、更高、更強”的奧林匹克精神。
以不久前結束的北京冬奧會為例,在速度滑冰男子500米比賽中,中國隊以34秒32的成績打破奧運會紀錄,并奪得中國男子速度滑冰歷史上的首枚冬奧會金牌,那一刻真是令人熱淚盈眶,無比自豪,至今難以忘懷。
這枚來之不易的金牌背后,是運動員日復一日揮灑的汗水,也是教練員們幕后默默的專業指導和鼓勵。但你可能不知道的是,這背后還有一項AI黑科技的功勞,它一次次精準地幫助運動員們調整細微技術動作,大幅提升了訓練效率和質量。
簡單易用的“AI教練”
在過去的體育訓練模式中,教練全靠肉眼觀察運動員的表現,并憑借經驗反復對運動員的動作細節進行調整、糾正,沒有客觀、具體的量化數據分析,欠缺訓練針對性和效率。最近二十年來,為了精確了解運動員的體能狀況、動作細節以及分析對手風格、預測戰術等,數據科學逐漸被引入到體育運動中。隨著體育運動越來越依賴數據驅動,為了更好的收集數據,利用可穿戴設備收集運動員的運動數據成為一種常見方式。但這種方式的弊端是顯而易見的,將傳感器放置在高速奔跑的短跑、速滑等運動員的身體關鍵部位,不僅可能會干擾運動員的運動過程,而且成本較高。
那有沒有一種更簡單易用的方法來收集并精準分析運動數據?英特爾? 3DAT運動員追蹤技術正是在這樣的背景下應運而生的技術。據悉,從去年冬季開始,中國速度滑冰隊已在日常訓練中采用了這套技術系統。
以速度滑冰為例,該項目訓練和比賽場地空間范圍大,賽道一圈大概400米,且運動員的運動速度很高,動作幅度很大,如果每個運動員都采用可穿戴設備采集數據,必然會給運動員增加額外的負擔。同時,速度滑冰是一項技術性很強的體育項目,一個輕微的技術動作處理不當可能就會影響整個比賽結果,這要求動作捕捉系統能實時、精準生成可視化、量化的數據,以供教練和運動員參考。
而3DAT首先可以通過攝像機甚至智能手機來獲取訓練視頻樣本,無需運動員佩戴可穿戴設備,無疑為獲取運動數據開辟了一條簡單、輕量的路徑。更重要的是,其基于機器視覺和AI技術,能從拍攝的標準視頻中提取運動員的骨骼和肌肉形狀及運動軌跡,重建運動員2D及3D骨骼的運動姿態及軌跡模型,并生成生物力學數據,從而能讓教練和運動專家們精準地評估運動員在運動時的身體狀態,并進行更有針對性的指導。
具體而言,在速度滑冰項目中,起跑和直線加速階段是影響運動員成績的關鍵,也是教練員最關心的重點。在起跑階段,3DAT技術通過機器視覺和AI技術從視頻畫面中抽取和識別人體和人體關節點,生成2D骨骼,再利用場地、相機參數等信息重建三維運動姿態,并能通過生物力學算法計算出雙腳與起跑線的夾角、雙腿蹲屈的幅度、雙臂的位置、重心擺放等起跑姿勢參數集,以及包括步頻、蹬冰時間、懸空時間、地面時間、膝關節角速度、起跑角速度等各種起跑后的參數集,從而讓教練和運動專家們既能多視角回放觀看運動員的動作和姿勢,也能通過量化數據精準分析起跑姿態對速度的影響。
在直線加速階段同理,教練和運動專家們可通過3DAT生成的核心關節、膝關節、髖關節的旋轉角度和角速度,以及運動員的質心的軌跡和加速度等數據,幫助運動員分析姿態對蹬冰質量和效率的影響。
實時精準的技術底座
簡單易用的背后,通常是絕對不簡單的底層技術。不難理解,圖像包含的信息量是巨大的,要從連續多幀的視頻畫面中逐層提取出肘、踝、膝、肩關節等關節點的位置信息,對計算能力的要求是非常高的。而在平時訓練中,教練員往往要求即時采集、即時生成數據,以即時調整技術細節,這對計算能力和AI算法又提出了更高的要求。
據悉,3DAT技術不僅支持1080P、4K等畫質,還能以160fps的幀速率解碼,支持多路視頻的同步采集以及多路視頻在后續數據處理過程中的同步處理、多路視頻生成3D姿態數據等;并能實現高精度數據生成,測量誤差可低至5毫米級別,角度誤差可控制在7-8度左右;在實際應用中,還可在訓練現場即時生成3D數據和生物力學數據。
那這些能力背后有著怎樣的底層技術支撐呢?
首先,英特爾? 至強? 可擴展平臺可實時處理、校驗、統計和分析復雜而龐大的訓練數據信息,確保了3DAT系統的及時性。
第三代英特爾? 至強? 可擴展處理器相比上一代產品性能提升高達46%,支持8通道DDR4/3200, 64條PCI EXPRESS 4.0通道,全面增強I/O吞吐量,為信息量巨大、實時性和精準度要求高的圖形、影像處理和3D建模、數據分析,提供了堅實的基礎。英特爾? 傲騰? 技術提供充足的數據存儲容量的同時,可憑借低時延特性確保數據處理效率。英特爾? Scalable Video Technology可在不損失圖像質量的前提下大幅提升視頻編碼效率,從而能確保視頻播放和報告生成的低時延。
其次,3DAT基于英特爾OpenVINO視覺工具套件進行開發,基于英特爾? 至強? 集成了AI加速技術,能讓視頻數據讀取、預處理、缺失幀修復、運動數據生成等圖像處理更精準、高效,測量達像素級精度,也顯著提升了深度學習推理和訓練的性能,能讓模型生成更高效、更精準,推理執行速度大幅提升。
此外,3DAT還具有易部署、易實施的特點。基于云/邊、端協同,通常在現場只需部署2-4臺攝像設備,甚至在條件有限的情況下采用隨身攜帶的智能手機,就能采集視頻樣本,再將視頻上傳到云端/邊緣,通過基于英特爾至強處理器的服務器進行高速處理,可近乎實時地向教練和運動員反饋分析結果。
走出奧運,普惠大眾
簡單的講,3DAT技術最顯著的特征就是通過機器視覺和AI算法替代了那些放置于運動員身體上的傳感器,具備簡單易用、采集范圍大、易部署等優勢,并基于英特爾? 至強? 可擴展平臺可實現實時、精準的數據分析處理,從而降低動作捕捉技術的門檻。而由于AI模型可擴展可訓練,它還易于移植到更多體育比賽項目,以及藝術表演、健身、運動康復等廣泛的領域,進而走向普惠大眾之路。
比如在北京冬奧會開幕式上的《致敬人民》和《雪花》兩個節目中,英特爾基于3DAT技術,聯合第三方專業團隊定制開發了“基于人工智能技術的演出實時特效系統”,通過高效部署多個人體檢測AI模型和算法調整,僅用4臺攝像機就完成了上百名演員的精準人體識別,及大范圍內的人體精準定位,并實現了從圖像采集、識別、檢測到處理全過程不到幾十毫秒的端到端時延,最終打造出現場屏幕與演員位移實時互動的效果,為觀眾呈現了一場科技與藝術完美融合的視覺盛宴。
不難想象,既然這項技術能應用于冬奧會訓練和開幕式表演這樣的頂級場景,自然將其下沉應用于健身、運動康復等領域也不在話下。比如,健身教練可隨時隨地將學員的訓練視頻上傳到云端,即時獲取生成的3D骨骼和相關數據,為學員提供正確的鍛煉方式指導;俱樂部或教練員可通過收集的視頻數據來評估球員的技能和運動潛力,以低成本、高精準的方式進行運動員選材。進一步擴展想象, AR/VR系統的一個重要組成部分是重建用戶的3D姿態,3DAT自然能與AR/VR技術結合,為我們打造出各種全新的沉浸式、互動式娛樂體驗,甚至加速推動虛擬世界和現實世界的無縫融合,助力人類邁入元宇宙時代......
值得一提的是,為了讓更多項目能使用到這一技術,更好的賦能產業,英特爾還與AWS合作部署了3DAT Cloud SDK,通過開放API可讓開發者、使用者、ISV伙伴們根據自身不同需求,在AWS云上快速實現二次開發和應用部署。相信這將進一步加速該技術普及,為未來的體育訓練和比賽乃至更多的領域帶來更大的變化。
本文參考來源:
北京冬奧一項AI黑科技即將走進大眾:實時動捕三維姿態,誤差不到5毫米,量子位https://mp.weixin.qq.com/s/T62uhROO1ZViyNENTh7wzg
3DAT助力冬奧開幕式及賽前訓練:這究竟是什么「神秘黑科技」?,機器之心https://mp.weixin.qq.com/s/2lQTQiMU5xJsDtxA04h7Xw
北京2022年冬奧開幕式:科技美學詮釋奧運精神,英特爾中國