成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

寶可夢GO「偷家」李飛飛空間智能?全球最強3D地圖誕生,150萬億參數(shù)解鎖現(xiàn)實邊界

人工智能 新聞
5年,5000萬個神經(jīng)網(wǎng)絡,這個世界從未被掃描過的角落,我們都能看到了。寶可夢GO團隊,竟然搶先實現(xiàn)了李飛飛的「空間智能」?而「Pokémon Go」的玩家可能沒想到,自己居然在訓練著一個巨大的AI模型。

李飛飛提出的「空間智能」概念,被寶可夢GO團隊搶先實現(xiàn)了?

最近,寶可夢GO團隊宣布,構建出了一個大規(guī)模地理空間模型LGM,讓我們距離空間智能更近了一步。

而這一成果也意味著,人類在空間計算和AR眼鏡領域,即將進入嶄新的時代。

圖片

作為Niantic視覺定位系統(tǒng)(VPS)的一部分,團隊訓練了超過5000萬個神經(jīng)網(wǎng)絡,參數(shù)規(guī)模超過150萬億。

我們可以把LGM想象成一張為計算機準備的超級智能地圖,不過,它卻能以與人類類似的方式理解空間。

憑借這種對世界的強大3D理解能力,LGM能夠非常智能地「填補空白」,甚至包括那些地球上人類尚未全面掃描的領域!

圖片

可以說是,讓AI終于長出了眼睛

從此,LGM將使計算機不僅能感知和理解空間,還能以新的方式與之互動,這就意味著AR眼鏡和機器人、內容創(chuàng)建、自主系統(tǒng)等領域將迎來全新的突破。

隨著我們從手機轉向與現(xiàn)實世界相連的可穿戴技術,空間智能,將成為未來世界的操作系統(tǒng)!

圖片

全球數(shù)百萬個場景,通過AI相連

這個大規(guī)模地理空間模型的概念,是利用大規(guī)模機器學習理解場景,然后它就會與全球數(shù)百萬個其他場景相連。

你是否曾有這樣的感覺?

看到一種熟悉的建筑,比如教堂、雕像或城鎮(zhèn)廣場,我們很容易想象它從其他角度看起來是什么樣子,即使這些角度我們從未見過。

圖片

這,就是我們人類獨有的「空間理解」功能,它意味著,我們可以根據(jù)以前遇到的無數(shù)相似場景來填補這些細節(jié)。

但這種能力對于機器來說,卻是難如登天。

即使當今最先進的AI模型,也難以推斷出場景中缺失的部分、將其可視化,或者想象出一個地方從全新的角度看起來是什么樣子。

如今,LGM打破了AI的這種限制!

這套由寶可夢GO團隊訓練出的神經(jīng)網(wǎng)絡,可以在超過100萬個地點進行操作。

每個本地網(wǎng)絡,都會為全球大模型做出貢獻,實現(xiàn)對地理位置的貢獻理解,包括那些尚未掃描的地方。

圖片

什么是大規(guī)模地理空間模型

我們都知道,LLM是通過在互聯(lián)網(wǎng)規(guī)模的文本集合上進行訓練后,從而理解和生成書面語言。

這種方式,挑戰(zhàn)了我們對「智能」的理解。

同樣,大規(guī)模地理空間模型也是以一種同樣先進的方式,幫助計算機感知、理解物理世界,為之導航。

跟LLM類似,它同樣是通過大量原始數(shù)據(jù)構建的——

數(shù)十億張全球各地的圖像,全部錨定在地球上的精確位置,被提煉成一個大模型,讓計算機能夠基于位置去理解空間、結構和物理交互。

從基于文本的模型向基于3D數(shù)據(jù)的模型的轉變,也揭示出近年來AI發(fā)展的一條軌跡:從理解和生成語言,到解釋和創(chuàng)建靜態(tài)和動態(tài)圖像(2D視覺模型),再到對物體的3D外觀進行建模(3D視覺模型)。

圖片

而現(xiàn)在,地理空間模型甚至比3D視覺模型更進一步,因為它們捕捉的是根植于特定地理位置、并且具有度量特性的3D實體。

與典型的生成式3D模型不同,大規(guī)模地理空間模型綁定到了度量空間,因而能夠以尺度度量單位進行精確的估算,而前者生成的,只是未縮放的資產。

因此,這些實體代表的是下一代地圖,而非任意的3D資產。

雖然3D視覺模型也能創(chuàng)建和理解3D場景,但地理空間模型卻理解該場景如何與全球數(shù)百萬其他場景在地理上相關聯(lián)。

它實現(xiàn)了一種地理空間智能,讓模型從其先前的觀察中學習,然后還能將知識轉移到新的位置,即使這些位置只是被部分觀察到的。

圖片

現(xiàn)在,帶有3D圖形的AR眼鏡距離大規(guī)模市場化還有幾年時間,但地理空間模型已經(jīng)有機會與純音頻或2D顯示的眼鏡集成了!

想象一下,這些模型可以引導我們穿越世界,回答問題,提供個性化推薦,提供導航,甚至增強我們與現(xiàn)實世界的互動。

而且,它還可以集成LLM,讓理解和空間融合在一起,讓人們能更加了解自己周邊的環(huán)境和社區(qū),并且與之互動。

這種地理空間智能還能生成和操縱世界的3D表示,構建下一代AR體驗。

除了游戲之外,在空間規(guī)劃和設計、物流、觀眾互動和遠程協(xié)作上,大規(guī)模地理空間模型都將具有無限的潛力。

5000萬個神經(jīng)網(wǎng)絡,詳細了解整個世界

為了構建視覺定位系統(tǒng)VPS,Niantic團隊已經(jīng)花費了五年。

這個系統(tǒng)僅利用手機上的單張圖像,就能讓用戶在團隊的游戲和Scaniverse中有趣的地點構建3D地圖,從而確定其位置和方向。

有了VPS,用戶就可以以厘米級的精度,在世界中定位自己!

這就意味著,他們可以精確而真實地看到放置到物理環(huán)境中的數(shù)字內容。

這些內容是持久的,即使你離開后,它們仍然會留在原地,還能與他人共享。

圖片

比如,團隊最近在Pokémon GO中推出了一項名為Pokémon Playgrounds的實驗功能,讓用戶在特定位置上放置寶可夢,將它們留在原地,供其他人查看和互動

所以,VPS是怎樣創(chuàng)建出對世界如此高度詳細的理解呢?

原來,Niantic的VPS都是通過用戶掃描構建的。

這些用戶會通過不同的視角拍攝,并且還會在一天中的不同時間,以及多年來的多次拍攝,同時附有定位信息,從而創(chuàng)建出了對世界高度詳細的理解。

這些數(shù)據(jù)是獨一無二的,因為它們是從行人視角獲取,包括了汽車無法到達的地方。

圖片

如今團隊已經(jīng)在全球范圍內擁有1000萬個掃描地點,其中超過100萬個已激活,可供VPS使用了。

而且,團隊每周還在接收約100萬次新的掃描,每次掃描都包含數(shù)百張獨立的圖像。

作為VPS的一部分,團隊使用運動結構技術構建經(jīng)典的3D視覺地圖,同時也為每個地點構建了一種新型的神經(jīng)地圖。

這些神經(jīng)模型基于ACE(2023)和ACE Zero(2024)這兩篇論文,不再使用經(jīng)典的3D數(shù)據(jù)結構來表示位置,而是將它們隱式編碼在神經(jīng)網(wǎng)絡的可學習參數(shù)中。

這些網(wǎng)絡可以快速地將數(shù)千張地圖圖像壓縮成精簡的神經(jīng)表示。

給定一張新的查詢圖像,它們以厘米級的精度,對這個位置進行精確定位。

Niantic訓練的超過5000萬個神經(jīng)網(wǎng)絡中,多個網(wǎng)絡都可以為單個位置做貢獻。

所有這些網(wǎng)絡結合起來后,總共包含了超過150萬億個通過機器學習優(yōu)化的參數(shù)。

圖片

超越本地模型,讓空間理解更宏大

而且,團隊還有一個宏偉的愿景。

雖然當前的神經(jīng)地圖,已經(jīng)是一個比較龐大的地理空間模型了,但他們想做的,是一個超越獨立本地地圖系統(tǒng)的更大規(guī)模的模型。

完全本地化的模型,可能無法完整覆蓋各自的位置,無論在全球范圍內有多少可用數(shù)據(jù),局部上它們都是稀疏的。

局部模型的失敗之處就在于,它無法超出已經(jīng)看到的內容和位置進行推斷。因此,本地模型只能定位與訓練過的視圖相似的相機視圖。

現(xiàn)在 ,想象一下我們正站在一個教堂后面。

如果本地模型只見過教堂的前門,它是無法告訴你的準確位置的,因為它從未見過教堂的背面。

但是在全球范圍內,我們卻見過數(shù)以千計的教堂,它們都是由其他地方的本地模型捕獲。雖然沒有哪座教堂完全相同,但許多教堂有共同的特征。

圖片

LGM用的正是訪問這些分布式知識的方法。

它可以提煉出全球大規(guī)模模型中的共同信息,在本地模型之間實現(xiàn)通信和數(shù)據(jù)共享。

它可以內化教堂的概念,并且進一步理解這些建筑是如何構造的。

即使對于某個特定位置只繪制了教堂入口的地圖,LGM也能夠根據(jù)之前見過的數(shù)千座教堂,對教堂的背面做出明智的猜測。

圖片

因此,即使是VPS從未見過的視點和角度,LGM也能在定位中實現(xiàn)前所未有的魯棒性。

可以說,全球模型實現(xiàn)了對世界的集中理解,而且完全是源自地理空間和視覺數(shù)據(jù)。通過全球插值,它能進行局部推斷。

讓AI像人一樣理解

上述過程,類似于人類感知和想象世界的方式。

對于人類來說,即使是從不同的角度,也能自然而然地識別出我們以前見過的東西。

想象在歐洲老城蜿蜒街道中漫步,你依然能輕而易舉地找到返回的路。

圖片

這看似理所當然的能力,背后蘊含著驚人的復雜性。尤其是,對于機器視覺技術來說極其困難。

AI若想擁有類人的理解力,便需要了解一些自然法則:

世界由固體物質組成的物體構成,因此有正面和背面。外觀會根據(jù)一天中的時間和季節(jié)而變化。

同時,這也需要相當多的文化知識:許多人造物體的形狀遵循特定的對稱規(guī)則或其他通用布局類型——通常取決于地理區(qū)域。

早期的計算機視覺研究試圖解讀其中的一些規(guī)則以便將其硬編碼到手工制作的系統(tǒng)中。

但現(xiàn)在,科學家們意識到,我們所追求的這種高度理解實際上只能通過大規(guī)模機器學習來實現(xiàn)。

這正是LGM所追求的目標。

在Niantic聯(lián)手牛津大學的最新研究論文MicKey中,首次看到了從數(shù)據(jù)中出現(xiàn)的令人印象深刻的相機定位能力。

圖片

論文地址:https://arxiv.org/pdf/2404.06337

MicKey是一個神經(jīng)網(wǎng)絡,能夠在劇烈的視點變化下將兩個相機視圖相對定位。

圖片

MicKey甚至可以處理需要人類花費一些努力才能弄清楚的對立鏡頭。

更令人興奮的是,MicKey僅使用很少的訓練數(shù)據(jù),就取得了這樣的成就。

MicKey限制于雙視圖輸入,并在相對較少的數(shù)據(jù)上進行了訓練,但它仍然是關于LGM潛力的概念驗證。

顯然,要實現(xiàn)高級空間智能,還需要海量的地理空間數(shù)據(jù)。

而Niantic的獨特優(yōu)勢在于,每周都會收集超100萬用戶貢獻的真實世界地點掃描。

圖片

多模型互補,重定義空間智能未來

LGM絕不僅僅是一個簡單的定位模型。

為了很好地解決定位問題,LGM必須將豐富的幾何、外觀和文化信息編碼到場景級特征中。這些特征將啟用場景表示、操控和創(chuàng)造的新方式。

可以想象出,一個能夠「理解」場景的智能系統(tǒng),不僅能定位,還能感知周圍環(huán)境深層次特征。

像LGM這樣多功能大型AI模型,因其對多種下游應用的實用性,通常被稱為「基礎模型」。

未來的智能體系統(tǒng),不再是孤立的存在,不同類型的基礎模型將相互補充。

LLM將與多模態(tài)模型互動,而后者又與LGM進行通信。這些系統(tǒng)協(xié)同工作,以單一模型無法實現(xiàn)的方式理解世界。

這種互聯(lián)是空間計算的未來——智能系統(tǒng)能夠感知、理解并對物理世界采取行動。

圖片

隨著邁向更具擴展性的模型,Niantic目標仍然是引領大規(guī)模地理空間模型的發(fā)展,創(chuàng)造前所未有的用戶體驗。

除了游戲,大規(guī)模地理空間模型將在空間規(guī)劃與設計、物流、受眾參與和遠程協(xié)作等方面有廣泛的應用。

LGM代表著AI進化的有一個里程碑。

隨著AR眼鏡等可穿戴設備變得更加普及,我們正邁向一個由物理和數(shù)字現(xiàn)實無縫融合的未來。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-02-17 07:30:00

圖像生成AI智能

2024-12-03 08:23:53

2024-12-03 15:47:00

2024-12-13 14:20:00

AI模型訓練

2025-06-03 14:14:59

智能技術AI

2024-11-11 08:30:00

2024-08-07 13:00:00

2025-03-24 08:40:00

2012-03-22 21:37:25

2025-07-02 18:15:02

李飛飛AGI智能

2017-07-21 11:28:57

前端Threejs3D地圖

2024-12-03 10:15:00

2013-05-31 15:48:44

Atheer增強現(xiàn)實D11

2013-05-02 14:26:33

3D

2024-05-06 07:10:00

李飛飛智能空間

2018-03-28 09:18:35

CITE智能制造3D打印館

2024-12-05 09:53:18

智能體AI

2012-06-07 09:57:13

Android版Goo

2011-05-07 13:57:07

索尼JVC3D

2020-06-09 16:55:49

阿里云分布式數(shù)據(jù)庫
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日本一道本 | 欧美最猛黑人xxxⅹ 粉嫩一区二区三区四区公司1 | 99久久精品国产一区二区三区 | 久久久精品网 | 亚洲永久 | 国产黄色精品在线观看 | 日产精品久久久一区二区福利 | 九九久久精品视频 | 美女黄视频网站 | 特黄特色大片免费视频观看 | 人人爱干| 一区精品视频在线观看 | 免费看黄色片 | 国产精品日韩一区二区 | xnxx 日本免费 | 国产免费一区二区 | 亚洲欧美一区二区三区在线 | 久久这里只有精品首页 | 国产精品高潮呻吟久久 | 国产精品欧美精品日韩精品 | 黄色毛片在线观看 | 欧美日韩在线精品 | 日本 欧美 国产 | 久久久久久中文字幕 | 视频一区在线播放 | 精品久久国产老人久久综合 | 天天综合干 | 久久久久久久久久久爱 | 午夜视频在线 | 国产精品久久久久久久久免费软件 | av一区二区三区在线观看 | 情侣酒店偷拍一区二区在线播放 | 国产精品久久久久婷婷二区次 | 黄色毛片免费看 | 凹凸日日摸日日碰夜夜 | 国产乱码精品一区二区三区五月婷 | 91视频www.| 91免费福利视频 | 国产精品99久久久久久www | 中文字幕 欧美 日韩 | 成人免费视频网站在线看 |