成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌要把2.5萬工程師變成機(jī)器學(xué)習(xí)專家

大數(shù)據(jù)
由于看好機(jī)器學(xué)習(xí)技術(shù)的未來,谷歌為內(nèi)部員工和外部人員提供各種各樣的培訓(xùn),希望加速這種技術(shù)的普及速度。而公司的目標(biāo),是將內(nèi)部2.5萬名工程師全部轉(zhuǎn)變成為機(jī)器學(xué)習(xí)領(lǐng)域的專家。

卡森·霍爾蓋特(Carson Holgate)正在接受忍者培訓(xùn)。

但這里的忍者指的并不是武術(shù)——她已經(jīng)有不錯的武術(shù)功底。26歲的霍爾蓋特是空手道黑帶二段。現(xiàn)在的培訓(xùn)重點是算法。霍爾蓋特幾周前加入這個項目,她希望借此掌握機(jī)器學(xué)習(xí)方面的技能,這是一種比身體對抗更加強(qiáng)大的技術(shù)。作為谷歌Android部門的一名工程師,霍爾蓋特是參加今年忍者學(xué)習(xí)項目的18名程序員之一。該項目從各個團(tuán)隊招收有才華的程序員,向他們傳授人工智能技術(shù),以便提升其產(chǎn)品的智能性——盡管這有可能讓他們開發(fā)的軟件更加難以理解。

[[168992]]

▲正在接受機(jī)器學(xué)習(xí)“忍者訓(xùn)練”的谷歌工程師卡森·霍爾蓋特。

“該項目的標(biāo)語是:你想成為一名機(jī)器學(xué)習(xí)忍者嗎?”谷歌內(nèi)部機(jī)器學(xué)習(xí)產(chǎn)品經(jīng)理克里斯汀·羅伯森(Christine Robson)說,她負(fù)責(zé)管理這個項目,“所以我們從谷歌各個部門招收人員,用6個月的時間為他們提供機(jī)器學(xué)習(xí)培訓(xùn)。讓他們跟著導(dǎo)師學(xué)習(xí)6個月機(jī)器學(xué)習(xí),并進(jìn)行一些項目。他們可以由此入手,從而掌握大量知識。”

霍爾蓋特4年前拿著計算機(jī)科學(xué)和數(shù)學(xué)學(xué)位來到谷歌,對她來說,這是一次掌握最熱門軟件技術(shù)的機(jī)會:使用學(xué)習(xí)算法和海量數(shù)據(jù),教給軟件完成任務(wù)的方法。多年以來,機(jī)器學(xué)習(xí)都被視作一個高度專業(yè)的領(lǐng)域,僅有少數(shù)精英人群能夠掌握這種技術(shù)。但這個時代已經(jīng)結(jié)束了,最近的結(jié)果表明:由模擬生物大腦工作方式的“神經(jīng)網(wǎng)絡(luò)”驅(qū)動的機(jī)器學(xué)習(xí)技術(shù)是將計算機(jī)與人類能力融為一體的正確方式。

在某些情況下,甚至可以借此打造出超人。谷歌希望在內(nèi)部擴(kuò)大這類精英人群的范圍,甚至希望讓機(jī)器學(xué)習(xí)成為一種常規(guī)技術(shù)。對霍爾蓋特這樣的工程師而言,忍者項目是一次實現(xiàn)自我飛躍的絕佳機(jī)會,可以向精英中的精英學(xué)習(xí)知識。“這些人都在開發(fā)不可思議的模型,而且都有博士學(xué)位。”她言語間流露出無法掩飾的敬畏之情。由于該項目會將所有學(xué)員都稱作“忍者”,所以她開始有些難以接受,但最終還是克服了心理障礙。“我起初很難接受,但還是學(xué)著接受了。”她說。

考慮到谷歌員工人數(shù)眾多——其總部的6萬員工中約有半數(shù)是工程師——所以這個項目的規(guī)模其實很小。不過,這個項目卻標(biāo)志著谷歌內(nèi)部的認(rèn)識開始發(fā)生變化。盡管谷歌從很早以前就開始使用機(jī)器學(xué)習(xí)技術(shù),而且一直在這一領(lǐng)域積極聘請各類專家,但該公司直到2016年才開始真正癡迷于機(jī)器學(xué)習(xí)技術(shù)。谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)在去年末的財報電話會議上闡述了該公司的想法:“機(jī)器學(xué)習(xí)是一項有顛覆性的核心技術(shù),我們可以借此重新思考我們做一切事情的方式。我們還會盡力將它應(yīng)用于所有的產(chǎn)品中,包括搜索、廣告、YouTube或Play。我們還處于發(fā)展初期,但你會看到我們以系統(tǒng)化的方式將機(jī)器學(xué)習(xí)應(yīng)用到所有這些領(lǐng)域之中。”

很顯然,如果谷歌要在旗下的所有產(chǎn)品中融入機(jī)器學(xué)習(xí)技術(shù),就需要精通這項技術(shù)的工程師。正如機(jī)器學(xué)習(xí)暢銷書《算法大師》(The Master Algorithm)的作者佩德羅·多明戈斯(Pedro Domingos)所說:“機(jī)器學(xué)習(xí)是陽光下的一項新生事物,這是一項可以自己發(fā)展的技術(shù)。”編寫這樣的系統(tǒng)需要找到合適的數(shù)據(jù),選擇合適的算法,然后為成功營造合適的環(huán)境。之后就要給予系統(tǒng)足夠的信任(這對程序員來說是一件很難做到的事情),讓它們自己完成工作。

“通過這種方式思考解決方案的人越多,我們就會變得越好。”谷歌機(jī)器算法項目負(fù)責(zé)人杰夫·迪恩(Jeff Dean)說。他估計,谷歌目前約有2.5萬工程師,但只有幾千人精通機(jī)器學(xué)習(xí),占比大約為10%。他希望最終的比例能接近100%。“如果能讓所有工程師都在一定程度上掌握機(jī)器學(xué)習(xí)技術(shù),那就太好了。”他說。

他認(rèn)為這個愿望能否實現(xiàn)呢?

“我們會盡力嘗試。”他說。

 

01.神奇技術(shù)

多年以來,約翰·迦南德里一直都是谷歌機(jī)器學(xué)習(xí)的重要推動者,而作為該公司的最新動向,他最近成為了搜索業(yè)務(wù)主管。但當(dāng)他2010年加盟該公司時(他是在谷歌收購MetaWeb時隨之一同加入谷歌的,那家公司的龐大數(shù)據(jù)庫已經(jīng)以知識圖譜的形式整合到谷歌搜索中),他在機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)方面并沒有太多經(jīng)驗。 

[[168993]] 

▲谷歌最權(quán)威的計算機(jī)科學(xué)專家杰夫·迪恩正在制作機(jī)器學(xué)習(xí)方面的工具,領(lǐng)導(dǎo)團(tuán)隊進(jìn)行相關(guān)工作。

但在2011年左右,來自神經(jīng)信息處理系統(tǒng)(以下簡稱“NIPS”)大會的一條消息令他感到震驚。似乎每年都會有團(tuán)隊在NIPS上宣布機(jī)器學(xué)習(xí)的最新進(jìn)展,涉及翻譯、語音識別和視覺系統(tǒng)等諸多領(lǐng)域。一些令人驚訝的事情正在悄然發(fā)生。“當(dāng)我第一次關(guān)注時,NIPS的內(nèi)容十分晦澀難懂。”他說,“但過去3年間,這一領(lǐng)域在學(xué)術(shù)界和產(chǎn)業(yè)界都得到了蓬勃發(fā)展,去年的參會人數(shù)大約有6000人。”

隨著神經(jīng)網(wǎng)絡(luò)算法的進(jìn)步,加上摩爾定律帶來的強(qiáng)大計算能力,以及谷歌和Facebook等科技公司挖掘出來的龐大用戶數(shù)據(jù),機(jī)器學(xué)習(xí)的新時代就此拉開帷幕。迦南德里也加入其中,他認(rèn)為這將成為谷歌的核心。與他志同道合的還包括迪恩,他是“谷歌大腦”(Google Brain)的聯(lián)合創(chuàng)始人,這個神經(jīng)網(wǎng)絡(luò)項目來自谷歌旗下的研究部門Google X(現(xiàn)已更名為X)。

雖然迦南德里否認(rèn)“機(jī)器會殺死我們”這樣的預(yù)言,但他的確認(rèn)為,機(jī)器學(xué)習(xí)系統(tǒng)將成為一項革命性的技術(shù),從醫(yī)療診斷到無人駕駛汽車,各行各業(yè)都將利用這種技術(shù)。雖然機(jī)器學(xué)習(xí)不會取代人類,但它卻會改變?nèi)祟悺?/p>

迦南德里以Google Photos為例進(jìn)行了解釋。這款產(chǎn)品的標(biāo)志性功能是能夠在圖片中識別出用戶指定的物品,這令人感覺頗為神秘,甚至有些不安。他給我展示一些邊境牧羊犬的圖片。“當(dāng)有人第一次看到這個場景時,他們會以為發(fā)生了與眾不同的事情,因為電腦不僅為你計算出偏好,甚至還推薦你觀看一段視頻。”迦南德里說,“它可以理解畫面中的內(nèi)容。” 他解釋道,通過專門的學(xué)習(xí),電腦便可“知道”邊境牧羊犬的樣子,而且可以識別出不同年齡和毛長的邊境牧羊犬。

人類當(dāng)然可以做到這一點。但沒有一個人能夠從數(shù)百萬張圖片中篩選出來這些照片,同時還能識別出不同的犬種。但機(jī)器學(xué)習(xí)系統(tǒng)就可以做到。如果它學(xué)會了一個犬種,便可使用相同的技術(shù)識別出另外9999個犬種。“這才是真正新穎的地方。”迦南德里說,“通過這樣一個狹小的領(lǐng)域,你可以看到某些人所謂的超人究竟能達(dá)到什么效果。”

 

02.逐步探索

需要強(qiáng)調(diào)的是,谷歌早已了解機(jī)器學(xué)習(xí)的概念,該公司的創(chuàng)始人始終堅信人工智能的前景。機(jī)器學(xué)習(xí)已經(jīng)整合進(jìn)谷歌的很多產(chǎn)品,盡管未必采用了最近大熱的神經(jīng)網(wǎng)絡(luò)技術(shù)(早期的機(jī)器學(xué)習(xí)往往依賴更加直接的統(tǒng)計方法)。

事實上,谷歌10年前就開始通過內(nèi)部培訓(xùn),向該公司的工程師傳授積極學(xué)習(xí)技術(shù)。2005年初,當(dāng)時負(fù)責(zé)谷歌搜索業(yè)務(wù)的彼得·諾維格(Peter Norvig)向科學(xué)家大衛(wèi)·帕布洛·科恩(David Pablo Cohn)提出建議,希望了解谷歌能否采用卡內(nèi)基梅隆大學(xué)組織的相關(guān)課程。科恩表示,只有谷歌自己才能教授這種內(nèi)部課程,因為谷歌的運營規(guī)模與其他公司都大不相同(可能只有美國國防部是個例外)。所以他在谷歌總部的43號樓(那里當(dāng)時是搜索團(tuán)隊的總部所在地)訂了一個大房間,每周三在那里開設(shè)兩小時的課程。就連杰夫·迪恩也參加過幾次課程。“那是全世界最好的課程。”科恩說,“作為工程師,他們都比我優(yōu)秀得多!”

那個課程廣受歡迎,甚至變得一座難求。就連班加羅爾辦事處的員工都會特意等到午夜過后接入遠(yuǎn)程教學(xué)系統(tǒng)。幾年后,一些谷歌員工把授課演講內(nèi)容制作成了短片,結(jié)束了直播授課的歷史。科恩認(rèn)為,當(dāng)時的那個課程算得上是MOOC(大規(guī)模開放在線課程)的先驅(qū)。接下來幾年,谷歌還針對機(jī)器學(xué)習(xí)培訓(xùn)展開了其他的嘗試,但組織上并不嚴(yán)密,內(nèi)容上也并不連貫。科恩2013年離開谷歌后,機(jī)器學(xué)習(xí)才突然間成為了至關(guān)重要的領(lǐng)域。

在2012年之前,這種認(rèn)識尚未形成氣候,直到迦南德里決定“吸收大量從事這項工作的人”,并將他們安排到同一棟辦公樓之后。脫胎于該公司的X部門的谷歌大腦也加入進(jìn)來。“我們吸收了很多團(tuán)隊,將他們安排到同一棟辦公樓內(nèi),還提供了全新的咖啡機(jī)。”他說,“有些人之前只是一直在從事他們所謂的感知計算——聲音和語音識別等技術(shù)——現(xiàn)在都可以與那些從事語言工作的人展開溝通。”

逐漸地,這些工程師們開發(fā)的機(jī)器學(xué)習(xí)技術(shù)開始出現(xiàn)在谷歌的熱門產(chǎn)品中。由于視覺和語音識別以及翻譯是機(jī)器學(xué)習(xí)的主要領(lǐng)域,也就難怪這項技術(shù)成為谷歌語音搜索、翻譯和Photos等服務(wù)的重要組成部分。迪恩表示,隨著他和他的團(tuán)隊對機(jī)器學(xué)習(xí)的理解逐步深入,他們開始以更具野心的方式探索這項技術(shù)。“我們之前或許會在系統(tǒng)的組件中使用機(jī)器學(xué)習(xí)技術(shù),”他說,“現(xiàn)在則會使用這項技術(shù)替代整套系統(tǒng),而不是為每一個組件設(shè)計更好的機(jī)器學(xué)習(xí)模式。”迪恩表示,如果現(xiàn)在讓他重新編寫谷歌的基礎(chǔ)架構(gòu),其中的很多內(nèi)容都不再是預(yù)先編好的代碼,而是后期學(xué)習(xí)而來的。迪恩更為人所知的身份是Bit Table和MapReduce等革命性系統(tǒng)的聯(lián)合創(chuàng)造者。 

[[168994]] 

▲谷歌大腦聯(lián)合創(chuàng)始人格雷格·考拉多正在和多個團(tuán)隊協(xié)作,將人工智能轉(zhuǎn)化成為自己的軟件。

機(jī)器學(xué)習(xí)還能夠?qū)崿F(xiàn)一些原本無法想象的產(chǎn)品功能。2015年11月推出的Gmail自動回復(fù)便是其中之。這項功能源自谷歌大腦項目聯(lián)合創(chuàng)始人格雷格·考拉多(Greg Corrado)與Gmail工程師巴林特·米克洛斯(Bálint Miklós)之間的一次對話。考拉多之前曾經(jīng)與Gmail團(tuán)隊合作使用機(jī)器學(xué)習(xí)算法探測垃圾信息,歸類郵件內(nèi)容,但米克洛斯提出了一些更激進(jìn)的建議。能否利用機(jī)器學(xué)習(xí)技術(shù)自動生成回復(fù)郵件,省去移動用戶在狹小的鍵盤上輸入文字的繁瑣過程。“我大吃一驚,因為這個建議太瘋狂了。”考拉多說,“我后來想,借助我們一直以來都在研究的預(yù)測性神經(jīng)網(wǎng)絡(luò)技術(shù),或許的確可能實現(xiàn)這種功能。一旦我們意識到這是一個機(jī)會的時候,就必須去嘗試一下。”

為了提高成功概率,谷歌讓考拉多和他的團(tuán)隊與Gmail部門展開了密切合作。這種派遣機(jī)器學(xué)習(xí)專家進(jìn)駐產(chǎn)品部門的做法如今已經(jīng)越來越普遍。“機(jī)器學(xué)習(xí)既是科學(xué)又是藝術(shù)。”考拉多說,“這就像烹飪——沒錯,烹飪過程發(fā)生了化學(xué)反應(yīng),但對于真正對烹飪感興趣的人來說,必須要學(xué)習(xí)如何搭配手中的食材。”

傳統(tǒng)的人工智能技術(shù)在理解語言時,需要將語音規(guī)則嵌入系統(tǒng),但在這個項目中,系統(tǒng)可以利用現(xiàn)代化的機(jī)器學(xué)習(xí)技術(shù),借助足夠的數(shù)據(jù)像兒童一樣自學(xué)。“我的語言能力并不是從語言學(xué)家那里學(xué)來的,而是通過聽別人說話學(xué)來的。”考拉多說。但真正令智能回復(fù)變得切實可行的,是它的成功很容易定義——他們的目的不是創(chuàng)造一個妖艷的虛擬斯嘉麗·約翰遜(Scarlett Johansson),而是希望它能回復(fù)真正的電子郵件。“這項服務(wù)的成功標(biāo)志是,系統(tǒng)可以生成一個對用戶有用的備選回復(fù),以便用戶能夠真正使用這些內(nèi)容。”他說。因此,只需要知道用戶是否點擊了系統(tǒng)推薦的回復(fù)內(nèi)容,便可對其進(jìn)行訓(xùn)練。

但當(dāng)該團(tuán)隊開始測試智能回復(fù)時,用戶卻注意到了一些怪異的事情:它經(jīng)常會推薦一些不合時宜的曖昧語言。“其中一個比較失敗的情況是:只要系統(tǒng)感覺困惑,它就會說‘我愛你’。”考拉多說,“這并不是軟件漏洞,問題出在我們讓它做的事情上。” 這個程序已經(jīng)了解了人類行為的一些微妙之處:“如果你感到擔(dān)憂,那么說一句‘我愛你’是一種很好的防御策略。” 考拉多幫助該團(tuán)隊壓制了系統(tǒng)的熱情。

去年11月發(fā)布的智能回復(fù)取得了巨大成功——Gmail Inbox應(yīng)用的用戶現(xiàn)在可以直接從系統(tǒng)提供的三條備選內(nèi)容中選擇一條進(jìn)行回復(fù)。由于系統(tǒng)提供的回復(fù)內(nèi)容非常切題,用戶經(jīng)常感到驚訝。在通過該應(yīng)用發(fā)送的回復(fù)信息中,有十分之一都是由機(jī)器學(xué)習(xí)系統(tǒng)生成的。“這個項目能夠成功還是令我感到有些驚訝。”考拉多笑著說。

類似于智能推薦這樣的例子還有很多,它們都充分說明機(jī)器學(xué)習(xí)系統(tǒng)在谷歌業(yè)務(wù)中發(fā)揮的作用。或許最終的拐點是當(dāng)機(jī)器學(xué)習(xí)成為搜索的一個必不可少的組成部分時——作為谷歌的旗艦產(chǎn)品,搜索幾乎為該公司貢獻(xiàn)了所有營收。多年以來,由于搜索引擎對谷歌過于重要,所以始終沒有融入機(jī)器學(xué)習(xí)算法。“由于搜索在公司內(nèi)部占據(jù)的份額巨大,高級管理者深度參與其中,所以很多人都懷疑我們無法真正取得進(jìn)展。”迦南德里說。

其中部分阻力源自文化因素——必須要讓那些有極強(qiáng)控制欲的程序員適應(yīng)帶有禪宗韻味的機(jī)器學(xué)習(xí)模式。長期掌管谷歌搜索業(yè)務(wù)的阿密特·辛格(Amit Singhal)曾是傳奇計算機(jī)科學(xué)家杰拉德·薩爾頓(Gerald Salton)的助手。薩爾頓在文檔檢索方面的開創(chuàng)性工作啟迪辛格幫助謝爾蓋·布林(Sergey Brin)和拉里·佩奇(Larry Page)把研究生時期編寫的代碼,擴(kuò)展成了可以適應(yīng)當(dāng)今網(wǎng)絡(luò)時代的程序。(這使得他成為了“檢索派”的一員。)

他從20世紀(jì)的方法中梳理出了令人驚訝的結(jié)果,但如果要將機(jī)器學(xué)習(xí)系統(tǒng)整合到關(guān)系谷歌命脈的復(fù)雜系統(tǒng)中,他卻持懷疑態(tài)度。“進(jìn)入谷歌的前兩年,我負(fù)責(zé)搜索質(zhì)量,試圖用機(jī)器學(xué)習(xí)來改進(jìn)排名。”大衛(wèi)·帕布洛·科恩說,“結(jié)果發(fā)現(xiàn)阿米特的團(tuán)隊是全世界最優(yōu)秀的,我們把阿里特腦海中的所有內(nèi)容都變成了硬編碼,以此實現(xiàn)進(jìn)步。已經(jīng)找不到比他更好的方法了。”

到2014年初,谷歌的機(jī)器學(xué)習(xí)大師們認(rèn)為需要改變現(xiàn)狀。“我們與排名團(tuán)隊展開了一系列討論。”迪恩說,“我們認(rèn)為至少應(yīng)該嘗試一下,看看能不能有一些收獲。” 他的團(tuán)隊所設(shè)想的那個實驗最終成為了搜索的核心:文件排名與搜索請求的匹配程度有多高(需要以用戶的點擊為衡量標(biāo)準(zhǔn))。“我們跟他們說,可以用神經(jīng)網(wǎng)絡(luò)計算額外的分?jǐn)?shù),看看到底有沒有用。”

答案是:確實有用。這套系統(tǒng)如今已經(jīng)成為谷歌搜索的一部分,被稱作RankBrain。它于2015年4月上線。谷歌還是像以往一樣對如何改進(jìn)搜索諱莫如深(究竟是與長尾理論有關(guān)?還是更好地解讀了模糊不清的搜索請求?),但迪恩表示,RankBrain“融入到每一個搜索請求中”,雖然未必會影響所有的排名,但的確對很多搜索請求的排名都產(chǎn)生了影響。另外,實際的影響幅度也很大。在谷歌計算排名時所使用的數(shù)百個信號中(這些信號可能包括用戶所在的地理位置,或者頁面標(biāo)題是否與搜索請求匹配),RankBrain現(xiàn)在的用途排名第三。

“我們成功利用機(jī)器學(xué)習(xí)改進(jìn)了搜索結(jié)果,這對公司來說意義重大。”迦南德里說,“這引發(fā)了很多人的關(guān)注。” 華盛頓大學(xué)教授佩德羅·多明戈斯則給出了另外一種說法:“檢索派與機(jī)器學(xué)習(xí)派始終都存在斗爭。機(jī)器學(xué)習(xí)最終贏得了勝利。”

 

03.內(nèi)部培訓(xùn)

谷歌面臨的新挑戰(zhàn)是如何讓所有工程師都熟悉機(jī)器學(xué)習(xí)。還有很多公司也都秉承著相同的目標(biāo),其中最引人關(guān)注的當(dāng)屬Facebook,該公司與谷歌一樣著迷于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。這一領(lǐng)域的畢業(yè)生變得非常搶手,而谷歌正在努力保持對畢業(yè)生的吸引力:學(xué)術(shù)圈多年以來都流傳著一個玩笑:即使不需要頂尖學(xué)生,谷歌也會招聘他們,避免人才被競爭對手搶走。(這個玩笑的錯誤之處在于,谷歌的確需要這些人才。)“我的學(xué)生無一例外都得到了谷歌的錄用通知。”多明戈斯說。目前看來,競爭的激烈程度有增無減:就在上周,谷歌宣布將在蘇黎世開設(shè)一個新的機(jī)器學(xué)習(xí)實驗室,有很多工作崗位有待填補(bǔ)。

但由于學(xué)術(shù)項目尚未培養(yǎng)大量機(jī)器學(xué)習(xí)專家,為員工提供在職培訓(xùn)面成為了必要措施。但這卻并非易事,尤其是對于谷歌這樣的公司而言。這里有很多世界頂尖工程師,他們一生都在研究傳統(tǒng)的編程方式。機(jī)器學(xué)習(xí)卻需要截然不同的思維模式,精通編碼的工程師之所以能有如今的成就,往往是因為他們希望完全控制一套編碼系統(tǒng)。機(jī)器學(xué)習(xí)還需要掌握一些數(shù)學(xué)和統(tǒng)計學(xué)知識,但是很多程序員卻對此不屑一顧的,即便是那些能夠?qū)懗龀L代碼的超級黑客也不例外。

[[168995]] 

▲克里斯汀·羅伯森的職責(zé)是在機(jī)器學(xué)習(xí)方面孵化谷歌內(nèi)外的人員。

這還需要一定程度的耐心。“機(jī)器學(xué)習(xí)模型不是靜態(tài)代碼——你需要不斷為其提供數(shù)據(jù)。”羅伯森說,“我們一直在不停地更新模型,而且還要不斷學(xué)習(xí),增加更多數(shù)據(jù),調(diào)整預(yù)測方式。它就像是一個有生命的東西,這是一種截然不同的開發(fā)模式。”

“這是一個使用不同的算法進(jìn)行實驗的學(xué)科,需要挑選那些真正適合使用場景的訓(xùn)練數(shù)據(jù)。”迦南德里說。盡管他也是新的搜索業(yè)務(wù)主管,但卻仍然把在谷歌內(nèi)部傳播機(jī)器學(xué)習(xí)理念作為自己工作的一部分。“計算機(jī)科學(xué)那一部分不會消失,但需要更加關(guān)注數(shù)學(xué)和統(tǒng)計學(xué),而對數(shù)十萬行代碼的關(guān)注度則需要相應(yīng)地降低。”

至于谷歌所擔(dān)心的障礙,完全可以通過明智的在職培訓(xùn)來解決。“歸根結(jié)底,這些模型中使用的數(shù)學(xué)原理并不那么復(fù)雜。”迪恩說,“谷歌聘用的多數(shù)軟件工程師都可以掌握。”

為了進(jìn)一步幫助不斷擴(kuò)容的機(jī)器學(xué)習(xí)專家團(tuán)隊,谷歌開發(fā)了一系列強(qiáng)大的工具,幫助他們選擇合適的算法訓(xùn)練模型,加快培訓(xùn)和提煉過程。其中最強(qiáng)大的是TensorFlow,它可以加速神經(jīng)網(wǎng)絡(luò)的構(gòu)建過程。TensorFlow源自谷歌大腦項目,由迪恩和他的同事拉加特·芒格(Rajat Monga)共同發(fā)明。它能把構(gòu)建系統(tǒng)過程中涉及的晦澀難懂的細(xì)節(jié)變成標(biāo)準(zhǔn)化的內(nèi)容——尤其是在谷歌2015年11月開始將其開放給公眾后,這種做法的效果更加得以顯現(xiàn)。

盡管谷歌煞費苦心地將這種行為描述為一種無私的舉動,但該公司也承認(rèn),如果新一代程序員都能熟悉該公司內(nèi)部的機(jī)器學(xué)習(xí)工具,那對谷歌未來的招聘活動將會起到莫大的幫助。(質(zhì)疑者甚至指出,谷歌的TensorFlow開源項目是為了追趕Facebook,后者已經(jīng)在2015年6月公布了早期機(jī)器學(xué)習(xí)系統(tǒng)的深度學(xué)習(xí)模塊Torch。)不過,TensorFlow的功能以及谷歌的開源模式很快受到了程序員的歡迎。迦南德里表示,當(dāng)谷歌首次提供TensorFlow課程時,共有7.5萬人報名參加。

但谷歌仍為自己的程序員保留了很多好東西。該公司在內(nèi)部擁有一套更加優(yōu)秀的機(jī)器學(xué)習(xí)工具——Tensor Processing Unit(以下簡稱“TPU”)。他們雖然使用這項創(chuàng)新已經(jīng)多年時間,但直到最近才對外宣布。這是一種針對機(jī)器學(xué)習(xí)程序優(yōu)化的芯片,就像GPU是專門針對圖形處理優(yōu)化的芯片一樣。該公司的龐大數(shù)據(jù)中心里使用了數(shù)以千計的TPU(具體有多少恐怕只有上帝和佩奇才知道)。通過賦予神經(jīng)網(wǎng)絡(luò)這種超級計算能力,TPU為谷歌帶來了巨大優(yōu)勢。“如果沒有它,我們就無法實現(xiàn)RankBrain。”迪恩說。

但由于谷歌最需要的還是設(shè)計還提煉這些系統(tǒng)的人才,他們也在不斷嘗試各種方式來為工程師提供機(jī)器學(xué)習(xí)方面的培訓(xùn)。這些培訓(xùn)的規(guī)模各異,其中也包括為期兩天的速成班。谷歌希望這只是初步嘗試,工程師隨后還會尋找更多資源來深入學(xué)習(xí)。“已經(jīng)有數(shù)千人報名參加下一次課程。”迪恩說。

該公司還在通過其他一些措施,為外部人才提供機(jī)器學(xué)習(xí)培訓(xùn)。今年初春,谷歌啟動了Brain Residency項目,利用谷歌大腦項目為有潛力的外部人才提供了為期一年的集訓(xùn)。“我們稱之為你的深度學(xué)習(xí)職業(yè)生涯的開端。”羅伯森說,他負(fù)責(zé)協(xié)助管理這個項目。盡管這27名來自不同學(xué)科的機(jī)器學(xué)習(xí)學(xué)員中,可能有一些會留在谷歌,但他表示,該公司的目的是讓他們自行發(fā)展,利用自己掌握的先進(jìn)知識在世界各地傳播谷歌的機(jī)器學(xué)習(xí)技術(shù)。

 

04.前景廣闊

當(dāng)今時代,機(jī)器學(xué)習(xí)正在逐步走上中心舞臺,而谷歌則希望以人工智能公司的身份繼續(xù)占據(jù)主導(dǎo)。所以,從某種意義上講,卡森·霍爾蓋特在忍者項目中學(xué)到的知識正是這一計劃的核心所在。

她的課程最初是一個為期4周的新兵訓(xùn)練營,由谷歌最先進(jìn)的人工智能項目產(chǎn)品負(fù)責(zé)人提供指導(dǎo),教給他們?nèi)绾螌C(jī)器學(xué)習(xí)融入項目中。“我們把忍者帶進(jìn)會議室,格雷格·考拉多站在白板前解釋LSTM(長短期記憶,一種可以打造強(qiáng)大神經(jīng)網(wǎng)絡(luò)的技術(shù))。他做著夸張的手勢,講述這種系統(tǒng)的工作方式、利用何種數(shù)學(xué)原理、如何應(yīng)用于實際。”羅伯森說,“在最初的4個星期里,我們幾乎用到了我們的所有技術(shù)和所有工具,為的是給他們帶來切身體會。”

霍爾蓋特從新兵訓(xùn)練營畢業(yè)了,她現(xiàn)在正在使用機(jī)器學(xué)習(xí)工具開發(fā)一款A(yù)ndroid通訊功能,幫助谷歌員工彼此交流。她正在調(diào)整超參數(shù),清理輸入數(shù)據(jù),去掉停止詞。但她已經(jīng)不可能回頭,因為她知道人工智能技術(shù)就是谷歌的現(xiàn)在和未來,甚至可能是所有技術(shù)和所有東西的未來。

“機(jī)器學(xué)習(xí)時代已經(jīng)來臨,”她說,“前景無比廣闊。”

責(zé)任編輯:趙寧寧 來源: 大數(shù)據(jù)應(yīng)用
相關(guān)推薦

2021-01-18 09:00:00

人工智能機(jī)器學(xué)習(xí)工程師

2010-10-14 10:35:24

谷歌工程師

2012-10-10 09:42:58

谷歌測試測試工程師

2013-06-26 10:34:56

工程師?谷歌

2021-03-26 09:11:23

技術(shù)研發(fā)工程師

2021-04-26 17:46:33

人工智能機(jī)器學(xué)習(xí)

2017-04-18 09:46:31

機(jī)器學(xué)習(xí)工程師算法

2019-12-13 10:45:39

機(jī)器學(xué)習(xí)人工智能計算機(jī)

2025-01-13 11:49:37

2014-06-20 09:16:26

2023-08-02 10:15:23

谷歌工資

2020-11-04 10:21:37

機(jī)器學(xué)習(xí)技術(shù)人工智能

2020-07-19 15:17:41

機(jī)器學(xué)習(xí)技術(shù)工程師

2020-03-13 14:13:48

機(jī)器學(xué)習(xí)數(shù)據(jù)科學(xué)編程

2019-06-17 08:57:13

優(yōu)秀工程師技術(shù)程序員

2017-09-04 13:13:01

2018-10-11 10:56:29

機(jī)器學(xué)習(xí)人工智能入門方法

2020-08-03 00:02:40

機(jī)器學(xué)習(xí)人工智能AI

2020-07-23 08:07:22

人工智能機(jī)器學(xué)習(xí)技術(shù)

2009-06-23 08:25:50

谷歌離職
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 中文字幕日韩欧美一区二区三区 | 国产精品久久久久久久久久久免费看 | 精品欧美激情在线观看 | 国产精品视频久久久久 | 男人的天堂视频网站 | 久久久久久国产精品 | 久久国产精品免费一区二区三区 | 成人免费视频播放 | 中文字幕在线观看一区二区 | 欧美九九九 | 欧美极品在线视频 | 成人在线一区二区 | 亚洲毛片网站 | 中文在线亚洲 | 羞羞在线视频 | av免费网址 | 91亚洲国产| 91精品国产91久久综合桃花 | 成人免费看电影 | 日韩欧美久久 | 久久99精品久久久久久国产越南 | 久久一级| 中文字幕久久精品 | 在线观看黄视频 | 拍拍无遮挡人做人爱视频免费观看 | 国产精品海角社区在线观看 | 99久久99久久精品国产片果冰 | 天天草av| 日韩影院在线 | 91在线播 | 日操操 | 成人久久 | 国产精品美女久久久久久久久久久 | 日韩精品成人一区二区三区视频 | 日韩欧美操 | 色婷婷婷婷色 | 1204国产成人精品视频 | 欧美福利影院 | 国产一区二区三区免费视频 | 精品一区二区视频 | 二区在线视频 |