機器學習機制正在崛起
譯文當量變積累到一定程度之后,就會引發(fā)顛覆性質(zhì)變。“還記得人工神經(jīng)網(wǎng)絡(luò)嗎?”Christopher Nguyen問道。“當我們?yōu)槠渑鋫渥銐螨嫶蟮膬?nèi)存與計算資源,就會出現(xiàn)有趣的現(xiàn)象——它真正活了過來。”
作為Google Apps的前任工程技術(shù)主管,Nguyen提到的是他所建立的初創(chuàng)企業(yè)Adatao打造出的技術(shù)成果——這家公司剛剛從Andreessen Horowitz處獲得了1300萬美元投資。Adatao的價值主張分為兩大部分:
pInsights,基于文檔的虛擬化層,旨在為終端用戶提供面向大規(guī)模數(shù)據(jù)集的簡單實時化查詢機制;
pAnalytics,一套以Hadoop與Apache Spark為基礎(chǔ)的怪獸級數(shù)據(jù)處理引擎。
二者都包含有ANN(即人工神經(jīng)網(wǎng)絡(luò))組件,這一原本僅僅以構(gòu)想形式存在的技術(shù)方案如今借助龐大的內(nèi)存與處理能力最終走上了商業(yè)化正軌。
Adatao的目標在于將大數(shù)據(jù)分析帶入規(guī)模化體系,進而幫助用戶借助包含大型數(shù)據(jù)集圖表的Google Apps類文檔實現(xiàn)協(xié)作。我曾經(jīng)親眼見證過該方案的演示效果,在采用由Amazon Web Services托管的八核心服務器集群(每臺服務器配備30GB內(nèi)存)的情況下,面向數(shù)TB級別數(shù)據(jù)集的查詢?nèi)蝿漳軌蚝芸斓靡酝瓿伞榱藢崿F(xiàn)承諾中的易用性,Adatao公司需要利用ANN識別處理當中的數(shù)據(jù)對象、從而對通過輸入簡明英文表達進行的查詢操作作出快速響應。根據(jù)Nguyen的說法,該系統(tǒng)能夠識別最多20000個對象。
如果Adatao能夠獲得成功,他們將成為當之無愧的游戲規(guī)則改變者。但最令我感到興奮的,仍然是其在人工智能方面取得的成就。
在觀看了演示實例之后,我立刻打電話給我的朋友Miko Matsumura——Hazelcast公司市場推廣事務副總裁,他曾經(jīng)在耶魯大學取得了計算科學碩士學位。我告訴他,根據(jù)我個人極為有限的理解,人工智能的實現(xiàn)在很大程度上已經(jīng)轉(zhuǎn)化為軟件而非硬件課題,而Adatao的ANN技術(shù)似乎為實現(xiàn)這一構(gòu)想提供了鮮活且可資借鑒的例子。
Miko旋即向我提到了Paul與Patricia Churchland得出的結(jié)論,他們曾經(jīng)指出那些否認人工智能可能性的反對派就像是在黑暗的房間里揮動磁鐵、并借此宣稱磁性并不能產(chǎn)生光亮——這樣的結(jié)論非常荒謬,無法發(fā)光只不過是因為他們的揮舞速度還不夠快。時至今日,我們已經(jīng)具備了點亮人工智能這盞明燈的巨大內(nèi)存與計算容量,因此可以說人類已經(jīng)站在了邁向技術(shù)新紀元的起跑線上。
事實上,這場競逐早已開始,其主要實踐性應用就是大數(shù)據(jù)分析。正如James Kobielus在今年早些時候所強調(diào),“機器學習的普及程度已經(jīng)如此之高,我們能夠在多數(shù)大數(shù)據(jù)應用程序當中看到它們的身影。”
“我們的未來既充滿光明也滲透著黑暗氣息,”Miko這樣描述***次將機器學習機制納入大數(shù)據(jù)方案所帶來的影響。換句話來說,利用人工智能分析機制處理任何可用的互聯(lián)網(wǎng)數(shù)據(jù)——其中包括收集自移動與可穿戴設(shè)備的、更為詳盡的個人信息——網(wǎng)站與商家能夠獲取到***實用價值的分析結(jié)論。與此同時,這也令我們普通用戶不寒而栗,因為這種個性化幫助的背后隱藏著個人信息的大量外泄。
無論如何,機器學習與大數(shù)據(jù)協(xié)作的首要目標在于推動客戶提高消費額度并保持理想的忠誠度,這其實并不令人意外。不過其潛在影響將延伸到每一個學科,從醫(yī)療保健到氣象預測。隨著計算資源的廉價化與規(guī)模化,新的智能系統(tǒng)已經(jīng)由構(gòu)想變?yōu)榍袑嵖尚校覀円灿瓉砹巳掠嬎汶A段所帶來的一系列質(zhì)變。否認這一點,顯然無異于在黑暗中揮動磁鐵。
原文鏈接:
http://www.infoworld.com/t/big-data/the-rise-of-machines-learn-248037
原文標題:The rise of machines that learn