成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

人工智能產品化的關鍵是基礎架構和數據,而非算法

開發 開發工具 算法
突然你發現,機器學習算法,你所謂的王冠,只是巨大復雜車機上的一個小齒輪。

[[187402]]

目前,人工智能經歷著魔幻般的炒作。數據輸入作為亂七八糟的數字流的神經網絡——或者黑箱,并且輸出的數據得到徹底轉化,就像魔術師從一個空帽子中變出一只兔子。

這在實驗室是可能的,甚至是通過干凈、調試的數據,在一臺個人開發機器上也是可能的。然而,已經付出了很多很多努力,為了把機器學習算法擴展到類似于多用戶服務的東西上——換句話說,有用的東西上。

人工智能的關注度正在直線飛升,其中不乏大量炒作,而實際情況是人工智能技術依然處于起步階段,并且難以實現產品化。從原型到產品,需要克服很多新挑戰:比如訓練數據從何而來?訓練系統時人們如何存儲、組織、精煉并準備數據?誰可以檢測系統?安全性怎么樣:如何管理和保護敏感信息?我的硬件需要多快才能傳遞結果?性能瓶頸和并發障礙在哪里?

魔術耍個不停。突然你發現,人工智能代碼,你所謂的王冠,只是巨大復雜車機(buggy machine)上一個無足輕重的小齒輪。

Skymind 是一家為企業提供人工智能解決方案的初創公司,其聯合創始人和首席技術官 Adam Gibson 說:把人工智能產品化是一個不小的挑戰,基礎架構是最難以解決的問題之一。

Skymind CEO 和聯合創始人 Chris Nicholson 解釋說:部署人工智能是一個復雜過程,并且要分幾步走,這和水流進一個個管道有些像。

原始數據就像液體,在流入產品的管道之前,需要數字化和聚集原始數據。接著,在使用 Hadoop 等被存儲之前,數據流需要通過工具 Apache Kafka 或者 Apache Storm 進行處理。包括圖像、文本、聲音在內的數據需要被提取、轉化繼而格式化以用于向量計算,并加載到用于訓練的神經網絡。

訓練結束之后,將使用更多的數據檢測模型的推斷代碼以查看其性能和精確度。換句話說,對于一個新近訓練的人工智能,你通過問題來查看其輸出是否和你的預期相一致。

在這一點上,少許的調整、篡改和額外訓練可在正確的方向上推進軟件。當系統達到標準時——精確度足夠高,運行快到可以滿足不耐煩之人的需求——它被插入到一個更大的框架之中,用戶從而可以直接或者通過 API 安全訪問系統。一個典型的例子是 Netflix 或 Amazon 基于用戶信息通過機器學習生成最佳推薦。

它并不止于此,而最后一步是擴展。目前為止我們描述的系統被打包進微服務(microservice)從而人工智能可以在多臺服務器上數千次地——如果不是數十萬次——被調試以解決需求問題。想象一個用于信用卡查腐的系統,它要應對數百個都姓 Purchas 的人。

Gibson 說:研究者并不知道或者關心這個,他們只對更好的算法感興趣,而不是服務消費者。

Nicholson 同意 Gibson 的觀點,他說:研究人員對基礎架構和擴展并不感興趣。這里有一個很好的類比:想象一下數以千計的消費者向同一個客服人員打電話——這就是研究人員的工作方式。他們就只有一個客服人員。但是想象一下如果通用電氣收到了數以千計的電話,其就不可能只安排一個客服人員。你需要無限次復制客服人員以盡可能地滿足服務需求。

呃,我只用云

類似創業公司這樣的小型公司可能會在他們的人工智能系統推斷階段大做文章,并且虛晃(「hand-wave」)其他階段。Gibson 告訴 The Register,「他們不會解決涉及所有基礎架構和擴展的數據量問題,因此,理想的做法是訴諸云端」,「但是,隨著公司變大,他們也需要擔心這些問題?!?/p>

Skymind 成立于 2014 年,研發了一種用 Java 編寫的深度學習框架 Deeplearning4j,能與 Hadoop 和 Spark 融合。

諸如谷歌云、微軟 Azure 以及亞馬遜云這樣的云平臺正競相將人工智能作為一種服務提供給大眾。他們為用戶提供預訓練模型,通過將不同工具(比如圖像識別或自然語言處理)弄在一塊,也為用戶提供一種生成更加定制化模型的辦法。

借助云使用人工智能模型既受約束也很昂貴。神經網絡迭代學習,也要求在多個 GPU 上進行密集訓練。借助云來實現這些,花費在 1 萬 5 千美元到 3 萬美元之間不等,Nicholson 介紹說。

「付不起錢的創業公司會使用從網上下載的預訓練模型,進行定制化——這是典型的做法——并把模型上傳到云?!?/p>

這么做的好處就是小型團隊不用到處找懂機器學習的計算機科學家來將想法付諸現實。但是,也有不利的地方:受限于預先被打包的模型。事實上,這也是證明一家公司是否對人工智能持嚴肅態度的辦法。人工智能的炒作似乎不會減緩,吹噓這些方面也增加了上頭條或博得更多投資的機會。

「一家公司如果打造人工智能,要解決四個問題:人才、工具、數據和基礎架構。」Nicholson 說,「需要有機器學習背景的人,計算機科學家以及黑客。要能解釋他們用的哪類算法,如果使用云,那么,他們可能沒有同樣多的數據,也不需要考慮基礎架構問題。」

「如果他們不談論算法和技術堆棧,那么,這就是個警示。你很難認真對待這些人,因為他們啥都干得出來。他們在 logistic 回歸中使用 if-then 卻稱其為人工智能?!?/p>

人工智能不走大眾路線

從制藥貿易到政府部門,從不缺乏將人工智能應用到數據中的商業興趣。不過,這并適合所有人,Nicholson 和 Gibson 說。深度學習需要將訓練數據大量綁定以研發具有高性能的模型。

「事實是,幾乎所有創業公司并不掌握足夠數據。公司也必須現實點。人們不得不跨過幻想階段,尋找一個可以解決的真正問題。」

原文:https://www.theregister.co.uk/2017/03/31/ai_infrastructure/

【本文是51CTO專欄機構機器之心的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】

 

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2021-03-24 14:08:28

人工智能AI機器學習

2023-11-26 16:00:54

人工智能算力算法

2022-04-29 17:18:55

數據治理數據管控體系數據管道

2021-02-25 14:09:55

人工智能數據機器學習

2023-12-05 14:46:58

人工智能

2024-01-25 14:30:08

人工智能

2020-08-31 15:15:20

人工智能算法AI

2021-02-06 23:08:03

人工智能數據安全

2022-10-19 07:04:12

?人工智能云服務Alaas

2024-02-26 11:31:33

人工智能數據中心

2022-06-30 15:55:04

人工智能垂直智能數據挑戰

2023-05-05 14:02:59

人工智能聊天機器人

2013-01-05 17:01:57

大數據App基礎架構

2013-01-06 10:18:58

大數據大數據的未來

2017-12-14 10:25:32

2022-10-20 07:14:20

人工智能機器學習算法

2014-06-10 16:58:42

數據中心產品化

2023-08-16 14:20:26

人工智能AI

2022-09-26 10:56:28

人工智能數字孿生

2020-12-18 13:22:33

人工智能算法
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 美女天天干 | 一级黄色片免费 | 一级高清 | 中文字幕日韩在线观看 | 国产午夜视频 | 久久精品欧美一区二区三区不卡 | 伊人av在线播放 | 精品欧美一区免费观看α√ | 亚洲精品一区二区三区中文字幕 | 亚洲天天干 | 欧美极品一区二区 | 亚洲人成在线播放 | 久久综合狠狠综合久久综合88 | 国产精品一区二区在线播放 | 亚洲 日本 欧美 中文幕 | 91精品国产综合久久福利软件 | 色综合99| 日韩91 | 久久天天 | 中文字幕一二三 | 国产在线小视频 | 亚洲精品一 | 精品人伦一区二区三区蜜桃网站 | 精品视频国产 | 在线观看国产精品视频 | 亚洲视频一区二区三区 | 国产高清视频 | 国产精品久久久久久一区二区三区 | 99re视频在线 | 在线观看中文字幕 | 在线免费观看a级片 | 久久久91精品国产一区二区三区 | 91n成人| 中文字幕福利 | 五月天婷婷丁香 | 国产亚洲精品久久久久动 | 一a级片 | 国产精品激情小视频 | 毛片片| 国产精久久久久久久 | 色综合久久久 |