一文看懂人工智能的六個(gè)關(guān)鍵概念和實(shí)施AI項(xiàng)目的七個(gè)注意事項(xiàng)
人工智能并不能解決所有問題,但如果應(yīng)用得當(dāng),它可以在短時(shí)間內(nèi)產(chǎn)生很大的變化。
您或許已經(jīng)聽說過機(jī)器學(xué)習(xí)和人工智能(AI)的前景。這兩個(gè)技術(shù)概念,已經(jīng)引起了全世界的關(guān)注。自動(dòng)駕駛汽車、人形機(jī)器人、設(shè)備預(yù)測(cè)維護(hù)——這些應(yīng)用不僅僅限于消費(fèi)者領(lǐng)域,工業(yè)界也開始瘋狂了。看看最近主要工業(yè)出版物的諸多頭條新聞就知道了。這種趨勢(shì)仍將繼續(xù),實(shí)際上,未來它可能無處不在。因此,您不妨了解一下。
AI的興起
傳統(tǒng)上,分析是統(tǒng)計(jì)學(xué)家的專長(zhǎng)。在工業(yè)領(lǐng)域普及計(jì)算機(jī)之前,分析師使用鉛筆和紙完成分析工作。而現(xiàn)在的分析,是描述數(shù)據(jù)科學(xué)的總稱。
例如,沿著一條簡(jiǎn)單的線找到一個(gè)點(diǎn),通常屬于標(biāo)準(zhǔn)數(shù)據(jù)分析的范疇。該線被認(rèn)為是“回歸”。沿著線找到點(diǎn)是“回歸分析”。執(zhí)行簡(jiǎn)單的回歸分析司空見慣。
機(jī)器學(xué)習(xí)可以看作是AI 的子集,盡管這兩個(gè)術(shù)語通常可以互換使用。機(jī)器學(xué)習(xí)是AI的統(tǒng)計(jì)方面,其中還包括認(rèn)知計(jì)算和建模。每個(gè)類別的邊界可能是模糊的。
表征AI的另一種方法,是使用真實(shí)世界數(shù)據(jù)得出結(jié)論的計(jì)算機(jī)代碼。如果以此方式建立系統(tǒng),則可以根據(jù)這些結(jié)論自動(dòng)做出決策。然后,可以將更多信息輸入系統(tǒng)并做出更多的決策。對(duì)AI 的描述,反映了當(dāng)今流行文化的對(duì)AI 的理解,它反映了人類的思想方式。我們接受信息,得出結(jié)論并做出決定。
人類思想常常可以用“如果,那么”的形式來表達(dá),當(dāng)然也可以用其它形式表示。與此類似,我們也可以用用其中一種算法來實(shí)例化AI。根據(jù)功能對(duì)算法進(jìn)行分組很有用。我們來了解一下機(jī)器學(xué)習(xí)算法的主要類別。
聚類分析
一些算法將事物進(jìn)行“分組”。例如,假設(shè)正在生產(chǎn)零部件。質(zhì)保部門或在線測(cè)量系統(tǒng)將把兩個(gè)測(cè)量功能與零件關(guān)聯(lián):寬度和高度。將這些數(shù)據(jù)用于生成圖表。可以使用顏色來明確分類方案。如果您使用的是Excel 向?qū)В瑒t可以自己生成圖形,在新零件通過時(shí)將其繪制到圖表上(見圖1)。

圖1 可以使用顏色對(duì)零件進(jìn)行分類,但是如果相關(guān)參數(shù)太多而無法使用傳統(tǒng)的可視化技術(shù)顯示,該怎么辦?本文圖片來源:inductiveAutomation
隨著將更多信息添加到架構(gòu)中,集群功能變得更強(qiáng)大。假設(shè)添加了有關(guān)次品的信息。結(jié)果顯示,藍(lán)色組代表的次品占比將近80%,而綠色組則占大約20%。
但是為什么要停在那里?假設(shè)我們也開始收集長(zhǎng)度信息。想象一下在三個(gè)維度上繪制圖表。先進(jìn)的繪圖程序可以做到這一點(diǎn),因此可以繼續(xù)手動(dòng)輸入和分組信息。當(dāng)分組得到改善后,藍(lán)色組顯示的次品占比達(dá)到85%。
此時(shí),如果使用機(jī)器學(xué)習(xí)算法完成聚類,它將執(zhí)行分類,但是只能自動(dòng)執(zhí)行可以手動(dòng)完成的操作。那為什么機(jī)器學(xué)習(xí)是更好的選擇?
更多維度
這個(gè)時(shí)候,如果需要增加另一個(gè)維度怎么辦?也許電導(dǎo)率是有意義的參數(shù),或者是濕度讀數(shù),或者是陽極氧化電流。但是3D 圖只能具有三個(gè)維度。另一方面, 使用機(jī)器學(xué)習(xí)算法意味著可以繪制四個(gè)、五個(gè)、六個(gè)甚至一百個(gè)維度的圖形。
聚類算法根據(jù)每個(gè)零件的屬性繪制圖形,將彼此接近的零件識(shí)別為一組。一旦完成此操作,就更容易看到哪些屬性或?qū)傩缘慕M合最有可能產(chǎn)生次品。
這意味著可以根據(jù)其它屬性自動(dòng)對(duì)分組進(jìn)行進(jìn)一步細(xì)化,并且可能對(duì)藍(lán)色組進(jìn)行充分細(xì)化,以預(yù)測(cè)95%或99%的次品。對(duì)于最有可能需要返工的產(chǎn)品,洞察力得到了顯著改善。可能的選擇是在采取不必要的步驟之前,將其從生產(chǎn)環(huán)節(jié)中撤出,從而可以節(jié)省時(shí)間和成本。
決策樹
決策樹是另一種在概念上具有重大意義的簡(jiǎn)單技術(shù)。在數(shù)據(jù)挖掘中決策樹訓(xùn)練是一個(gè)常用的方法。目標(biāo)是創(chuàng)建一個(gè)模型來預(yù)測(cè)樣本的目標(biāo)值。在日常生活中,我們經(jīng)常會(huì)建立決策樹,以回答諸如以下問題:交通狀況如何?天氣如何?我今天應(yīng)該給媽媽打電話嗎(請(qǐng)參見圖2)?構(gòu)建一個(gè)算法是一項(xiàng)簡(jiǎn)單任務(wù)。首先,確定描述過程的數(shù)據(jù)以及有關(guān)結(jié)果的信息。結(jié)果生成的算法,將構(gòu)建一棵映射預(yù)測(cè)結(jié)果的樹。它會(huì)通過多種可能性(也許是數(shù)千甚至更多種),來構(gòu)想出盡可能準(zhǔn)確的樹。

圖2 決策樹從簡(jiǎn)單元素開始,但可以用來預(yù)測(cè)高度復(fù)雜過程的結(jié)果。
模型與訓(xùn)練
其它重要的分析概念,還包括建模和訓(xùn)練。當(dāng)將過程數(shù)據(jù)輸入到機(jī)器學(xué)習(xí)算法中時(shí),就會(huì)進(jìn)行訓(xùn)練,從而生成模型,進(jìn)而識(shí)別出好的和壞的過程示例。
想象一下,有人坐下來用筆寫出一個(gè)決策樹。然后他們寫了一個(gè)又一個(gè)決策樹。之后,就可以確定最佳決策樹,然后放棄其它決策樹。最終的決策樹就是模型。對(duì)于聚類算法,該模型將僅被稱為“聚類模型”或“模型”。
換句話說,使用最佳決策樹可以利用一組數(shù)據(jù)基于處理流程來獲得預(yù)測(cè)。回到前面的示例,第一個(gè)語句可能是“如果寬度小于23.5,那么xxx”,第二個(gè)語句可能是,“如果高度大于43.3,那么xxx。”機(jī)器學(xué)習(xí)算法創(chuàng)建問題,以獲得它所能得到的最佳答案。
決策樹在預(yù)測(cè)性維護(hù)應(yīng)用中具有很大的實(shí)用性。如前所述,回歸分析可能很簡(jiǎn)單。但當(dāng)涉及到機(jī)器學(xué)習(xí)算法時(shí),它可能會(huì)很復(fù)雜。
回歸分析
同樣,回歸分析的基礎(chǔ)可以通過在一條線上找到一個(gè)點(diǎn)來說明。要畫一條線,首先要確定畫一條什么類型的線。它是曲線嗎?是直線嗎?它有很多曲線嗎?如果將其繪制在x-y 二維平面中,這很容易做到。當(dāng)將機(jī)器學(xué)習(xí)應(yīng)用于復(fù)雜數(shù)據(jù)和更多維度時(shí),它會(huì)大放異彩。手工繪制100 個(gè)維度,永遠(yuǎn)是不切實(shí)際的,但是一種算法可以輕松地解決這一問題,并且可以輕松找到最佳擬合回歸(如果存在的話)。
回歸分析在過程調(diào)整和生產(chǎn)預(yù)測(cè)中非常有用。并非所有數(shù)據(jù)都適合進(jìn)行回歸分析(例如,聚類數(shù)據(jù)),但是對(duì)于那些某個(gè)因素會(huì)影響其它因素的項(xiàng)目可能非常有用。
深度學(xué)習(xí)
也許您聽說過深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò),那您真的了解它們是什么嗎?深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的分支,是一種以人工神經(jīng)網(wǎng)絡(luò)為架構(gòu),對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的算法。神經(jīng)網(wǎng)絡(luò)是包含數(shù)千或數(shù)百萬個(gè)節(jié)點(diǎn)的模型,這些節(jié)點(diǎn)是計(jì)算機(jī)代碼的小塊,每個(gè)塊都可以接受輸入并產(chǎn)生輸出。所謂神經(jīng)網(wǎng)絡(luò)是因?yàn)樗鼈冎荚谀M神經(jīng)元在大腦中的工作方式。就像我們大腦中的神經(jīng)元一樣,節(jié)點(diǎn)之間的某些連接相對(duì)較強(qiáng),其它可能相對(duì)較弱。

圖3 可以將神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)為大致類似于大腦的工作方式。
對(duì)于神經(jīng)網(wǎng)絡(luò),算法不只是配置節(jié)點(diǎn)。它們自我構(gòu)建,從而可以建立具有數(shù)百萬個(gè)節(jié)點(diǎn)的模型來處理數(shù)據(jù)。
當(dāng)神經(jīng)網(wǎng)絡(luò)“消化”數(shù)據(jù)時(shí),它會(huì)變形和變化,直到在預(yù)測(cè)結(jié)果或提供分類方面達(dá)到設(shè)定目標(biāo)為止。經(jīng)過訓(xùn)練,它可以做幾乎所有事情。可能需要獲取最近的傳感器讀數(shù)并經(jīng)計(jì)算獲得問題出現(xiàn)的可能性。或者,它可以評(píng)估一組1 和0,以確定是否描繪了一只貓。所有這些數(shù)百萬個(gè)節(jié)點(diǎn),都以某種方式“理解”了圖像。對(duì)每個(gè)節(jié)點(diǎn)只是簡(jiǎn)單的數(shù)學(xué)運(yùn)算,但節(jié)點(diǎn)的排列和權(quán)重都可以以某種形式用于獲得結(jié)論。
這就是為什么很少能有人真正理解它們的原因。要求數(shù)據(jù)科學(xué)家解釋神經(jīng)網(wǎng)絡(luò),他們可能能夠解釋數(shù)學(xué)問題。如果請(qǐng)同一位數(shù)據(jù)科學(xué)家解釋如何在這些字節(jié)中識(shí)別“怪獸”,他可能會(huì)用“魔法”來解釋。
神經(jīng)網(wǎng)絡(luò)如此令人印象深刻,它們?cè)诠I(yè)領(lǐng)域也提出了難題。如果算法告訴您要做某事,您會(huì)做嗎?如果是決策樹、回歸分析或聚類模型分配建議,則可以跟蹤獲得結(jié)論的方式。但是,神經(jīng)網(wǎng)絡(luò)可能不會(huì)讓你了解獲得系統(tǒng)的“原因”。它只是給出一個(gè)可以相信與否的答案。如果這些決定可能會(huì)導(dǎo)致停機(jī)或生產(chǎn)瓶頸,則可能會(huì)遭到質(zhì)疑,為什么要使用算命先生的魔法水晶球來制定決策。
未來就在這里
世界正在變化,人工智能和機(jī)器學(xué)習(xí)技術(shù)將不斷發(fā)展,并且在更多行業(yè)得到應(yīng)用。人工智能技術(shù)已經(jīng)證明了其價(jià)值,采用的企業(yè)看到了已經(jīng)獲得的領(lǐng)先優(yōu)勢(shì)。人工智能并不能解決所有問題,但如果應(yīng)用得當(dāng),它可以在短時(shí)間內(nèi)產(chǎn)生很大的變化。所以放開手腳,大膽的去建立模型吧,你會(huì)在過程中找到答案的。
實(shí)施AI項(xiàng)目的7個(gè)注意事項(xiàng)
如果你正在學(xué)習(xí)或計(jì)劃實(shí)施機(jī)器學(xué)習(xí)或人工智能項(xiàng)目,有一些事要優(yōu)先考慮。
01識(shí)別問題
首先選擇要改進(jìn)的過程、區(qū)域或技術(shù)。在機(jī)器學(xué)習(xí)或AI 似乎可以提供幫助的地方,找到最需要解決的問題和目標(biāo)。
02收集數(shù)據(jù)
數(shù)據(jù)越多越好。成千上萬的數(shù)據(jù)點(diǎn),盡可能多的幫助訓(xùn)練模型。確保使用高質(zhì)量的數(shù)據(jù)。不良數(shù)據(jù)很容易引發(fā)算法失敗。數(shù)據(jù)預(yù)處理和數(shù)據(jù)清理,是影響成功的關(guān)鍵因素。
03整理統(tǒng)計(jì)數(shù)據(jù)
了解采樣技術(shù)以及因果關(guān)系和相關(guān)性。了解結(jié)果的質(zhì)量,有助于避免發(fā)生錯(cuò)誤。
04具有專業(yè)知識(shí)
了解過程或技術(shù)對(duì)于了解結(jié)果是否合理至關(guān)重要。數(shù)據(jù)科學(xué)家很棒,但是僅僅關(guān)注某些數(shù)據(jù),不會(huì)取得好的結(jié)果。
05創(chuàng)建模型
這可以與現(xiàn)有的任何機(jī)器學(xué)習(xí)軟件一起使用。現(xiàn)代的監(jiān)控和數(shù)據(jù)采集(SCADA)系統(tǒng),內(nèi)置了一些流行的機(jī)器學(xué)習(xí)算法。許多云產(chǎn)品和平臺(tái)都將這種類型的算法作為選項(xiàng)。
06部署模型
通常,可以在機(jī)器旁邊或內(nèi)部運(yùn)行模型,甚至構(gòu)建在云上或利用其它工具。尋找運(yùn)行模型的最佳方法。如果是關(guān)鍵過程的一部分,則在本地運(yùn)行是理想選擇。
07監(jiān)控是否成功
如果無法衡量成功,就沒有人會(huì)知道它的存在。可以將先前的過程數(shù)據(jù)與最新數(shù)據(jù)進(jìn)行比較。如果模型需要改進(jìn),請(qǐng)返回到第5 步。請(qǐng)記住,有時(shí)嘗試幾種模型或?qū)追N模型組合會(huì)產(chǎn)生更好的結(jié)果。