采用物聯(lián)網(wǎng)數(shù)據(jù)流的三個(gè)技巧
物聯(lián)網(wǎng)(IoT)是技術(shù)市場(chǎng)上增長(zhǎng)比較快的市場(chǎng)之一。合并和分析設(shè)備數(shù)據(jù)的能力既是福也是禍。數(shù)據(jù)格式以迭代速度變化,并且數(shù)據(jù)量在不斷增長(zhǎng),而且看不到盡頭。
物聯(lián)網(wǎng)數(shù)據(jù)只有一個(gè)地方可以管理和控制:流。數(shù)據(jù)流通過(guò)將物聯(lián)網(wǎng)領(lǐng)域的高級(jí)中間件與高級(jí)機(jī)器學(xué)習(xí)和人工智能相結(jié)合來(lái)處理數(shù)據(jù)傳輸。
但是,并非所有的流技術(shù)都是一樣的。流從一開(kāi)始就被設(shè)計(jì)用來(lái)實(shí)現(xiàn)快速有效的數(shù)據(jù)移動(dòng),支持從醫(yī)療警報(bào)到遠(yuǎn)程維護(hù)和智能家居的各種用例。為了完成這些多樣化的用例,流必須支持多種數(shù)據(jù)類型,并準(zhǔn)備支持現(xiàn)有和新興的行業(yè)標(biāo)準(zhǔn)。
如今,隨著這個(gè)市場(chǎng)的成熟并發(fā)現(xiàn)流數(shù)據(jù)的更廣泛的應(yīng)用和接受,業(yè)務(wù)和技術(shù)要求正在不斷擴(kuò)大。數(shù)據(jù)流至少必須:
- 提供實(shí)時(shí)分析。
- 包括集成的數(shù)據(jù)管理,包括數(shù)據(jù)沿襲。
- 根據(jù)數(shù)據(jù)提供實(shí)時(shí)操作。
- 執(zhí)行實(shí)時(shí)異常檢測(cè)。
- 支持所有類型的數(shù)據(jù),包括有序和無(wú)序數(shù)據(jù)集。
- 隨流數(shù)據(jù)一起攜帶重要的標(biāo)記信息。
- 支持獨(dú)立的數(shù)據(jù)區(qū)域設(shè)置。
- 嵌入數(shù)據(jù)安全性。
- 提供附加功能。
- 需要速度和吞吐量。
上面的要求是流技術(shù)的基礎(chǔ)。除了這些明顯的要求之外,我還建議了三個(gè)技巧來(lái)幫助您采用流技術(shù):
1. 為決策而構(gòu)建
傳統(tǒng)上,分析是一種后處理功能,但在流技術(shù)領(lǐng)域卻并非如此。流將分析范圍擴(kuò)展到在關(guān)鍵時(shí)刻提供關(guān)鍵數(shù)據(jù)。相反,流的分析模型依賴于問(wèn)題確定和行動(dòng)。這意味著流分析可以觸發(fā)警報(bào),協(xié)調(diào)呼叫并將實(shí)時(shí)數(shù)據(jù)提供給舊版應(yīng)用程序以立即改善業(yè)務(wù)。
為了使所有這些工作正常進(jìn)行,流必須支持從GPU到CPU的最新計(jì)算模型,尤其是考慮到越來(lái)越需要在物理上更接近執(zhí)行工作的地方進(jìn)行工作。最后,隨著計(jì)算和存儲(chǔ)變得更加專業(yè)化,將需要流技術(shù)來(lái)支持專注于查詢或推理的參考體系結(jié)構(gòu),該體系結(jié)構(gòu)由用于高級(jí)分析的API和過(guò)程組成。
2. 了解您的業(yè)務(wù)案例
傳統(tǒng)上,我們將數(shù)據(jù)帶回中央數(shù)據(jù)倉(cāng)庫(kù)或一系列數(shù)據(jù)湖,然后在其中進(jìn)行分析。創(chuàng)建了許多技術(shù)來(lái)支持這種結(jié)構(gòu),包括Hadoop,數(shù)據(jù)多維數(shù)據(jù)集解決方案和多維數(shù)據(jù)庫(kù)。物聯(lián)網(wǎng)和流媒體解決方案的出現(xiàn)徹底改變了這種范例。如今,邊緣應(yīng)用程序是圍繞推理模型構(gòu)建的,從而允許邏輯工作更靠近生成數(shù)據(jù)的位置進(jìn)行。不再需要將數(shù)據(jù)回傳到中央存儲(chǔ)庫(kù)或云。可以實(shí)時(shí)掃描IoT數(shù)據(jù)以確定異常或提供數(shù)據(jù)趨勢(shì)。噪聲數(shù)據(jù)可以本地存儲(chǔ),也可以在源頭刪除,這代表著網(wǎng)絡(luò),計(jì)算和存儲(chǔ)量的大幅減少。
正確的流技術(shù)可以通過(guò)內(nèi)置邏輯,快速準(zhǔn)確的問(wèn)題確定和根本原因分析來(lái)識(shí)別數(shù)據(jù)中的異常。無(wú)需指責(zé)即可確定準(zhǔn)確的問(wèn)題區(qū)域,可幫助工程師在創(chuàng)紀(jì)錄的時(shí)間內(nèi)解決問(wèn)題,降低成本并提高客戶滿意度。流解決方案還應(yīng)該具有靈活的能力來(lái)建立單獨(dú)的流,為機(jī)器學(xué)習(xí)或AI訓(xùn)練模型提供這些異常的預(yù)定格式以供攝取-自動(dòng)分析高度復(fù)雜和具有挑戰(zhàn)性的問(wèn)題區(qū)域。
3. 對(duì)現(xiàn)實(shí)世界的支持
流技術(shù)必須支持簡(jiǎn)化編程的配置,并且必須高度適應(yīng)多種環(huán)境。如今,支持無(wú)序數(shù)據(jù)處理的能力已成為常態(tài)。但是,對(duì)支持流中的有序數(shù)據(jù)的要求日益嚴(yán)格。對(duì)于機(jī)器學(xué)習(xí)和AI模型,這至關(guān)重要。流平臺(tái)中必須有順序處理流。知道并支持有序流可以提高建模的準(zhǔn)確性,并且可以大大改善問(wèn)題確定性,并可以對(duì)可預(yù)測(cè)的數(shù)據(jù)排序進(jìn)行有力的控制。
最重要的是,數(shù)據(jù)流代表了跨云、混合云和邊緣計(jì)算等復(fù)雜環(huán)境的數(shù)據(jù)融合中的下一個(gè)重大飛躍。數(shù)據(jù)流今天就在這里,隨著物聯(lián)網(wǎng)的出現(xiàn),它們是未來(lái)的浪潮。