機器學習在網絡中的實際應用
每個網絡應用程序都有自己的一組功能和性能參數,這些功能和參數可能會動態變化。由于網絡的多樣性和復雜性,圍繞此類網絡場景構建的傳統算法或硬編碼技術是一項具有挑戰性的任務。
事實證明,機器學習在幾乎所有行業都是有益的,包括網絡行業。機器學習可以幫助解決棘手的舊網絡障礙,刺激新的網絡應用程序,使網絡變得非常方便。讓我們通過幾個用例詳細討論基本工作流程,以便更好地理解網絡領域中的應用機器學習技術。
智能網絡流量管理:
隨著對物聯網解決方案需求的不斷增長,現代網絡產生了大量異構的流量數據。對于這樣一個動態網絡,傳統的網絡流量監控和數據分析網絡管理技術(如Ping監控、日志文件監控,甚至SNMP)是不夠的。它們通常缺乏實時數據的準確性和有效處理。另一方面,由于設備移動性和網絡異構性,網絡中來自其他來源(如蜂窩或移動設備)的流量相對顯示出更復雜的行為。
機器學習有助于在大數據系統和大區域網絡中進行分析,以便在管理此類網絡時識別復雜模式。鑒于這些機會,網絡領域的研究人員將深度學習模型用于網絡流量監控和分析應用,如流量分類和預測、擁塞控制等。
1.帶內網絡遙測
網絡遙測數據提供了有關網絡性能的基本指標。這些信息通常很難解釋出來。考慮到網絡中的數據量和總數據量具有巨大的價值。如果使用得當,它可以顯著提高性能。
新興技術,如帶內網絡遙測,可以幫助實時收集詳細的網絡遙測數據。最重要的是,在這些數據集上運行機器學習可以幫助關聯延遲、路徑、交換機、路由器、事件等之間的現象,這在使用傳統方法的大量實時數據中很難指出。
機器學習模型經過訓練以理解遙測數據中的相關性和模式,從而最終獲得基于歷史數據的學習預測未來的能力。這有助于管理未來的網絡中斷。
2.資源分配與擁塞控制
每個網絡基礎設施都有預定義的可用總吞吐量。它被進一步分割成不同預定義帶寬的多個通道。在這樣的場景中,每個最終用戶的總帶寬使用量是靜態預定義的,對于網絡的某個部分來說,總是會出現瓶頸,而該部分網絡的使用率是壓倒性的。
為了避免這種擁塞,可以訓練有監督的機器學習模型來實時分析網絡流量,并以網絡經歷最少瓶頸的方式推斷每個用戶的合適帶寬限制。
這些模型可以從網絡統計數據中學習,例如每個網絡節點的總活動用戶、每個用戶的歷史網絡使用數據、基于時間的數據使用模式、用戶在多個接入點之間的移動等。
3.交通分類
在每個網絡中,都存在各種各樣的流量,如Web托管(HTTP)、文件傳輸(FTP)、安全瀏覽(HTTPS)、HTTP實時視頻流(HLS)、終端服務(SSH)等。現在,當涉及到網絡帶寬使用時,每一種行為都有所不同,即通過FTP傳輸文件。它連續使用大量數據。
例如,如果一個視頻正在流化,它將使用數據塊和緩沖方法。當不同類型的流量以無監督的方式在網絡中運行時,可以看到一些臨時阻塞。
為了避免這種情況,可以使用機器學習分類器對網絡中的流量類型進行分析和分類。然后,這些模型可用于推斷網絡參數,如分配的帶寬、數據上限等,以通過改進所服務請求的調度以及動態更改分配的帶寬來幫助提高網絡性能。
網絡安全:
網絡攻擊數量的增加迫使組織不斷監控和關聯整個網絡基礎設施及其用戶的數百萬外部和內部數據點。手動管理大量實時數據變得很困難。這就是機器學習幫助的地方。
機器學習可以識別網絡中的某些模式和異常,并在海量數據集中預測威脅,所有這些都是實時的。通過自動化分析,網絡管理員可以輕松地檢測到威脅并快速隔離情況,而所需的人力更少。
1.網絡攻擊識別/預防
網絡行為是機器學習系統異常檢測的一個重要參數。機器學習引擎實時處理大量數據,以識別威脅、未知惡意軟件和違反策略的行為。
如果發現網絡行為在預定義的行為范圍內,則接受網絡事務,否則將在系統中觸發警報。這可用于防止DoS、DDoS和Probe等多種攻擊。
2.防止網絡釣魚
誘騙某人點擊看似合法的惡意鏈接,然后試圖突破計算機的防御系統是很容易的。機器學習有助于預測可疑網站,幫助防止人們連接到惡意網站。例如,文本分類器機器學習模型可以讀取和理解URL,并首先識別那些偽造的釣魚URL。這將為最終用戶創造更安全的瀏覽體驗。
網絡中機器學習的集成不限于上述用例。通過從網絡和機器學習的角度揭示機會和研究,可以在使用ML進行網絡和網絡安全的領域開發解決方案,以解決尚未解決的問題。