5G無線問題AI識別與根因定位助力網絡質量提升
作者|張哲 陳娟娟,單位:河北移動
Labs 導讀
自工信部正式發放5G商用牌照以來,我國進入5G時代,河北移動積極投入網絡建設,推進5G商用網絡的發展。在5G基站大規模投入的同時伴隨著一系列無線網絡質量及客戶滿意度問題,而我們當前正處于穩4G拓5G階段,那么如何減負、高效、準確解決問題成為工作重點挑戰。在5G網絡復雜度提高和場景化Pattern組合復雜的大背景下,對優化人員能力要求逐步提高,這就需要將專家的優化經驗進行沉淀和迭代,并逐步實現工具智能化。河北移動通過對無線性能、告警和MR數據進行治理,建立VoNR評估體系,并使用AI預測能力對網絡進行精準問題識別,構建規則引擎模塊對問題進行無線根因判斷,實現無線問題從識別到智能分析的能力,有效提高了5G網絡問題識別的準確性和問題處理效率,助力提升5G網絡質量,打造5G網絡高質量形象和口碑。
1技術方案介紹
1.1 數據治理
數據治理將O域平臺的數據通過資產目錄、模型分層、權限管理和模型管理等將性能、告警、MR數據進行資產沉淀和總結,在使用時快速進行查看和調用。
1.2 VoNR評估體系
通過對數據治理后,有效識別VoNR關鍵指標,支撐VoNR商用初期網絡問題發現,實現VoNR的端到端感知提升及問題快速定界,構建基于關鍵接口關聯的全流程端到端VoNR體驗保障體系。建立基于專家經驗庫+大數據分析的自動定界、基于規則引擎&可自定義配置的無線質差小區自動分析定位的能力以及根因推薦,支撐VoNR商用保障。
圍繞注冊、接入、保持、語音質量維度構筑VoNR感知評估體系,針對VoNR特性構建關鍵指標趨勢洞察、問題定界能力以及異常問題的回溯能力,支撐VoNR商用中的網絡質量監控,異常問題快速發現和定界。
1.3 無線質差問題識別
無線質差識別將VoNR評估體系的注冊、接入和保持類等指標進行TOPN閾值設定,并利用智能KPI異常檢測的多數據源自動關聯、多窗口聯動分析、基于AI算法的深度分析自動識別質差小區。同時支撐人工自定義配置識別質差小區,適用多種場景,問題發現更為快捷高效。
1.4 根因診斷與分析
1.4.1 構建規則引擎能力
定界規則引擎提供無線側規則管理功能,在規則編排界面可自主靈活配置無線側問題定界定位規則。規則引擎自動集成了無線MR、告警、操作日志和性能指標,可精準定位問題時段的問題原因,且支持自定義編排規則,包括新建、刪除、修改等、可靈活設置規則參數門限,系統提供了700+基于專家經驗形成的預置規則。
1.4.2 無線根因智能定位
規則引擎關聯操作日志、告警、鄰區、參數、覆蓋、容量、干擾、傳輸信息等方便人工分析。基于TOPN識別的無線質差小區可主動調用規則引擎,并進行根因排序,輸出無線質差小區的關鍵原因,指導問題快速處理及閉環。
2技術創新點
2.1 KPI異常檢測
無線KPI具有變化的周期性、波動性、分段性等特征,監控門限難以固化,過低可能產生大量虛警,過高可能無法發現異常,而傳統無線網絡性能采用靜態/規則閾值難以完整適配性能特征的不規則性和多樣性。另外IT和CT領域網絡(設備)結構越來越復雜,進而導致監控指標越來越多,傳統的基于專家經驗設置靜態閾值的方式越來越難以完成網絡(設備)的全面監控,難以適應指標的動態變化。基于AI的KPI異常檢測智能生成動態閾值,并且基于漏斗原則實現大規模指標的同時監控。
通過KPI異常檢測,實現異常感知時間2h->30min的縮短,提升VoNR異常感知檢測效率。
2.2 告警關聯匯聚
通過KPI告警匯聚和合并,快速識別VoNR問題聚集點,提升問題等級,實現問題的快速識別與閉環。
KPI告警匯聚的原則:
- 時間上同時發生。
- 空間維度相鄰:必須考慮空間上是有相鄰的,可以通過重要鄰區、共站、相近、拓撲等來進行匯聚。
- 業務相關:需要考慮主指標的劣化對應的原因值是相同的。
KPI告警合并的原則:深度優先搜索DFS
- 所有小區及其鄰區關系可視為圖結構,小區為頂點,鄰區關系為邊;
- 從根節點開始,沿著樹(圖)的寬度遍歷樹(圖)的節點,直到以vt出發的所有節點都被訪問到。當前檢測兩個出現告警則進行聚合??
基于上述在時間維度(同時發生)、空間維度(相鄰/拓撲)、業務維度(業務相關)的分析結果,將相關的告警進行合并成同一個事件,從而提升關聯準確度。
2.3 卡片式管理
支持用戶靈活、直觀地設計和定制Dashboard顯示布局、指標和粒度,設置并保存個性化的dashboard模板以便復用。
3應用效果
定位準確率:自動診斷問題根因定位準確率達80%以上,其中SA接通率達86.52%
生產效率:無線質差VoNR Top小區處理效率由 13個/人天 提升至20個/1天 ,效率提升50%。全量top小區分析周期由周提升至天。
作業流提效:作業流效率提升明顯,問題處理端到端環節工作效率提升約35.83%。
分析作業流發生變化,相比傳統分析流程省去數據采集和VoNR top N識別過程,且根因分析和優化建議輸出更加快捷。