強強聯手,可視化與人工智能的完美結合!
可視化與可視分析利用高帶寬的視覺感知通道, 將數據轉換為圖形表達, 輔以交互手段, 以增強人對數據的認知能力, 在態勢感知、關聯分析、決策輔助等方面展示了強大的賦能作用。隨著以深度學習為代表的人工智能技術的突破性進展, 面向人工智能的可視化和人工智能驅動的可視化受到了可視化、機器學習、數據挖掘等領域的高度關注。
一方面, 可視化與可視分析在改善人工智能的基礎數據質量和可解釋性方面發揮了巨大作用 。高質量訓練數據是高性能人工智能應用的必要前提。針對異常檢測、數據標記等需要大量人工勞動的任務, 利用可視化與可視分析技術提高其效率, 是當前的研究熱點之一 。更令人關注的是人工智能的可解釋性問題。以深度神經網絡為例, 它具有非線性非凸、多層結構、海量參數、弱語義特征等特點, 被認為是一個難以解釋的“黑盒子”。在自動駕駛、智能醫療、金融投資等高風險決策領域, 可解釋性成為阻礙領域技術發展的瓶頸問題??梢暬梢詭椭嵘龣C器學習的透明度, 增強人對大規模復雜機制的認知能力。各領域在基于可視化的深度學習解釋方法方面進行了大量的研究工作, 例如患者未來狀態預測、機器人訓練策略 , 以及自然語言處理任務。
另一方面, 人工智能技術的進步為可視化與可視分析的發展提供了強有力的工具。針對復雜數據、復雜模式等需要呈現大量信息的可視化任務, 利用機器學習技術能夠去除數據噪聲、提取關鍵信息,從而減少視覺混亂、增強可視化效果 。同時, 利用人工智能技術擬合數據特征和可視編碼也為可視化布局帶來了新的機遇。數據特征和可視編碼的結合催生了更具表現力的可視化設計 ; 利用人工智能技術的海量數據自動化布局避免了耗時的數據操作和數據計算 ; 人工智能技術還被應用于解決大規模數據可視化中的交互效率難題, 例如體數據渲染中智能視角選擇、區塊鏈智能合約交互式構建和大型網絡的交互式可視探索。
目前, 可視化與人工智能的交叉研究已經表現出了巨大的潛力, 促進了可視化與人工智能領域的關鍵技術發展。在如下方面, 可視化與人工智能的交叉研究有望取得較大突破。
(一)協同可視分析中的數據隱私保護
數據分布在多個數據擁有方, 是大數據應用場景中的常態, 自然產生了多方參與的協同可視分析任務。然而, 由于數據版權或隱私保護問題, 這些數據擁有方往往無法直接共享數據。協同可視分析有兩項關鍵挑戰。首先, 如何在不交互數據的情況下生成聯合數據可視化結果。其次, 數據可視化結果如何保護數據隱私。目前, 對于第一個問題的研究還較少。安全多方計算、聯邦學習等方法為解決數據孤島問題提供了思路。如何將這些方法應用于協同數據可視分析, 是值得研究的方向。
(二)可解釋機器學習
首先, 目前的大部分研究聚焦于模型訓練后的離線分析。但深度學習模型的訓練本身是一個耗時的過程, 隨著深度學習模型規模和訓練數據量的進一步增長, 訓練時長已增加到數天甚至數周。及時發現訓練過程中的偏差并進行診斷和決策具有重要的意義。類似地, 在在線學習過程中, 訓練過程隨著流數據的到來持續進行, 離線分析模式往往難以及時捕捉數據和模型的變化, 從而無法提供有效的指導。研究深度學習的在線可視分析方法, 在訓練過程中對模型進行監督和指導, 具有重要的研究意義。
(三)智能特征提取
人工智能的進展改變了特征提取的流程, 減少了特征工程的工作量, 通過端到端的形式提供數據的壓縮表達。另一方面, 人工智能提供了多種嵌入方法, 將復雜類型數據轉換到易于理解的高維空間。因此, 基于人工智能的特征提取為可視化與可視分析提供了簡潔的表達基礎。用于可視化與可視分析的特征提取面臨的挑戰在于: 自動提取的特征不一定具有明確的語義信息, 不利于理解與解釋。如何根據分析需求定制語義特征提取方法, 是當前需要解決的難題。
(四)可視化的自動生成
自動可視化從數據自動生成能夠準確表達重要模式的可視化視圖, 對缺乏相關知識和技能的普通用戶具有重要的作用。當前主要有兩類方法。第1類是基于設計經驗知識, 將可視化設計問題歸約成最優化問題求解。這一類方法效果較好, 具有較高的可理解性。但最優化原則的提煉需要較多的設計經驗和嘗試。第2類方法是采用具有端到端性質的深度學習, 跳過了對設計原則的總結階段。當前, 在大圖的布局、大規模數據體繪制等算法上, 深度學習模型取得了良好的效果。但由于數據空間和可視化視圖空間都非常龐大, 訓練深度學習模型需要大量的高質量訓練數據。對于大多數可視化視圖而言, 訓練數據集的生成是一個需要攻克的難題。
(五)智能交互
人機交互是可視分析中不可或缺的一環, 目前的挑戰主要包括兩個方面。首先是精確的選擇。如何在全體數據集中精確地選取包含感興趣模式的子集, 是當前研究的熱點問題, 例如在點云數據中選取感興趣部分, 在時空數據中選取保護特定模式的時間段。其次是大規模數據的交互難題。由于存儲和計算方面的壓力, 大規模數據的交互一直是一個挑戰。人工智能技術通過壓縮表達、智能索引、查詢預測等方法, 為解決交互難題提供了技術途徑。如何提出準確、普適的智能交互方法, 將是未來研究的重點。
(六)智能故事敘述
可視化的核心功能是信息的表達, 如何用可視化講好一個故事, 是可視化研究的重要主題。隨著人工智能技術的發展, 利用可視化進行故事敘述的研究進一步變為智能故事敘述。具體而言, 智能故事敘述主要體現在以下方面: 首先, 是故事的自動拆解與自動化生成。會有更多的研究致力于提煉故事敘述的元素、將組成故事的可視化表達進行拆解與總結, 進一步地支持故事的自動化生成。其次, 在自動化的基礎上, 智能故事敘述的第二個體現是多樣性, 智能的意義在于可以學習不同的故事風格、敘述手法、可視化表達, 進行組合與創造, 產生新的多種多樣的可視化故事敘述。最后是人機融合, 用戶可以用極小的交互代價, 利用機器智能構造出符合用戶心中構思的故事的樣子, 即在多樣的故事中能夠快速智能地構造出符合用戶預期的可視化故事。
本文由蠟筆聊最炫科技原創,歡迎關注,帶你一起長知識!