?譯者 | 崔皓
審校 | 孫淑娟
開篇
機器學習被企業(yè)應用到不同的業(yè)務場景解決不同的業(yè)務問題,隨著機器學習的廣泛應用也讓組織在選擇學習方法時不堪重負。
很多組織在機器學習的應用中使用了高級和經(jīng)典的學習方法。有大家熟悉的監(jiān)督學習和無監(jiān)督學習二分法,還有例如對比學習、強化學習和自我監(jiān)督學習等機器學習的新興變體。
此外,還有涉及圖形分析、深度神經(jīng)網(wǎng)絡、分割、行為分析和其他技術。當面對大規(guī)模復雜業(yè)務問題時——例如加強反洗錢措施從而打擊金融犯罪——組織如何決定使用哪種機器學習的方法呢?
使用集成建模,讓這個問題變得不那么重要了。這種機器學習方法使組織能夠利用各種模型并將它們與預測準確性結合起來,從而獲得最佳結果。
這種方法幫助金融服務、欺詐檢測和網(wǎng)絡安全中的高維數(shù)據(jù)提供完整上下文。使用集成建模的組織表示“集成建模讓模型的建立更加多樣化“,Resistant AI首席執(zhí)行官Martin Rehak 承認,“我們并不希望單一模型一枝獨秀。”
使用模型的多樣性使組織能夠用不同的算法來評估業(yè)務問題的各個方面,以便采用完全知情的、一致的決策方法——這些方法是可以解釋的。
基于共識的模型決策
前面提到的集成建模的原理是毋庸置疑的,數(shù)據(jù)科學家無需花費大量時間來為業(yè)務案例設計完美的模型,只需要將那些不完美的模型組合起來產生預測能力。“當你以集成方法看待機器學習時,你會從小型算法中做出決策,”Rehak 指出。“而且,在我們的案例中,這些算法是針對每筆交易動態(tài)組合的,以便做出最佳決策。” 更重要的是,也許這些模型中的每一個都可以專注于某一個垂直領域,例如識別洗錢事件。
例如,一種模型只專注于交易的規(guī)模。另一個模型專注于交易的位置。不同的模型可以檢查出哪些特定參與者參與了交易。目標是“沒有出現(xiàn)任何峰值”的情況,Rehak 解釋說。“模型的分布非常平坦,與模型對應的證據(jù)頁相對較弱。通過結合許多弱證據(jù)元素,就能夠做出更強有力的決定。” 另一個好處是,通過經(jīng)典的機器學習和更簡單的模型,將模型投入生產所需的訓練數(shù)據(jù)(和注釋)減少。這樣的模型比需要大量訓練數(shù)據(jù)的深度神經(jīng)網(wǎng)絡更容易解釋。
上下文建模
將 Rehak 所描述的分布平坦的建模方式與其他集成建模技術區(qū)分開來是很重要的。最常見的集成建模示例涉及 bagging 或boosting?(后者可能需要 Xtreme Gradient Boosting)。隨機森林是一個基于不同決策樹組合的提升示例。使用這種方法,“你可以根據(jù)集合中的先前版本一個一個地構建集合,”Rehak 評論道。盡管它是一種快速構建具高預測準確性的模型方法,但它存在過度擬合的風險(由于訓練數(shù)據(jù)集太小,導致模型變得不太適用于生產數(shù)據(jù))。
Rehak 的集成方法更適合 AML 用例,因為它基于影響這些事件的上下文。“如果您詢問洗錢專家交易是否惡意,他們首先是查看賬戶的歷史以及該人過去的行為方式,”雷哈克說。通過他的方法,與地理位置、時間、相關方和金融機構等相關因素,使用單獨的機器學習模型進行檢查。只有將這些模型的每個結果組合在一起,人工智能系統(tǒng)才能確定是否存在犯罪交易,通過這種做法的誤報會明顯減少。“通過機器學習可以解釋大多數(shù)異常值,否則海量的異常值會淹沒反洗錢團隊,”雷哈克說。
決策邊界
在用例進行集成建模時,使用超過 60 個模型針對分析交易的不同方面進行建模是常見的事情。集成方法的實時結果非常適合這種應用場景。“這 60 種算法中的一種可以將所有內容分割成段,然后對每秒平均事務大小進行建模,”Rehak 透露。“我們可以有數(shù)千個片段,這些片段都是同時動態(tài)更新的。”
由于將大量模型整合到集合中,每個模型都會評估交易的不同方面從而發(fā)現(xiàn)潛在的犯罪行為,除此之外再不能創(chuàng)建更全面的方法了。Rehak 透露:“我們從多個角度看待你,以至于塑造你行為的同時讓你避免所有這些犯罪行為變得非常困難。”“因為,為了不被識別出來,“犯罪分子”需要避免的不止一個決策邊界,而是大量動態(tài)的決策邊界。這些算法中的每個模型都是獨立學習的,然后我們將它們組合在一起。”
可解釋的人工智能
這些集合如何增強可解釋性以及所對應的許多方面。 首先,他們沒有過度依賴先進的機器學習,只包含簡單、更可解釋的算法(涉及傳統(tǒng)機器學習)。這些模型成為評估交易犯罪的基石。“當我們說某件事很重要時,我們可以告訴你原因,”雷哈克說。“我們可以告訴你哪些指標表明了這一點。我們可以針對為每個發(fā)現(xiàn)寫一份報告,指出由于這些因素會造成交易犯罪的高風險。” 盡管每種算法都專注于特征,但并非所有算法在模型中都具有相同的權重。一般而言,涉及圖形分析(擅長檢查關系)的算法??比其他模型具有更大的權重。
模型不僅可以解釋可疑的行為,也可以告訴你異常值出現(xiàn)的原因。“通常我們在集成中有四到五個占主導地位的算法,也就是說當我相信這是一個異常值時由于有算法的支撐,其他人也會表示同意,”Rehak 指出。“而且,我們有四五個觸發(fā)因素,這就保證了在某種程度上使結果更偏向于異常。” 由于單個模型僅評估交易中的一個因素,因此它們提供了分數(shù)的可解釋性和單詞的可解釋性。“因為我們知道集合,知道微分段,還知道交易量,我們可以很容易地在分數(shù)旁邊通過問題顯示這些信息,而交易量對一家公司的財務部門非常重要,”雷哈克補充道。
集成模式
最終,集成建模的使用效果超過了任何一種應用程序,盡管它對 AML 活動有巨大的幫助。如果應用得當,該技術可以提高可解釋性,同時減少解決業(yè)務關鍵問題所需的訓練數(shù)據(jù)和注釋數(shù)量。
集成建模利用各種數(shù)據(jù)科學技術來解決多種業(yè)務問題,而不是將問題限制在一個或兩個。因此,這種集成解決問題的方法可能會成為AI 部署的典型代表。
譯者介紹
崔皓,51CTO社區(qū)編輯,資深架構師,擁有18年的軟件開發(fā)和架構經(jīng)驗,10年分布式架構經(jīng)驗。曾任惠普技術專家。樂于分享,撰寫了很多熱門技術文章,閱讀量超過60萬。《分布式架構原理與實踐》作者。
原文標題:???Machine Learning Model Management: Ensemble Modeling???