機器學習在銀行有哪些應用場景?
一、機器學習平臺與大數據平臺的關系澄清
機器學習平臺和大數據平臺沒有硬性的關系,比如很多同業在沒有大數據平臺之前就借助 SAS 、 SPSS 等建模工作進行建模,且在相關領域也取得了不錯的成績,比如評分卡等。在我們看來大數據平臺和 SAS 等傳統的建模平臺有以下差別:

但是由于近期銀行在大數據方面發力迅猛,對在銀行業的建模(機器學習)的影響較大,主要方面有三:
一是大數據平臺為機器學習平臺提供了大數據支撐。好的模型是通過數據不斷的分析、迭代、優化出來的,大數據平臺的海量數據為模型的探索提供了豐富的原材料;
二是大數據平臺上的 KAFKA 等實時數據工具為機器學習平臺提供了實時數據以及實時場景,比如在線推薦、反欺詐、實施風控等場景;
三是大數據平臺為機器學習提供強大的算力以及處理能力。大數據采用 SPARK 方式等分布式的機器學習算法較 SAS 等單機版的計算性能有較大的提升,使得計算能力更加強大。且大數據平臺更易于圖數據庫結合,應用圖算法將某些場景下的機器學習能力提升。
二、機器學習平臺是銀行的建設趨勢嗎?
從以上情況看來機器學習平臺是大數據的一個重要的發力點,模型比傳統的業務系統有更強的場景驅動性,業務穿透性更強。建設機器學習平臺有可能是銀行整體規劃,也有可能是偶然性的項目需求中提出的。但建議銀行可以盡早的了解學習此類平臺、技術和算法等,建立人才儲備和項目管理(建模類)機制,應對未來的業務需求和項目風險。
銀行如何引入機器學習平臺?情況大多是科技部驅動,較項目驅動比例略低。比如審計、分析平臺、營銷類、風控類項目都可能包含機器學習平臺的引入,主要看業務需求是否能由傳統方式實現。
三 . 機器學習在銀行的主要應用場景
常用的機器學習算法都可能用到,比如分類,聚類,關聯,也會用到深度學習和圖算法等。應用場景見下表:
結合以上的場景分析,希望給大家同行在機器學習領域的場景研究提供參考。