常見機器學習用例TOP 7,在你身邊無處不在!
想象一下——你明天要去面試一個向往已久的機器學習崗位。一切都必須按計劃進行,否則就會功虧一簣。
所以,你告訴智能小助手:
- 定一個明天早上7點的鬧鐘
- 在Uber上預約一個直達面試地點的快車,早上8:30來接我
- 計算一下車費
- 在谷歌地圖上看看路上要花多長時間
- 最后列出面試前還需要再多看幾眼的資料
這樣的好處是什么?你不需要忙前忙后或是親自花時間打字。只需要給虛擬智能小助手發送指令,機器學習算法就會讓系統開始為你工作!
這不是某個科幻場景(也不是機器終于有了“人心”)——這是正在發生的事實。隨著計算能力的進步,機器學習應用不斷發展,而我們也正在經歷一場真正的全球變革。
那么,今天我們就來看看,在日常生活中有哪些最常見的機器學習用例(有時我們甚至沒有意識到這些例子涉及機器學習)。
本文涵蓋了以下常見的機器學習用例:
1. 機器學習在智能手機中的用例
你知道嗎,智能手機中的大多數功能都是由機器學習支持的。
沒錯!從幫你定鬧鐘、找餐廳的語音助手到通過面部識別解鎖手機等一系列簡單的功能-機器學習已經真正融入到了我們最喜歡的設備當中。
(1) 語音助手
還記得前文提到的虛擬智能小助手嗎?它的原理就是語音識別概念——這是機器學習領域中的一個新興話題。
現在語音助手已經很普遍了。你肯定用過(或者至少聽過)以下常見的語音助手:
- 蘋果的Siri
- 谷歌助手
- 亞馬遜的Alexa
- 谷歌Duplex
- 微軟的Cortana
- 三星的Bixby
這些語音助手有什么共同點?它們都是由機器學習算法支持的!這些語音助手使用自然語言處理(NLP)識別語音(即我們所說的話),然后使用機器學習將其轉換為數字,并據此做出響應。
隨著機器學習技術的進步,這一領域已經日漸成熟,這些語音助手也會越來越智能。你可以觀看下文的精彩教程,學習建立自己的語音識別系統:
學習如何構建自己的語音-文本模型(運用Python) 傳送門:
https://www.analyticsvidhya.com/blog/2019/07/learn-build-first-speech-to-text-model-python/
(2) 智能手機相機
等等,機器學習跟智能手機相機有什么關系?事實上關系可大了。
我們每天點開看到的精美圖片和這些圖片的深度,都有機器學習的足跡。機器學習分析給定圖片中的每個像素,以檢測對象、模糊背景和采取一系列美化技巧。
這些機器學習算法可以改進和增強智能手機的攝像頭:
- 對象檢測可以定位和識別圖像中的對象(或人)
- 填補圖片中缺失的部分
- 使用特定類型的神經網絡利用生成對抗網絡(GANs)來增強圖像,甚至通過想象圖像的樣子來擴展其邊界等。
有興趣了解更多相關信息來學習如何使用機器學習構建自己的智能手機攝像頭軟件?無需等待!以下教程可以帶你入門:
谷歌像素相機背后的深度學習技術介紹!
傳送門:
https://www.analyticsvidhya.com/blog/2019/02/tutorial-semantic-segmentation-google-deeplab/
(3) 蘋果和谷歌應用商店的推薦
蘋果(Apple App Store)和谷歌(Goole Play Store)應用商店都有推薦這個功能。“為您推薦”這個功能的依據就是已經下載過的應用程序(或是以前使用過的)。
例如,如果你下載了一些與體育和美食相關的應用程序,那么“為您推薦”通常都會推送類似的應用程序。谷歌應用商店可以根據你的喜好進行個性化,同時推送你更有可能下載的應用程序。
那么蘋果和谷歌商店是如何做到的呢?四個大字——推薦引擎。這是目前機器學習中非常熱門的概念。構建推薦引擎的方法多種多樣,你可以根據以下教程選擇適合自己的方法:
• 從零開始構建推薦引擎綜合指南(在Python中)
傳送門:https://www.analyticsvidhya.com/blog/2018/06/comprehensive-guide-recommendation-engine-python/
(4) 面部解鎖——智能手機
大多數人對這個功能都相當熟悉了。我們拿起手機,通過識別面部就可以自動解鎖。這個功能智能、高效、省時,非常高級。
很多人不知道的是,智能手機其實是使用一種叫做面部識別的技術來實現這一功能的。而這種技術的核心理論—你知道的—就是機器學習。
面部識別的應用非常廣泛,世界各地的很多企業都已經從中獲益:
- 臉書通過這種技術識別圖像中的人物
- 政府用來識別和抓捕罪犯
- 在機場,面部識別系統可以核實乘客、機組人員等等
未來的幾年里,人臉識別模型的應用只會越來越廣泛,所以為什么不現在就來學習一下如何構建你自己的人臉識別系統呢?
面部識別簡易指南(使用python代碼):
https://www.analyticsvidhya.com/blog/2018/08/a-simple-introduction-to-facial-recognition-with-python-codes/
2. 交通中的機器學習用例
在過去的十年中,機器學習在交通運輸領域中的應用已經達到了一個全新的高度,其發展正好趕上了打車軟件(如Uber、Lyft、Ola等等)的興起。
這些公司將機器學習用于很多產品當中,從規劃最佳路線到決定打車的價格。讓我們看看在交通領域一些較多使用機器學習的用例。
(1) 打車的動態定價
你是否會因為打車公司大幅漲價而難過呢?打車的價錢似乎永遠在漲。為什么會這樣?
事實上,這涉及到動態定價的概念——這是一個絕妙的機器學習用例。為了理解這一點,讓我們舉一個簡單的例子。
想象一下你開了一家打車公司,需要給城市里的每一條線路制定打車價格,既要能吸引顧客,又能提高自己的盈利底線。一種方法是手動為每條線路設定價格。這顯然不是理想的方法。
因此,動態定價就會發揮關鍵作用。這意味著要根據不斷變化的市場狀況調整價格。因此,價格的變化取決于位置、時間、天氣、整體客戶需求等因素,這就是打車價格經常飆升的根本原因。
動態定價也是旅游、酒店、交通和物流等諸多行業越來越青睞的一種方法。
(2) 交通與通勤-Uber
動態定價不是像Uber這樣的打車公司使用機器學習的唯一用例。他們主要依靠機器學習來確定從A點到B點的最佳路線。
對于我們來說,這似乎是一個很簡單的事情。輸入位置和目的地,然后最近的司機就會來接我們。但這一簡單操作的背后是Uber后端復雜的結構和服務網絡。
這些公司運用了多種機器學習技術來優化打車路線。
讀一讀下面這篇Uber的文章,它詳細闡述了機器學習如何確定更快捷的路線:
Uber如何設計快捷的路線:https://eng.uber.com/engineering-an-efficient-route/
(3) 谷歌地圖
你肯定已經猜到會有這個例子了。谷歌地圖是機器學習的一個經典用例。以下是一些已廣泛使用的功能:
- 路線:從A點到B點
- 路線預計耗時
- 沿線交通狀況
- “探索附近”功能:餐廳、加油站、自動取款機、酒店、購物中心等
谷歌使用大量的機器學習算法來生成所有這些功能。機器學習已經深深地融入了谷歌地圖,這就是為什么每次更新后路線都變得更加智能化的原因。
路線預計耗時功能已經接近完美。如果地圖顯示“40分鐘”到達目的地,你可以確定實際耗時就差不多是40分鐘。
3. 熱門流行Web服務中的機器學習用例
你肯定會喜歡這一部分。我們每天都要多次使用一些應用。可能直到最近才意識到,正是由于機器學習的強大和靈活性,這些應用才可以正常工作。
以下是一些你非常熟悉的用例。讓我們從機器學習的角度來看一看。
(1) 郵件過濾
每天工作都閱讀大量郵件?或者郵箱充斥著隨機和垃圾郵件?我們都經歷過。
如果我們能編寫一條規則,讓郵箱通過郵件主題過濾郵件,這樣是不是就輕松多了?營銷郵件會自動轉到垃圾郵件。而工作郵件則會進入我的主收件箱(等等)。這會讓我們的生活輕松許多。
事實證明,這正是大多數電子郵件服務正在做的!他們使用機器學習來解析電子郵件的主題行并對其進行相應分類。以Gmail為例,谷歌使用的機器學習算法已經接受了數百萬封電子郵件的訓練,因此可以無縫地為終端用戶(我們)工作。
Gmail在提供默認郵箱標簽的同時,也允許用戶自定義標簽:
- 主要郵件
- 社交郵件
- 推銷郵件
機器學習算法會在收到電子郵件后立即將其歸類到這三個標簽中的一個。如果Gmail將其視為“主要”郵件,用戶會立即收到新郵件提醒。
當然,Gmail也使用機器學習來判斷電子郵件是否是垃圾郵件。這一功能深受我們喜愛。多年來,谷歌的算法在判斷電子郵件是否是垃圾郵件方面越來越智能。這就是給機器學習算法提供大量數據的好處——而谷歌最不缺的就是數據。
(2) 谷歌搜索引擎
這是所有機器學習用例中最熱門的一個。每個人都用過谷歌搜索,絕大多數人每天會多次使用。但是谷歌搜索的工作原理是什么?
谷歌搜索已經成為了一座無法逾越、不可攻克的大山。只有設計過谷歌搜索的人才知道它的工作原理到底是什么。可以肯定的是——谷歌運用機器學習來驅動其搜索引擎。
谷歌不斷訓練的數據量和不斷完善的數據量是無法想象的。世界上沒有計算器可以算出谷歌在過去20年里處理過多少問題。對于數據科學家來說,這是一個稀世寶庫!
現在想象一下,你得建立一個自己的谷歌搜索引擎。你會使用什么規則?你會涵蓋什么內容?你要如何排列網站?下面這篇文章可以幫你打開思路:
谷歌網頁排名簡易解讀!
傳送門:https://www.analyticsvidhya.com/blog/2015/04/pagerank-explained-simple/
(3) 谷歌翻譯
谷歌使用機器學習來理解用戶輸入的句子,將它們轉化為請求語言,再顯示輸出結果。機器學習深深植根于谷歌的生態系統,我們都從中受益。
幸運的是,我們知道谷歌是如何利用機器學習來驅動它的翻譯引擎的。以下文章可以幫助你理解并嘗試這一話題:
關于神經機器學習的自然語言處理必讀教程——技術驅動谷歌翻譯:
https://www.analyticsvidhya.com/blog/2019/01/neural-machine-translation-keras/
(4) 領英、臉書的推薦和廣告
社交媒體平臺是機器學習的經典用例。跟谷歌一樣,這些平臺已經將機器學習集成到它們的結構當中了。從家庭訂閱到你看到的種種廣告,所有這些功能的運行都要歸功于機器學習。
你經常看到的一個功能是“可能認識的人”。這是所有社交媒體平臺(Twitter、Facebook、LinkedIn等)的常見功能。這些公司使用機器學習算法來查看你的個人資料、興趣、你當前的朋友、他們的朋友以及所有其他變量。
然后,該算法就可以生成與特定模式匹配的人員列表。最后向你推薦這些人,希望你可能認識他們(或者至少擁有非常相似的個人資料)。
由于領英的這個功能,你可以與很多人都建立聯系。這一機器學習的用例對每個參與其中的人都有好處。
我們看到的廣告也是采用了相似的原理。這些平臺追蹤你的品位、興趣,特別是你最近的瀏覽或購買記錄,然后投送量身定制的廣告。如果你也是數據科學的愛好者,臉書或領英的機器學習算法可能會激發你深入學習的興趣。
下次使用社交媒體時可以留意這一點。這都歸功于機器學習!
4. 銷售與營銷中的機器學習用例
世界上的頭部公司都在利用機器學習來實現自上到下的戰略轉變。兩個受影響最大的領域就是營銷和銷售。
現在,如果你在營銷和銷售領域工作,至少需要知道一種智能商業工具(如Tableau或Power BI)。此外,營銷人員還需要知道如何在日常工作中利用機器學習來提高品牌知名度、盈利底線等。
因此,這里有三個在市場營銷和銷售中很常見的用例,機器學習正在改變這一領域的工作方式。
(1) 推薦引擎
我們之前簡單地談到了推薦引擎。這些推薦系統無處不在。但是,它們是市場營銷和銷售領域有什么用途呢?工作原理又是什么?
讓我們看一個簡單的例子來更好地理解這一問題。在IMDb(和網飛)出現之前,我們都是去DVD商店或是在谷歌上搜索電影觀看。店員通常會推薦一些影片,然后我們就選幾個從來沒看過的電影碰碰運氣。
由于推薦引擎的出現,碰運氣的日子一去不復返。我們可以登錄一個網站,然后就會根據個人品味和以前的瀏覽歷史推薦產品和服務。一些常見的推薦引擎有:
- 電子商務網站,如亞馬遜和Flipkart
- 圖書網站,如Goodreads
- 電影服務網站,如IMDb和網飛
- 酒店網站,如makemytrip、booking.com等
- 零售服務網站,如StitchFix
- 食雜網站,如Zomato和Uber Eats等
數不勝數。推薦引擎無處不在,而營銷和銷售部門比以往任何時候都更依賴于這些引擎來吸引(和留住)新客戶。
推薦各位閱讀這篇初學者教程,學習如何構建自己的推薦引擎:
從零開始構建推薦引擎綜合指南(在Python中):
https://www.analyticsvidhya.com/blog/2018/06/comprehensive-guide-recommendation-engine-python/
(2) 個性化營銷
推薦引擎只是個性化營銷總體概念的一部分。這一概念的意義就在于其名稱本身——它是一種根據個人需要量身定制的營銷技術。
試想:你接過多少電話向你推銷“免費的”借貸或信用卡服務?這些電話不想了解你的需求,清一色地推薦同一種服務。這種傳統的營銷已經過時,遠遠落后于數字革命。
現在,想象一下這些電話都是根據你的興趣量身定制的。如果你是一個購物狂,并且購物記錄可以看出這一點,或許你會接到一個電話給你提供一項新的服務——增加你的信用額度。或者,如果你是一個機器學習愛好者,你可能會收到一封郵件推薦適合你的課程。
事實上,個性化營銷的潛力是巨大的。機器學習可以識別不同的客戶群,并為每個客戶群定制營銷活動。你可以通過開放率、點擊率等指標定期檢查活動情況。
強烈建議各位閱讀以下指南,它可以幫助你重新包裝數字營銷策略:
每位數據科學人士都必讀的:數字營銷與分析綜合指南
傳送門:https://www.analyticsvidhya.com/blog/2018/12/guide-digital-marketing-analytics/
(3) 客戶售后詢問(以及聊天機器人)
如果你有過售后經歷(誰沒有呢?),那么你肯定可以從個人的角度理解這一點。那些可怕的電話、無休止的等待、懸而未決的查詢——所有這些都給用戶帶來了極其糟糕的體驗。
而機器學習有助于消除這些障礙。利用自然語言處理(NLP)和情感分析的概念,機器學習算法能夠理解我們在說什么以及說話時的語氣。
用戶詢問可以分為兩類:
- 語音詢問
- 文字詢問
對于前者,機器學習算法可以檢測客戶的消息和情緒,根據客戶的詢問重新指派合適的售后人員,然后有針對性地解決用戶問題。
另一方面,文本詢問的工作基本都由聊天機器人承包。現在幾乎所有企業都在自己的網站上設置了聊天機器人。他們避免了漫長的等待,并提供即時的回答——因此,這是一種非常實用的終端用戶體驗。
我們收集了兩篇關于如何構建自己的聊天機器人的文章,簡單易懂,值得一看:
- 學習如何運用Rasa迅速構建和部署聊天機器人(以IPL為例):https://www.analyticsvidhya.com/blog/2019/04/learn-build-chatbot-rasa-nlp-ipl/
- 運用Python構建聊天機器人——信息查詢的未來:https://www.analyticsvidhya.com/blog/2018/01/faq-chatbots-the-future-of-information-searching/
5. 安全領域中的機器學習用例
機器學習也正在擾亂安全行業。在傳統的安全行業中,保安們常常連續幾個小時坐在那里記下車牌號,阻止可疑的人——但這種做法正慢慢被淘汰。
企業正在使用機器學習來更好地分析威脅和應對襲擊。這些用例既適用于現實威脅,也適用于網絡威脅(銀行欺詐、金融威脅等)。
(1) 視頻監控
你肯定聽說過或讀過某個國家正在使用監控來追蹤其公民(谷歌上一搜就有)。全世界的機構都在利用視頻監控來執行各種任務,例如偵測入侵者、識別暴力威脅、抓捕罪犯等。
然而,這些都不是手動完成的,不然就太費時了。相反,這些監控攝像頭中都安裝了機器學習算法軟件。
這些機器學習算法使用各種計算機視覺技術(如目標檢測)來識別潛在威脅和抓捕罪犯。
以下是安全領域中常見的機器學習用例:
“天眼”是一個可以偵測人群中暴力分子的機器學習項目:
https://www.analyticsvidhya.com/blog/2018/06/eye-in-the-sky-is-a-machine-learning-project-that-detects-violent-people-in-crowds/
(2) 網絡安全(Captchas測試)
“我不是機器人”——這句話是不是聽起來很熟悉?當一個網站懷疑瀏覽者是機器人時,就是彈出這個按鈕。
這些測試被稱為CAPTCHA,全稱為Completely Automated Public Turing test(全自動區分計算機和人類的圖靈測試)。我們需要識別紅綠燈、樹木、人行橫道和各種各樣的物體來證明我們確實是人類。
同時,網站還設置各種各樣的困難,例如紅綠燈和樹木被其它物體遮蓋、汽車變得模糊、人行橫道在較遠處。為什么這些網站要如此刁難我們?原因還是機器學習。
網站Verge說得很好:
“CAPCHA測試很容易被拿來給人工智能做訓練,所以任何圖形測試都只能是暫時的,這也是CAPCHA的開發者一開始就承認的。所有研究者、騙子和普通人解決了數十億的難題,但是人工智能不費吹灰之力就可以做到,在某個時刻,這些機器將超越我們。”
因此,谷歌正在使用機器學習讓CAPTCHA測試更難破譯。研究人員正在使用圖像識別技術來破解這些CAPTCHA測試,從而增強其后端的安全性。
6. 金融領域中的機器學習用例
機器學習中的大多數崗位都面向金融領域。這也無可厚非——畢竟金融是終極的數字領域。許多銀行機構直到最近還在使用邏輯回歸(一種簡單的機器學習算法)來處理這些數字。
金融領域的機器學習用例有很多。現在就看看兩個可能遇到過的常見用例。
(1) 抓捕銀行詐騙
你遭受過信用卡詐騙嗎?這是一段痛苦的經歷。銀行要你填寫的文件數量加劇了欺詐對你的沖擊。
幸好,機器學習正在不同層次解決這一問題。從欺詐偵測到欺詐預防,機器學習算法正在改變銀行的工作方式,以改善客戶體驗。
目前的挑戰就是要跟上網絡威脅的水平。這些網絡攻擊者在每個階段都比我們搶先一步,甚至兩步。一旦最新的機器學習解決方案出現,這些攻擊者就會在新方案的基礎上完善手段。
盡管如此,機器學習確實有助于簡化流程。這些算法能夠識別欺詐交易并標記它們,這樣銀行就可以盡快與客戶取得聯系,檢查他們是否進行了交易。
一個很好的例子就是看看消費者的消費模式。如果用戶的某次消費不符合該模式(金額太高或來自不同國家等),則算法就會提醒銀行并暫停交易。
以下兩篇由網絡安全和機器學習專家撰寫的文章解釋了如何構建強大的惡意軟件檢測模型:
- 利用深度學習的力量確保網絡安全(第一部分):https://www.analyticsvidhya.com/blog/2018/07/using-power-deep-learning-cyber-security/
- 利用深度學習的力量確保網絡安全(第二部分):https://www.analyticsvidhya.com/blog/2019/05/using-power-deep-learning-cyber-security-2/
(2) 個性化銀行
另一個用例就是推薦引擎!這里的推薦引擎是專門針對銀行領域的。讀到這里,你肯定非常熟悉個性化了——所以在繼續閱讀之前,先思考一下個性化銀行是什么意思。
我們讀過一些文章,描述銀行針對不同的客戶群體提供量身定制的服務。而個性化銀行則將這一概念提升到一個全新的水平。
理想的個性化情形是使用機器學習來預測客戶的需求,并瞄準客戶群中的每一個客戶。波士頓咨詢的一份報告指出:
“銀行業的個性化主要目的不是銷售,而是每天、甚至是一天多次為客戶提供服務、信息和建議。在銷售中,銷售人員與顧客的溝通較少,與此相反,頻繁的互動是客戶銀行體驗的關鍵。”
以下是這份報告的全文:
銀行業的個性化真正意味著什么?:
https://www.bcg.com/publications/2019/what-does-personalization-banking-really-mean.aspx
7. 其他熱門的機器學習用例
這一部分的用例無法歸類到上述幾個部分當中。我也會持續更新這一部分,所以就讓我們從一個非常有趣的用例開始——自動駕駛汽車!
自動駕駛汽車
在本文討論的所有用例中,我最喜歡自動駕駛汽車。這是我們在硬件和機器學習方面所取得的最高成就。
自動駕駛汽車的優點在于,機器學習的三個主要方面——監督、無監督和強化學習——都貫穿在汽車的設計當中。
以下是使用機器學習的自動駕駛汽車的幾個功能:
- 檢測汽車周圍的目標
- 檢測與前方車輛、紅綠燈以及人行橫道之間的距離
- 評估司機狀況
- 場景分類等等