成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

如何在iPhone上建立第一個機器學習模型

作者：Happen，Chloe，笪潔瓊，魏子敏 2017-10-13 15:59:24

移動開發(fā) 機器學習

讀完這篇文章，大家將會了解Apple CoreML是什么以及為何它勢頭正猛。我們也將通過開發(fā)一款iPhone上的垃圾短信分類app來與大家一起一探CoreML的實現(xiàn)細節(jié)。

引言

作為一名數(shù)據(jù)科學家，我一直有一個夢想——***科技公司在與我相關(guān)的領(lǐng)域不斷推出新產(chǎn)品。

如果你觀看了Apple公司***的iPhone X發(fā)布會，你會發(fā)現(xiàn)iPhone X具有非常酷的特性，比如FaceID、動態(tài)表情、增強現(xiàn)實，這些特性都使用了機器學習。作為一名駭客，我決定親自上手探索一下如何建立那樣的系統(tǒng)。

進一步調(diào)查后我發(fā)現(xiàn)了一個很有趣的工具，那就是Apple官方面向開發(fā)者推出的機器學習框架工具CoreML。它可以在iPhone、Macbook、Apple TV、Apple watch等任何一個蘋果設(shè)備上使用。

另一個有趣的發(fā)現(xiàn)是Apple在***的iPhone手機上設(shè)計了一個定制GPU，以及一個帶有神經(jīng)引擎的A11先進仿生學處理芯片，以便用于優(yōu)化機器學習。

隨著核心組件計算引擎功能日益強大，iPhone將開辟機器學習的新途徑，CoreML在未來的意義將越來越重要。

讀完這篇文章，大家將會了解Apple CoreML是什么以及為何它勢頭正猛。我們也將通過開發(fā)一款iPhone上的垃圾短信分類app來與大家一起一探CoreML的實現(xiàn)細節(jié)。

同時，我們也會通過客觀評價CoreML的利弊來結(jié)束本篇文章。

文章目錄：

CoreML是什么?
建立系統(tǒng)
案例學習：實現(xiàn)一個iPhone上的垃圾短信分類app
使用CoreML的利弊

01、CoreML是什么?

今年，Apple公司在每年一次的全球開發(fā)者大會WWDC(類似于谷歌的I/O會議)上大肆宣傳CoreML。為了更好地理解CoreML的作用，我們需要了解一些背景。

CoreML的背景

有趣的是，這并不是Apple公司***次發(fā)布移動端機器學習框架。去年它就發(fā)布了一些同樣的框架庫：

Accelerate 框架和基本神經(jīng)網(wǎng)絡(luò)子程序(BNNS)——高效利用CPU并使用卷積神經(jīng)網(wǎng)絡(luò)進行預測。
Metal Performance Shaders CNN(MPSCNN)——高效利用GPU并使用卷積神經(jīng)網(wǎng)絡(luò)進行預測。

這兩個框架庫的區(qū)別在于，一個針對CPU優(yōu)化而另一個針對GPU。這是因為有時在inference(推斷)過程中CPU比GPU計算更快，而在training(訓練)過程中幾乎每次都是GPU計算更快。

但為了提高性能，框架會非常接近底層硬件，使得這些混合框架對開發(fā)者造成混亂，從而很難編程。

走進CoreML

CoreML 會在之前提到的兩個庫上面提供一個抽象層，并且還會提供一個簡單的接口，以達到同樣的效率。另一個好處是，在我們的app運行時，CoreML充分照顧到了CPU與GPU之間的上下文切換。

換句話說，假如我們有一個耗內(nèi)存的任務(wù)，它涉及文本處理(自然語言處理)，CoreML將自動在CPU運行;而如果我們有一個計算繁重的任務(wù)，例如圖像識別，它將使用GPU;當app包含這兩種功能的時候，它又會自動切換從而使得兩者都得到***化的利用。

CoreML還將提供什么?

CoreML頂層還附帶了三個庫：

Vision：這個庫提供了高性能圖像分析與計算機視覺技術(shù)，用于人臉識別、特征檢測以及圖像與視頻中的場景識別。
Foundation(NLP)：顧名思義，它提供了自然語言處理的一些功能
Gameplay Kit：用于游戲開發(fā)的庫，此外它還提供了AI，并運用決策樹。

以上提到的所有庫都可以用一些簡單的接口輕松使用，可用于完成一系列任務(wù)。通過上述的庫，CoreML最終框架圖如下：

注意，上述設(shè)計給iOS應(yīng)用程序提供了一個很好的模塊化結(jié)構(gòu)。你可以使用不同層進行不同的任務(wù)，也可以用多種方式使用它們(例如，在app中使用NLP進行圖像分類)。了解更多：Vision、Foundation與GameplayKit。好了，現(xiàn)在我們有了足夠的理論知識，是時候?qū)嵺`一下了!

“微信排版限制，需要代碼的同學請看文末的原文鏈接自行查找”

02、建立系統(tǒng)

為了充分使用CoreML，你需要遵循如下要求：

1.OS：MacOS(Sierra 10.12或以上)

2.Python 2.7和pip：點擊下載mac上的python。打開終端，輸入如下代碼安裝pip：

sudo easy_install pip

3.coremltools：這個包有助于將你的模型從python轉(zhuǎn)換成CoreML能理解的格式。在終端輸入如下代碼進行安裝：

sudo pip install -U coremltools

4.Xcode 9：這是用于構(gòu)建Apple設(shè)備上應(yīng)用程序的默認軟件。點此下載。下載Xcode之前，你需要使用Apple ID進行登陸。

登陸之后，你需要驗證你的apple ID。你將會收到與注冊Apple ID的設(shè)備相同的通知。

點擊“允許”并輸入網(wǎng)站顯示的6位密碼。

當你完成這一步，你將會看到一個下載選項。你可以在那兒下載Xcode?，F(xiàn)在，我們建立好了系統(tǒng)，準備好了的話就讓我們進入實現(xiàn)部分!

03、案例學習：實現(xiàn)一個iPhone上的垃圾短信分類app

在本次開發(fā)中，我們將著重于在兩個重要途徑上來使用CoreML的能力。讓我們開始吧!

將你的機器學習模型轉(zhuǎn)換成CoreML格式

CoreML其中一個優(yōu)勢，或者我應(yīng)該說它的創(chuàng)造者作出的明智的決定是，支持在sklearn、caffe、xgboost等其他流行框架中訓練好的機器學習模型的轉(zhuǎn)換。

數(shù)據(jù)科學社區(qū)并不會不嘗試CoreML試行，因為他們可以在他們最喜歡的環(huán)境中進行實驗、訓練他們的模型，然后輕松導入并在iOS/MacOS的app上使用。

下面是即時可用的CoreML支持的框架：

Mlmodel是什么?

為了使轉(zhuǎn)換過程簡單，Apple設(shè)計了它自己的開放格式來代表跨框架機器學習模型，即mlmodel。這個模型文件包含了模型各層的描述、輸入、輸出、類標簽、任何需要對數(shù)據(jù)進行的預處理。它還包含了已學習的參數(shù)(權(quán)重及偏差)。

轉(zhuǎn)換流程如下：

在你最喜歡的框架中訓練模型
使用python模塊coremltools將模型轉(zhuǎn)換為.mlmodel格式
在app中使用模型

在本次例子中，我們將在sklearn中訓練一個垃圾短信分類器，然后將該模型轉(zhuǎn)給CoreML。

關(guān)于垃圾短信數(shù)據(jù)集

SMS垃圾短信數(shù)據(jù)集 v.1是一個公開的SMS標注短信數(shù)據(jù)集，用于手機垃圾短信研究。它包含了5574份真實無編碼的英文短信，這些短信都標注了合法(做作)或者垃圾短信。

你可以在此下載該數(shù)據(jù)集。

建立基礎(chǔ)模型

我們使用sklearn中的LinearSVC建立基礎(chǔ)模型。同時，我們提取短信文本的TF-IDF值作為模型特征。TF-IDF是自然語言處理中的一種方法，它基于唯一標識文檔的詞來分類文檔。如果你想要學習更多NLP和tf-idf的知識，你可以閱讀這篇文章。代碼如下：

import numpy as npimport pandas as pd#Reading in and parsing dataraw_data = open('SMSSpamCollection.txt', 'r')sms_data = []for line in raw_data: split_line = line.split("\t") sms_data.append(split_line) 
#Splitting data into messages and labels and training and testsms_data = np.array(sms_data)X = sms_data[:, 1]y = sms_data[:, 0]  
#Build a LinearSVC modelfrom sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.svm import LinearSVC  
#Build tf-idf vector representation of datavectorizer = TfidfVectorizer()vectorized_text = vectorizer.fit_transform(X)text_clf = LinearSVC()text_clf = text_clf.fit(vectorized_text, y)

我們的模型建立好了，讓我們用一份垃圾短信測試一下：

#Test the modelprint text_clf.predict(vectorizer.transform(["""XXXMobileMovieClub: To use your credit, click the WAP link in the next txt message or click here>> http://wap. xxxmobilemovieclub.com?n=QJKGIGHJJGCBL"""]))

有趣，我們的模型效果很好!讓我們添加交叉驗證：

#Cross - Validationfrom sklearn.model_selection import cross_val_scorecross_score = cross_val_score(text_clf, vectorized_text, y, cv=10)print cross_scoreprint "mean:",np.mean(cross_score) 
現(xiàn)在已建好模型，為使它適用于CoreML，我們需要把它轉(zhuǎn)換成.mlmodel格式。用之前安裝的coremltools工具包來實現(xiàn)。以下代碼能將我們的模型轉(zhuǎn)換成.mlmodel格式。  
import coremltools  
#convert to coreml model  
coreml_model = coremltools.converters.sklearn.convert(text_clf, "message", "spam_or_not")  
#set parameters of the model 
coreml_model.short_description = "Classify whether message is spam or not"  
coreml_model.input_description["message"] = "TFIDF of message to be classified"  
coreml_model.output_description["spam_or_not"] = "Whether message is spam or not"  
#save the model  
coreml_model.save("SpamMessageClassifier.mlmodel")

這是如何運作的呢?

首先我們運用coremltools Python工具包。再選擇一個轉(zhuǎn)換器對模型進行轉(zhuǎn)換，本例中用converters.sklearn，因為要轉(zhuǎn)換的模型是用sklearn工具建立的。然后在.convert()括號內(nèi)聲明模型對象、輸入變量名稱、輸出變量名稱。接下來設(shè)置模型參數(shù)來添加更多關(guān)于輸入、輸出的信息，***用.save()保存已轉(zhuǎn)換成CoreML格式的模型文件。

雙擊模型文件，會用Xcode打開。

如你所見，該模型文件顯示了很多信息，關(guān)于模型的類型、它的輸入、輸出，輸入輸出的類型等。我已在上圖中用紅色標記。你可以將這些描述和轉(zhuǎn)換成.mlmodel時所提供的一一對比。

將自己的模型引入CoreML就是這么簡單。現(xiàn)在你的模型已經(jīng)在蘋果生態(tài)系統(tǒng)里了，接下來真正好玩的開始啦!

注意：這一步的完整代碼文件請看這里。進一步了解coremltools請看這里，提供的不同種類的轉(zhuǎn)換器請看這里。

將該模型用于我們的app

既然已經(jīng)訓練好模型并引入CoreML中，讓我們用該模型開發(fā)一個iPhone垃圾信息分類app吧!

我們將在模擬器上運行app。模擬器這一軟件能顯示app的界面及運行情況，像在iPhone上真正運行那樣。這樣節(jié)省了大量時間，因為用iPhone運行app之前，我們就可以測試代碼、調(diào)試。看一下最終產(chǎn)品長什么樣子吧：

下載工程

我已經(jīng)為我們的app制作了一個簡單基礎(chǔ)的UI放在GitHub上。用以下命令加載并運行：

git clone https://github.com/mohdsanadzakirizvi/CoreML-on-iPhone.git  
cd CoreML-on-iPhone/Practice\ App/  
open coreml\ test.xcodeproj/

這會在Xcode打開我們的項目。

在Xcode窗口中我用紅色標示了三個重要區(qū)域：

左上角的播放按鈕用來啟動app在模擬器運行。
播放按鈕的正下方列出了與我們項目相關(guān)的文件和文件夾。這是項目導航欄，方便你找項目里的文件和文件夾。
播放按鈕旁邊寫著iPhone 8，表示你想用模擬器仿真的目標設(shè)備。你可以點擊它，在下拉列表里選擇iPhone 7。

讓我們開始運行app吧，看看會發(fā)生什么。點擊左上角的播放按鈕讓模擬器運行app。在框中隨便鍵入些文字，點擊預測按鈕。發(fā)生了什么?

到現(xiàn)在，我們的app什么也沒做，只是原樣輸出框中鍵入的文字。

向你的app中添加一個訓練好的模型

相當簡單：

將你的.mlmodel模型文件拖入到Xcode窗口工程導航欄中。
做好后，會彈出一個含有幾項選擇的窗口，默認缺省，點擊“結(jié)束”。
當你像這樣拖拽文件到Xcode時，自動在工程中生成該文件的參考路徑。這樣你能輕松地在代碼中獲取該文件。

編譯模型

在能夠用我們的模型進行推測之前，需要讓Xcode在建立階段中編譯模型。以下是具體步驟：

在工程導航欄中選擇有藍色標識的文件

會在右手邊打開工程設(shè)置。點擊Compile Sources(編譯源)并選擇+標識。

在新出現(xiàn)的窗口中選擇 SpamMessageClassifier.mlmodel文件，點擊新增。

現(xiàn)在每次運行app，Xcode就會編譯我們的機器學習模型，使它能用來做預測。

在代碼中創(chuàng)建模型

任何為蘋果設(shè)備開發(fā)的app都用swift編程。你不需要學swift但如果以后你有興趣深入，你可以跟著這個教程學。

在工程導航欄中選擇 ViewController.swift。這一文件包含大部分控制app功能的代碼。

第24行的 predictSpam() 函數(shù)會做最多的工作。刪除第25行，向函數(shù)中添加以下代碼：

let enteredMessage = messageTextField.text!  
if (enteredMessage != ""){  
spamLabel.text = ""  
}  
//Fetch tfidf representation of text  
let vec = tfidf(sms: enteredMessage)  
do {  
//Get prediction on the text  
let prediction = try SpamMessageClassifier().prediction(message: vec).spam_or_not  
print (prediction)  
if (prediction == "spam"){  
spamLabel.text = "SPAM!" 
 }  
else if(prediction == "ham"){  
spamLabel.text = "NOT SPAM"  
}  
}  
catch{  
spamLabel.text = "No Prediction"  
}

以上代碼檢查用戶是否向框內(nèi)輸入了任何信息。如果有，調(diào)用tfidf()函數(shù)計算文本的tfidf值。然后生成一個SpamMessageClassifier 對象實例，再調(diào)用.prediction() 函數(shù)。這與sklearn中的 .predict() 函數(shù)相同。然后基于預測展示恰當?shù)男畔ⅰ?/p>

但為什么需要tfidf()?

記住我們基于文本的tf-idf表征來訓練模型，因此我們的模型需要相同形式的輸入。一旦獲得鍵入的文本框的信息，就調(diào)入tfidf()函數(shù)來做同樣的事。來寫這一步的代碼吧，復制下列代碼放在predictSpam()函數(shù)后：

//MARK: Functionality code  
func tfidf(sms: String) -> MLMultiArray{  
//get path for files  
let wordsFile = Bundle.main.path(forResource: "wordlist", ofType: "txt")  
let smsFile = Bundle.main.path(forResource: "SMSSpamCollection", ofType: "txt")  
do {  
//read words file  
let wordsFileText = try String(contentsOfFile: wordsFile!, encoding: String.Encoding.utf8)  
var wordsData = wordsFileText.components(separatedBy: .newlines)  
wordsData.removeLast() // Trailing newline.  
//read spam collection file  
let smsFileText = try String(contentsOfFile: smsFile!, encoding: String.Encoding.utf8)  
var smsData = smsFileText.components(separatedBy: .newlines)  
smsData.removeLast() // Trailing newline.  
let wordsInMessage = sms.split(separator: " ") 
 //create a multi-dimensional array  
let vectorized = try MLMultiArray(shape: [NSNumber(integerLiteral: wordsData.count)], dataType: MLMultiArrayDataType.double)  
for i in 0..  
let word = wordsData[i]  
if sms.contains(word){  
var wordCount = 0  
for substr in wordsInMessage{  
if substr.elementsEqual(word{  
wordCount += 1  
}  
} 
 let tf = Double(wordCount) / Double(wordsInMessage.count)  
var docCount = 0  
for sms in smsData{  
if sms.contains(word) {  
docCount += 1  
} 
}  
let idf = log(Double(smsData.count) / Double(docCount))  
vectorized[i] = NSNumber(value: tf * idf) 
 } else {  
vectorized[i] = 0.0  
}  
}  
return vectorized  
} catch {  
return MLMultiArray()  
}  
}

以上代碼得到文本框內(nèi)輸入信息的tfidf表征，為此讀取SMSSpamCollection.txt原始數(shù)據(jù)庫并返回同樣信息。一旦你保存項目然后再次運行模擬器，你的app就會運行良好。

4、CoreML優(yōu)缺點

像每個發(fā)展中的庫一樣，CoreML有優(yōu)點也有缺點。讓我們說清楚。

優(yōu)點：

對在移動設(shè)備上運行性能進行優(yōu)化，最小化內(nèi)存和能量消耗。
在移動設(shè)備上運行保證了用戶隱私，不再需要將數(shù)據(jù)發(fā)給服務(wù)器做預測。
在移動設(shè)備上運行意味著甚至在沒聯(lián)網(wǎng)的時候都可以做預測，此外對用戶來說反應(yīng)時間更短。
能自己決定在CPU還是GPU上運行(或者都有)。

因為它可以用CPU，所以你能在iOS模擬器上運行它(iOS模擬器不支持GPU)。

提供了很多模型，因為它能從其他主流機器學習框架中引入模型：

支持向量機(SVM)
樹集成，如隨機森林、提升樹
線性回歸和邏輯回歸
神經(jīng)網(wǎng)絡(luò)：前向反饋、卷積、循環(huán)

缺點：

只支持有監(jiān)督模型，不支持無監(jiān)督模型和強化學習。
不支持模型在設(shè)備上再訓練，只能做預測。
如果CoreML不支持某種層，你就不可以使用。目前還不能用自己的層擴展CoreML。
CoreML工具只支持少量訓練工具的特定版本(竟然不支持tensorflow)。
不能看中間層的輸出，只能得到預測結(jié)果。
只支持回歸和分類(不支持聚類、排序、降維等)。

結(jié)語

本文中，我們學習了CoreML及應(yīng)用它開發(fā)iPhone機器學習app。CoreML是一個較新的庫，因此有自己的優(yōu)點和缺點。有一個非常有用的優(yōu)點是它在本地設(shè)備上運行，因此速度更快，保證數(shù)據(jù)隱私。但同時，它功能不全面，對數(shù)據(jù)科學家的需求考慮還不夠周全。期待后續(xù)版本會改進。

如果你在某個步驟遇到困難，本文所有代碼都在GitHub上。

責任編輯：未麗燕來源：大數(shù)據(jù)文摘

iPhone 機器學習 iOS

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

主站蜘蛛池模板：在线观看成人小视频 | 91国内精品久久 | 我想看一级黄色毛片 | 亚洲免费观看视频 | 九九亚洲 | 国产成人精品999在线观看 | 狠狠操你 | 国产精彩视频 | 日日日日操 | 国产区在线免费观看 | 欧美综合一区二区 | 精品久久久久久久久久久下田 | 美女天天操 | 日本精品一区二区三区在线观看视频 | 99视频在线看 | 国产中文字幕在线观看 | 欧美综合在线视频 | 91av在线视频观看 | 五月香婷婷 | 女生羞羞网站 | 亚洲欧美一区二区三区在线 | a级在线免费观看 | 久久久国产精品一区 | 亚洲精美视频 | 国内精品久久久久久 | 麻豆一区一区三区四区 | 亚洲精品v日韩精品 | 欧美高清视频一区 | 91精品国产91久久久久久最新 | 久久久做 | 精久久 | 国产精品久久久久久久久久三级 | 亚洲va欧美va天堂v国产综合 | 成人av观看 | 久久久久久亚洲 | 91精品国产一区二区三区动漫 | 久久久激情 | 亚洲一级毛片 | 国产一区www| 自拍偷拍视频网 | 免费啪啪 |