成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

決策樹分類預測過程可視化

大數據 數據可視化
首先導入所需庫文件,numpy,pandas用于數值處理,DictVectorizer用于特征處理,graphviz用于模型可視化。 導入所需的數據文件,用于訓練和評估模型表現。

[[203082]]

開始前的準備工作

首先導入所需庫文件,numpy,pandas用于數值處理,DictVectorizer用于特征處理,graphviz用于模型可視化。 

  1. #導入所需庫文件 
  2.  
  3. import numpy as np 
  4.  
  5. import pandas as pd 
  6.  
  7. from sklearn.feature_extraction import DictVectorizer 
  8.  
  9. from sklearn import cross_validation 
  10.  
  11. from sklearn import tree 
  12.  
  13. import graphviz  

導入所需的數據文件,用于訓練和評估模型表現。

  1. #導入數據表 
  2.  
  3. test=pd.DataFrame(pd.read_csv('TEST_ML_v2.csv',header=0,encoding='GBK'))  

特征處理

第二步,對特征進行處理。

  1. #特征處理 
  2.  
  3. X_df=test[['City''Item category''Period''Gender''Age''Market channels''Self-agent''Category''Loan channels']] 
  4.  
  5. X_list=X_df.to_dict(orient="records"
  6.  
  7. vec = DictVectorizer() 
  8.  
  9. X=vec.fit_transform(X_list) 
  10.  
  11. Y=np.array(test['Status'])劃分訓練集和測試集數據。  

劃分訓練集和測試集數據

  1. X_train,X_test,y_train,y_test=cross_validation.train_test_split(X.toarray(),Y,test_size=0.4,random_state=0) 

訓練模型并進行預測

使用訓練集數據對決策樹模型進行訓練,使用測試集數據評估模型表現。

  1. #訓練模型 
  2.  
  3. clf = tree.DecisionTreeClassifier(max_depth=5) 
  4.  
  5. clf=clf.fit(X_train,y_train) 
  6.  
  7. clf.score(X_test,y_test) 
  8.  
  9. 0.85444078947368418  

簡單對測試集的***組特征進行預測,結果與實際值相符。

  1. #對測試集數據進行預測 
  2.  
  3. clf.predict(X_test[0]),y_test[0] 
  4.  
  5. (array(['Charged Off'], dtype=object), 'Charged Off' 

查看具體的分類概率值。

  1. #查看分類概率 
  2.  
  3. clf.predict_proba(X_test[0]) 
  4.  
  5. array([[ 1., 0.]])  

決策樹分類預測可視化

第三步,對決策樹的分類預測過程進行可視化,首先查看分類結果及特征的名稱。

  1. #獲取分類名稱 
  2.  
  3. clf.classes_ 
  4.  
  5. array(['Charged Off''Fully Paid'], dtype=object)  

對決策樹進行可視化,feature_names為特征名稱,class_names為分類結果名稱。

  1. #決策樹可視化 
  2.  
  3. dot_data = tree.export_graphviz(clf, out_file=None, 
  4.  
  5. feature_names=vec.get_feature_names(), 
  6.  
  7. class_names=clf.classes_, 
  8.  
  9. filled=True, rounded=True
  10.  
  11. special_characters=True
  12.  
  13. graph = graphviz.Source(dot_data) 
  14.  
  15. graph 

 

 

將分類結果保存為PDF格式文檔。

  1. #導出PDF文檔  
  2. graph.render("test_e1")  

 

責任編輯:龐桂玉 來源: 36大數據
相關推薦

2020-11-02 13:54:41

Python可視化決策樹

2023-03-06 16:07:19

梯度提升算法機器學習

2022-11-11 08:00:00

決策樹機器學習監督學習

2024-09-11 08:34:28

2017-11-21 13:00:20

機器學習決策樹可視化

2016-09-30 16:12:47

GBDT算法決策樹

2019-05-15 09:00:00

決策樹機器學習人工智能

2018-02-02 15:50:07

決策樹Apache Spar數據

2022-12-21 14:39:35

機器學習案發決策樹

2020-03-11 14:39:26

數據可視化地圖可視化地理信息

2012-08-06 09:04:01

決策樹建模

2017-07-18 16:25:31

機器學習算法決策樹

2017-05-10 15:41:29

機器學習算法數據

2017-12-12 12:24:39

Python決策樹

2017-10-14 13:54:26

數據可視化數據信息可視化

2018-07-13 15:53:26

大數據

2009-04-21 14:26:41

可視化監控IT管理摩卡

2022-08-26 09:15:58

Python可視化plotly

2021-11-08 07:11:49

決策樹數據分類器

2017-02-23 08:45:36

Python決策樹數據集
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91在线视频 | 中文字幕日韩一区二区 | 女女百合av大片一区二区三区九县 | 成人av高清 | 国产乱码久久久久久一区二区 | 国产欧美性成人精品午夜 | 一区二区国产在线 | 日本午夜免费福利视频 | 一级片免费网站 | 午夜在线精品 | 日韩在线视频网址 | 日本在线精品视频 | 亚洲啊v| 国产精品一区二区三区久久久 | 成人在线观看网站 | 久久久国产一区二区三区四区小说 | 国产精品一区二区三区在线 | 懂色tv| 老牛影视av一区二区在线观看 | 国产黑丝av| 亚洲综合视频 | 91在线一区 | 国产最好的av国产大片 | 一区二区av | 福利片一区二区 | 亚洲精品久久久久久久久久久久久 | 青草视频在线 | 国产精品国产精品国产专区不片 | 黄色一级免费 | 亚洲网站在线观看 | 免费成人在线网站 | 久久人人网 | 精品欧美乱码久久久久久 | 国产91在线观看 | 欧美成人h版在线观看 | 国产精品免费一区二区三区四区 | 国产黄色av电影 | 国产美女精品视频 | 欧美激情国产日韩精品一区18 | 欧美在线色视频 | 精品av|