成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

手把手教你可視化交叉驗證代碼,提高模型預測能力

開發 開發工具
本文介紹了如何使用K折交叉驗證提高模型預測能力,并對代碼進行了可視化。

我們試著利用代碼可視化來提高模型預測能力。

比如說,你正在編寫一個漂亮清晰的機器學習代碼(例如線性回歸)。你的代碼還不錯,首先按照往常一樣用 train_test_split 這樣的函數將數據集分成「訓練集和測試集」兩個部分,并加入一些隨機因素。你的預測可能稍微欠擬合或過擬合,如下圖所示。

欠擬合和過擬合情況下的預測結果

圖:欠擬合和過擬合情況下的預測結果

這些結果沒有變化。這個時候我們能做什么呢?

正如題目所建議的,在學習了線性回歸之后,下一件有趣的事情就是交叉驗證了,因為它可以使用 K 折策略(K-Fold strategy)提高模型的預測能力。那 K 折究竟是什么呢?下面我們將用代碼對此進行解釋。

完整的代碼如下:

圖:交叉驗證的可視化

代碼解析:

以上代碼可分為 4 個步驟。

1. 加載并分割目標數據集。

加載數據集

圖:加載數據集

將該數據集中的目標復制到 y 變量中。如果想看到數據集,請將 print 行的注釋符「#」刪除。

2. 模型選擇

模型選擇(LinearRegression())

圖:模型選擇(LinearRegression())

為簡化過程,我們將選擇使用線性回歸。如果想了解更多,請查看文章《Linear Regression: The Easier Way》。

3. 交叉驗證

在 sklearn 中進行交叉驗證

圖:在 sklearn 中進行交叉驗證

這是 sklearn 中的流程,也是一個函數:

  1. cross_val_predict(model, data, target, cv) 

其中,

  • model 是我們選來要進行交叉驗證的模型。
  • data 是數據。
  • target 是數據的目標值。
  • cv(可選項)是數據折疊的總次數(K 折)。

在這個流程中,我們不像往常一樣將數據集分成訓練集和測試集兩部分,如下圖所示。

訓練集(藍色)和測試集(紅色)

圖:訓練集(藍色)和測試集(紅色)

我們將數據集平均分成 K 個部分(K 折或者 cv)。為了提高預測精度并實現更好地泛化,我們會在較大的數據集中進行模型訓練,在較小的數據集上測試。這里,我們把 cv 設置成 6。

圖:6 個相同的部分

現在,模型分割的***次迭代如下圖所示,其中紅色的是測試集,藍色的是訓練集。

圖:交叉驗證的***次迭代

第二次迭代如下圖所示:

圖:交叉驗證的第二次迭代

以此類推,直到***一次迭代,如下圖所示:

圖:交叉驗證的第六次迭代

4. 使用 Matplotlib 進行數據可視化

圖:使用 Matplotlib 進行可視化

為了將結果可視化,我們導入了 matplotlib 庫,然后創建一個 subplot(子圖)。

創建采用黑色(即 (0,0,0))邊框的散點。

使用 ax.plot 計算兩個軸的***最小值,k-- 代表線型,lw=4 代表寬度。然后,給 x 軸和 y 軸加上標簽。***,用 plt.show() 展示圖像。

結果如下:

圖:預測結果

這張圖展示了使用線性回歸模型對 Boston 數據集進行 K 折交叉驗證的結果。

我知道其實還有很多種交叉驗證方法,但 K 折交叉驗證是一個很好、很簡單的起點。

完整代碼地址:https://github.com/Sagarsharma4244/Cross-Validation

【本文是51CTO專欄機構“機器之心”的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】

 

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2020-12-17 09:40:01

Matplotlib數據可視化命令

2020-03-06 13:09:42

JavaScriptSublimeTextNode.js

2016-04-27 09:49:16

用戶模型產品總結

2021-03-12 10:01:24

JavaScript 前端表單驗證

2021-09-26 16:08:23

CC++clang_forma

2022-07-24 21:43:48

數據可視化大數據

2021-08-26 09:00:48

PyechartsPython可視化

2011-05-03 15:59:00

黑盒打印機

2025-05-07 00:31:30

2011-01-10 14:41:26

2021-07-14 09:00:00

JavaFX開發應用

2021-07-14 09:00:36

Python數據Python基礎

2024-01-26 08:16:48

Exporter開源cprobe

2021-02-26 11:54:38

MyBatis 插件接口

2011-02-22 13:46:27

微軟SQL.NET

2021-12-28 08:38:26

Linux 中斷喚醒系統Linux 系統

2022-03-14 14:47:21

HarmonyOS操作系統鴻蒙

2022-01-08 20:04:20

攔截系統調用

2022-07-27 08:16:22

搜索引擎Lucene

2023-04-26 12:46:43

DockerSpringKubernetes
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲综合一区二区三区 | a黄视频| 亚洲精品在线视频 | 亚洲精品www | 最新中文字幕在线 | 欧美日韩综合 | 国产资源网 | 色视频在线免费观看 | 亚洲在线一区二区 | 久久久久国产精品人 | 依人成人| 欧美成人aaa级毛片在线视频 | 日韩中文字幕免费 | 欧美a区 | 国产又爽又黄的视频 | 亚州精品天堂中文字幕 | 国产激情偷乱视频一区二区三区 | 精品一区二区三区在线观看 | 亚洲精品一区二区三区 | 日本淫视频 | 亚洲视频在线观看 | 亚洲精品久久视频 | 成人免费观看男女羞羞视频 | 久久综合九九 | 日韩成人 | gogo肉体亚洲高清在线视 | 在线婷婷| 神马九九 | www.97zyz.com| www国产亚洲精品久久网站 | 欧美一级免费看 | 午夜电影一区二区 | 国产黄色精品 | 在线观看一区 | 久久久久久久久久性 | 国产精品1区 | 网站国产 | 日韩在线视频播放 | 毛片一级电影 | 国产一区二区中文字幕 | 99在线免费观看视频 |