成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Python數據可視化的四種簡易方法

大數據 數據可視化
數據可視化是任何數據科學或機器學習項目的一個重要組成部分。人們常常會從探索數據分析(EDA)開始,來深入了解數據,并且創建可視化確實有助于讓問題更清晰和更容易理解,尤其是對于那些較大的高維度數據集。本文講述了熱圖、二維密度圖、蜘蛛圖、樹形圖這四種Python數據可視化方法。

數據可視化是任何數據科學或機器學習項目的一個重要組成部分。人們常常會從探索數據分析(EDA)開始,來深入了解數據,并且創建可視化確實有助于讓問題更清晰和更容易理解,尤其是對于那些較大的高維度數據集。在項目結束的時候,能夠以清晰的、簡潔的和令人信服的方式呈現最終結果,這是非常重要的,讓你的用戶能夠理解和明白。

你可能已經看過了我之前的文章《5種快速和簡單的Python數據可視化方法(含代碼)》(5 Quick and Easy Data Visualizations in Python with Code),其中介紹了5種基本可視化方法:散點圖、線圖、柱狀圖、條形圖和箱形圖。這五個是簡單而強大的可視化方法,你絕對可以通過這些方法從數據集中得到巨大的收獲。在本文中,將介紹另外4個數據可視化方法,但稍微復雜一些,你可以在看完上一篇文章介紹的基本方法之后再用。

熱圖(Heat Map)

熱圖是數據的矩陣表示方式,其中每個矩陣的值用一種顏色來表示。不同的顏色代表不同的級別,矩陣指數將兩個對比的列或特征連接在一起。熱圖可以很好地顯示出多個特征變量之間的關系,因為可以直接把一個級別看作一種顏色。還可以通過觀察熱圖中的一些點來查看每個關系是如何與數據集中的其它關系進行比較的。這些顏色的確提供了簡單的表示方式,因為這是非常直觀的。

Python數據可視化的四種簡易方法

現在來看下代碼:與matplotlib庫相比,seaborn庫可用于更高級的圖表,通常也需要更多的組件,如更多的顏色、圖形或者變量。Matplotlib庫用于顯示圖表,numpy用于生成數據,而pandas用于控制。繪圖只是調用一個簡單的seaborn函數,如果你發現了一些在視覺上很特別的東西,通過這個函數,還可以設置顏色映射。

Python數據可視化的四種簡易方法

二維密度圖(2D Density Plot)

二維密度圖是一維版本的簡單擴展,能夠看到關于2個變量的概率分布。讓我們看看下面的二維密度圖,右邊的刻度用顏色表示每一點的概率。最高的概率,看下數據集,似乎大約是0.5的大小和1.4-ish的速度。正如你所看到的,二維密度圖對于快速確定數據對于兩個變量最集中的區域非常地顯著,而不是像一維密度圖那樣只集中一個變量。當你有兩個對輸出結果非常重要的變量,并且希望了解它們如何一起對輸出結果分布起作用的時候,二維密度圖尤其適合。

Python數據可視化的四種簡易方法

Seaborn的代碼超級簡單,我們將通過創建一個偏態分布介紹它。如果你發現某些顏色和陰影在視覺上更特別,那么大多數的可選參數都是為了看起來更清晰。

蜘蛛圖(Spider Plot)

蜘蛛圖是顯示一對多關系最好的方法之一。也就是說,你可以繪制并查看區別于單個變量或類別的多個變量的值。在蜘蛛圖中,一個變量相對于另一個變量的特性是顯而易見的,因為面積和長度在一些方向上變化了。如果你希望了解幾個類別關于這些變量是如何疊加起來的,可以并排繪制一下。在下圖中,很容易比較三個電影角色的不同屬性,并了解他們的優勢所在!

Python數據可視化的四種簡易方法

這次我們將能夠直接使用matplotlib來創建可視化,而不是用seaborn。需要計算每個屬性所在的角度,因為我們希望它們沿圓周被平均地分隔開。我們將在每個計算的角度放置標簽,然后把值繪制成一個點,該點到中心的距離取決于它的值或是級別。最后,為了清晰起見,我們將使用半透明的顏色填充由連接各屬性點的線所包含的區域。

Python數據可視化的四種簡易方法

樹形圖(Tree Diagram)

我們從小學就開始使用樹形圖了,樹形圖既自然又直觀,還易于解釋。直接連接的節點關系密切,而與有多個連接的節點差別很大。在下圖中,我已經根據統計繪制了一小部分來自Kaggle的Pokemon with stats數據集:

HP、攻擊、防御、特殊攻擊、特殊防御、速度

因此,與stats wise最匹配的Pokemon將緊密連接在一起。例如,我們看到,在頂部,Arbok和Fearow是直接連接的,而且,如果我們查看數據,Arbok總共有438個,而Fearow有442個,非常接近。但是一旦我們移動到Raticate,我們得到的總數是413,這與Arbok和Fearow的差別很大,這就是它們被分開的原因。當我們移動樹的時候,基于相似性,Pokemon被分的組越來越多。在綠色組中的Pokemon相互之間比紅色組中的更相似,即使沒有直接的綠色連接。

Python數據可視化的四種簡易方法

對于樹形圖,我們實際上要使用Scipy的。在查看了數據集之后,我們將去掉字符串類型的列。我們這么做只是為了要得到正確的可視化結果,但在實踐中,最好是把這些字符串轉換成分類變量,為了得到更好的結果和進行比較,我們還設置了數據幀索引,以便能夠適當地用它作為引用每個節點的列。最后,在Scipy中計算和繪制樹形圖是非常簡單的事了。

Python數據可視化的四種簡易方法

推薦閱讀

為了了解更多的關于數據可視化方面的知識,我建議大家學習這本書 — Data Visualisation Book,它提供了關于何時、何地、以及為什么使用各個類型的可視化方法的全面而直觀的講解。

責任編輯:未麗燕 來源: 云棲社區
相關推薦

2019-09-12 09:00:32

數據可視化熱圖數據集

2022-09-08 16:28:53

Python數據可視化機器學習

2022-11-01 16:02:31

架構神經網絡模型

2018-03-15 09:57:00

PythonMatplotlib數據可視化

2018-03-24 21:38:54

Python數據庫數據可視化

2018-03-26 14:20:23

PythonMatplotlib數據可視化

2020-03-04 14:15:29

Python數據可視化代碼

2020-03-11 14:39:26

數據可視化地圖可視化地理信息

2022-09-20 19:37:08

MySQL

2022-07-24 21:43:48

數據可視化大數據

2010-08-19 11:16:30

虛擬化

2023-08-30 23:41:16

AI框架項目

2017-10-14 13:54:26

數據可視化數據信息可視化

2010-11-03 11:49:15

刪除DB2數據

2021-03-10 10:13:39

爬蟲Python代碼

2015-09-21 09:27:25

數據可視化錯誤

2011-08-22 09:54:40

云計算虛擬化云成本

2023-03-20 15:14:39

視覺回歸測試軟件開發

2015-07-23 14:50:28

大數據

2009-12-09 11:03:45

安裝Linux
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人99| 日韩欧美一区二区三区免费观看 | av在线成人 | 国产精品无码专区在线观看 | 国产午夜久久 | 日韩一区二区在线视频 | 成人在线播放网站 | 午夜精品久久久久久久 | 久久久久九九九九 | 99久久精品国产一区二区三区 | 久久综合888 | 日韩欧美在线观看视频 | 毛片网站在线观看 | 精品99久久久久久 | 久久精品16 | 蜜桃免费一区二区三区 | 亚洲永久在线 | 午夜日韩 | 国产午夜精品视频 | 一级片在线播放 | 伊人免费观看视频 | 国产高清免费 | 中文字幕黄色大片 | www.亚洲 | 国产午夜三级一区二区三 | 国产精品1区2区3区 一区中文字幕 | 久久久久久高清 | 亚洲黄色成人网 | 国产高清美女一级a毛片久久w | 国产精品日韩欧美一区二区三区 | 日韩色综合 | 一级黄色片免费 | 色欧美片视频在线观看 | 亚洲精品不卡 | 精品一区二区久久久久久久网站 | 久久久久久免费精品一区二区三区 | 伊人伊人伊人 | 中国黄色毛片视频 | 日本亚洲精品成人欧美一区 | 一区二区三区四区av | 中文字幕第一页在线 |