成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

功能強(qiáng)大的開源 Python 繪圖庫

開發(fā) 后端
今天給大家分享一篇可視化干貨,介紹的是功能強(qiáng)大的開源 Python 繪圖庫 Plotly,教你如何用超簡單的(甚至只要一行!)代碼,繪制出更棒的圖表。

我之前一直守著 matplotlib 用的原因,就是為了我學(xué)會它復(fù)雜的語法,已經(jīng)“沉沒"在里面的幾百個小時的時間成本。這也導(dǎo)致我花費(fèi)了不知多少個深夜,在 StackOverflow 上搜索如何“格式化日期”或“增加第二個Y軸”。

但我們現(xiàn)在有一個更好的選擇了 —— 比如易于使用、文檔健全、功能強(qiáng)大的開源 Python 繪圖庫 Plotly。今天就帶你深入體驗(yàn)下,了解它如何用超簡單的(甚至只要一行!)代碼,繪制出更棒的圖表。

本文中所有代碼都已經(jīng)在 Github 上開源,所有的圖表都是可交互的,請使用Jupyter notebook查看 。

(Github 源代碼地址:https://github.com/WillKoehrsen/Data-Analysis/blob/master/plotly/Plotly%20Whirlwind%20Introduction.ipynb)

(plotly 繪制的范例圖表。圖片來源:plot.ly)

Plotly 概述

plotly 的 Python 軟件包是一個開源的代碼庫,它基于 plot.js,而后者基于 d3.js。我們實(shí)際使用的則是一個對 plotly 進(jìn)行封裝的庫,名叫 cufflinks,它能讓你更方便地使用 plotly 和 Pandas 數(shù)據(jù)表協(xié)同工作。

*注:Plotly 本身是一個擁有多個不同產(chǎn)品和開源工具集的可視化技術(shù)公司。Plotly 的 Python 庫是可以免費(fèi)使用的,在離線模式可以創(chuàng)建數(shù)量不限的圖表,在線模式因?yàn)橛玫搅?Plotly 的共享服務(wù),只能生成并分享 25 張圖表。

本文中的所有可視化圖表都是在 Jupyter Notebook 中使用離線模式的 plotly + cufflinks 庫完成的。在使用 pip install cufflinks plotly 完成安裝后,你可以用下面這樣的代碼在 Jupyter 里完成導(dǎo)入:

單變量分布:柱狀圖和箱形圖

單變量分析圖往往是開始數(shù)據(jù)分析時的標(biāo)準(zhǔn)做法,而柱狀圖基本上算是單變量分布分析時必備的圖表之一(雖然它還有一些不足)。

就拿博客文章點(diǎn)贊總數(shù)為例(原始數(shù)據(jù)見 Github:https://github.com/WillKoehrsen/Data-Analysis/tree/master/medium ),做一個簡單的交互式柱狀圖:

(代碼中的 df 是標(biāo)準(zhǔn)的 Pandas dataframe 對象)

(使用 plotly+cufflinks 創(chuàng)建的交互式柱狀圖)

對于已經(jīng)習(xí)慣 matplotlib 的同學(xué),你們只需要多打一個字母(把 .plot 改成 .iplot ),就能獲得看起來更加美觀的交互式圖表!點(diǎn)擊圖片上的元素就能顯示出詳細(xì)信息、隨意縮放,還帶有(我們接下來會提到的)高亮篩選某些部分等超棒功能。

如果你想繪制堆疊柱狀圖,也只需要這樣:

對 pandas 數(shù)據(jù)表進(jìn)行簡單的處理,并生成條形圖:

就像上面展示的那樣,我們可以將 plotly + cufflinks 和 pandas 的能力整合在一起。比如,我們可以先用 .pivot() 進(jìn)行數(shù)據(jù)透視表分析,然后再生成條形圖。

比如統(tǒng)計(jì)不同發(fā)表渠道中,每篇文章帶來的新增粉絲數(shù):

交互式圖表帶來的好處是,我們可以隨意探索數(shù)據(jù)、拆分子項(xiàng)進(jìn)行分析。箱型圖能提供大量的信息,但如果你看不到具體數(shù)值,你很可能會錯過其中的一大部分!

散點(diǎn)圖

散點(diǎn)圖是大多數(shù)分析的核心內(nèi)容,它能讓我們看出一個變量隨著時間推移的變化情況,或是兩個(或多個)變量之間的關(guān)系變化情況。

時間序列分析

在現(xiàn)實(shí)世界中,相當(dāng)部分的數(shù)據(jù)都帶有時間元素。幸運(yùn)的是,plotly + cufflinks 天生就帶有支持時間序列可視化分析的功能。

以我在“Towards Data Science”網(wǎng)站上發(fā)表的文章數(shù)據(jù)為例,讓我們以發(fā)布時間為索引構(gòu)建一個數(shù)據(jù)集,看看文章熱度的變化情況:

在上圖中,我們用一行代碼完成了幾件事情:

  •  自動生成美觀的時間序列 X 軸
  • 增加第二條 Y 軸,因?yàn)閮蓚€變量的范圍并不一致
  • 把文章標(biāo)題放在鼠標(biāo)懸停時顯示的標(biāo)簽中

為了顯示更多數(shù)據(jù),我們可以方便地添加文本注釋:

(帶有文本注釋的散點(diǎn)圖)

下面的代碼中,我們將一個雙變量散點(diǎn)圖按第三個分類變量進(jìn)行著色:

接下來我們要玩點(diǎn)復(fù)雜的:對數(shù)坐標(biāo)軸。我們通過指定 plotly 的布局(layout)參數(shù)來實(shí)現(xiàn)這一點(diǎn)(關(guān)于不同的布局,請參考官方文檔 https://plot.ly/python/reference/ ),同時我們把點(diǎn)的尺寸(size參數(shù))和一個數(shù)值變量 read_ratio (閱讀比例)綁定,數(shù)字越大,泡泡的尺寸也越大。

如果想要更復(fù)雜一些(詳見 Github 的源代碼),我們甚至可以在一張圖里塞進(jìn) 4 個變量!(然而并不推薦你們真的這么搞)

和前面一樣,我們可以將 pandas 和 plotly+cufflinks 結(jié)合起來,實(shí)現(xiàn)許多有用的圖表:

建議你查看官方文檔,或者源代碼,里面有更多的范例和函數(shù)實(shí)例。只需要簡單的一兩行代碼,就可以為你的圖表加上文字注釋,輔助線,最佳擬合線等有用的元素,并且保持原有的各種交互式功能。

高級繪圖功能

接下來,我們要詳細(xì)介紹幾種特殊的圖表,平時你可能并不會很經(jīng)常用到它們,但我保證只要你用好了它們,一定能讓人刮目相看。我們要用到 plotly 的 figure_factory 模塊,只需要一行代碼,就能生成超棒的圖表!

散點(diǎn)圖矩陣

假如我們要探索許多不同變量之間的關(guān)系,散點(diǎn)圖矩陣(也被稱為SPLOM)就是個很棒的選擇:

即使是這樣復(fù)雜的圖形,也是完全可交互的,讓我們能更詳盡地對數(shù)據(jù)進(jìn)行探索。

關(guān)系熱圖

為了體現(xiàn)多個數(shù)值變量間的關(guān)系,我們可以計(jì)算它們的相關(guān)性,然后用帶標(biāo)注熱度圖的形式進(jìn)行可視化:

自定義主題

除了層出不窮的各種圖表外,Cufflinks 還提供了許多不同的著色主題,方便你輕松切換各種不同的圖表風(fēng)格。下面兩張圖分別是“太空”主題和“ggplot”主題:

此外,還有 3D 圖表(曲面和泡泡):

對有興趣研究的用戶來說,做張餅圖也不是什么難事:

在 Plotly 圖表工坊(Plotly Chart Studio)里編輯

當(dāng)你在 Jupyter Notebook 里生成了這些圖表之后,你將會發(fā)現(xiàn)圖表的右下角出現(xiàn)了一個小小的鏈接,寫著“Export to plot.ly(發(fā)布到 plot.ly)”。如果你點(diǎn)擊這個鏈接,你將會跳轉(zhuǎn)到一個“圖表工坊”(https://plot.ly/create/)。

在這里,你可以在最終展示之前進(jìn)一步修改和潤色你的圖表。可以添加標(biāo)注,選擇某些元素的顏色,把一切都整理清楚,生成一個超棒的圖表。之后,你還可以將它發(fā)布到網(wǎng)絡(luò)上,生成一個供其他人查閱的鏈接。

下面兩張圖是在圖表工坊里制作的:

講了這么多,看都看累了吧?然而我們還并沒有窮盡這個庫的所有功能。限于篇幅,有些更棒的圖表和范例,只好請大家訪問 plotly 和 cufflinks 的官方文檔去一一查看咯。

(Plotly 交互式地圖,顯示了美國國內(nèi)的風(fēng)力發(fā)電場數(shù)據(jù)。來源:plot.ly)

最后 ……

關(guān)于沉沒成本謬誤,最糟糕的一點(diǎn)在于,人們往往只能在放棄之前的努力時,才能意識到自己浪費(fèi)了多少時間。

在選擇一款繪圖庫的時候,你最需要的幾個功能有:

快速探索數(shù)據(jù)所需的一行代碼圖表

  • 拆分/研究數(shù)據(jù)所需的交互式元素
  • 當(dāng)需要時可以深入細(xì)節(jié)信息的選項(xiàng)
  • 最終展示前能輕易進(jìn)行定制

從現(xiàn)在看來,要用 Python 語言實(shí)現(xiàn)以上功能的最佳選擇非 plotly 莫屬。它讓我們快速生成可視化圖表,交互功能使我們更好地理解信息。

我承認(rèn),繪圖絕對是數(shù)據(jù)科學(xué)工作中最讓人享受的部分,而 plotly 能讓你更加愉悅地完成這些任務(wù)。

(用一張圖表顯示一下用 Python 繪圖的愉悅程度隨著時間變化。來源 towardsdatascience.com)

2022年是時候升級你的 Python 繪圖庫了,讓自己在數(shù)據(jù)科學(xué)和可視化方面變得更快、更強(qiáng)、更美吧!

責(zé)任編輯:龐桂玉 來源: Python開發(fā)者
相關(guān)推薦

2022-03-20 18:12:03

Shotcut開源視頻編輯器

2010-02-24 17:58:28

Python 測試框架

2023-12-19 09:00:03

OCR軟件開源Ocrad

2010-03-05 09:19:54

Android系統(tǒng)

2024-05-15 07:48:08

.NET開源圖表庫

2013-01-23 11:30:39

JSVirtualKeybjQuery

2025-06-30 09:33:26

2009-07-07 08:46:11

微軟Windows 7新功能

2025-01-06 09:10:00

2024-06-18 07:50:43

2024-05-24 08:34:16

2025-03-18 07:57:52

.NET開源編輯器

2012-01-10 16:23:12

兄弟傳真機(jī)

2011-04-15 09:27:09

Windows PhoWindows phoMango

2025-02-19 08:25:23

2021-12-01 15:18:38

LinuxWindowsmacOS

2022-06-23 10:17:00

Git技術(shù)Linux

2021-07-09 10:14:05

IP工具命令

2009-12-02 13:46:10

PHP模板引擎

2021-11-22 17:55:56

Python 開發(fā)編程語言
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: japanhdxxxx裸体| www国产成人免费观看视频,深夜成人网 | 国产在线中文字幕 | 91看国产| 国产日韩欧美另类 | 黄免费观看视频 | 午夜三级网站 | 日韩亚洲一区二区 | 在线国产99 | 欧美亚洲国产日韩 | 成人在线视| 国产精品美女视频 | 国产精品一区二区电影 | 欧美男人天堂 | 日本福利一区 | 亚洲最色视频 | 国产乱码精品1区2区3区 | 久免费视频 | 日韩av一区二区在线 | 久久久www成人免费无遮挡大片 | 成人妇女免费播放久久久 | 国产乱码精品一区二区三区忘忧草 | 日韩在线播放视频 | 精品国产免费人成在线观看 | 18av在线播放| 亚洲精品成人 | 欧美一级特黄aaa大片在线观看 | 国产精品久久久久久久久久久久久 | 一级黄色片免费在线观看 | 久久久久久久香蕉 | 久久国产区 | 免费一级片 | 久久综合香蕉 | 成人精品网 | 亚洲精品大全 | 在线看片网站 | 国产成人在线播放 | 国产精品色一区二区三区 | 中文字幕福利视频 | 国产精品一区二区在线 | 国产精品亚洲精品日韩已方 |