pandas語法亂、API多?你需要整理一下!
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
pandas作為Python的一個(gè)強(qiáng)大擴(kuò)展庫,被很多人稱為數(shù)據(jù)分析界的“瑞士軍刀”。
然而,它也被不少學(xué)習(xí)者詬病:語法很亂!API太多!
有沒有什么好辦法能夠快速上手呢?
為此,有網(wǎng)友在知乎提出這樣的問題:

該問題引起了不少網(wǎng)友的共鳴,很多人也提供了自己上手pandas的方法。
為啥這么亂?
首先來看,大家都吐槽pandas用起來感覺很混亂,那為什么會(huì)這樣?
針對(duì)這個(gè)問題,來自中科院大學(xué)的@李丁表示,由于Pandas等Python的科學(xué)計(jì)算包都是
“一幫學(xué)術(shù)界人士搞的”,主要是模仿R語言,又沒有模仿到R的靈活語法。最后就是只做
到了功能全面能用就行,沒有關(guān)注好不好用等其他代碼工程素養(yǎng)問題。


結(jié)果就是雖然它很亂,但是迫于它的“地位”,很多人還是不得不使用它。那大家都是如何上手的呢?
“磨刀不誤砍柴工”
縱觀整個(gè)回答,大部分人的思路都是先整體過一遍,腦子里留個(gè)印象,到用的時(shí)候再去細(xì)查!
但是很多東西一遍根本就記不住,查的時(shí)候可能都不知道有某個(gè)功能,更有人吐槽即使已經(jīng)用了很久pandas,再用還是需要一遍遍再查官方文檔。
于是,為了提升查詢效率,在初入門時(shí)就把各種語法和相關(guān)類整理一下非常重要,此所謂“磨刀不誤砍柴工”。


下面是GiHub上一個(gè)獲星1.3k的“磨刀”成果:

每一條目錄下都有全面的細(xì)化總結(jié),包括示例代碼:

作者是來自阿里巴巴的技術(shù)專家。
也有知友更加細(xì)化,總結(jié)了75個(gè)數(shù)據(jù)分析打工人的Pandas高頻操作:

每一條都說明了具體用法:
實(shí)在忍不了試試別的工具
學(xué)習(xí)計(jì)算機(jī),看書是避免不了,除了pandas作者的那本《利用Python進(jìn)行數(shù)據(jù)分析》(第2版),還有人強(qiáng)烈推薦《Python數(shù)據(jù)分析:活用pandas庫》,不過也是不用全部看完,隨用隨查就行。
亞馬遜書評(píng)也不錯(cuò):
這本書比我讀過的其他介紹Pandas的書好很多,別的書也不錯(cuò),但這本書更簡明扼要。作者先介紹方法,接著給出示例,然后繼續(xù)推進(jìn),非常適合學(xué)習(xí)。
官方文檔一直被吐槽亂,但是官方網(wǎng)站升級(jí)以后的文檔比之前好了一些,該查詢該學(xué)習(xí)的時(shí)候還是得使用它。
剩下的就是在實(shí)踐中一次次加深各種用法的記憶了!
當(dāng)然了,也有一些人推薦直接改用matlab、mathematica,或者效率更高(但比較小眾)的julia。
以及DaPy,一個(gè)專門針對(duì)pandas數(shù)據(jù)結(jié)構(gòu)嚴(yán)格和api過多等問題的Python數(shù)據(jù)分析框架,輕量且具有易用性。
你又是如何上手混亂的pandas呢?
知友整理鏈接:
GiHub pandas教程:https://github.com/hangsz/pandas-tutorial
75個(gè)Pandas高頻操作:https://mp.weixin.qq.com/s?__biz=MzUwOTg0MjczNw==&mid=2247490395&idx=1&sn=49215a3b51a6768802ba2eae3410e537&chksm=f90d5f05ce7ad613a5200b803580314a298443f98f853a73941ec64ea4a7c90822f1f814cfa9&scene=178&cur_album_id=1429956252289024000#rd