看看這些鮮為人知的寶藏Python數(shù)據(jù)科學(xué)包吧
本文轉(zhuǎn)載自公眾號(hào)“讀芯術(shù)”(ID:AI_Discovery)
動(dòng)態(tài)數(shù)據(jù)科學(xué)的這三劍客幾乎無人不知無人不曉:Numpy,Pandas和Matplotlib。你可能已經(jīng)熟悉這些包以及它們的運(yùn)作方式。
還有其他很炫酷的包,你肯定也想試一試,例如Plotly,Seaborne,Scikit-Learn,Tensorflow和Pytorch等等。它們都很好,還有數(shù)百萬個(gè)用于Python機(jī)器學(xué)習(xí)的軟件包,其中有些未受到重視,甚至有些完全不為人知的!
本文就帶大家認(rèn)識(shí)一下這些滄海遺珠。

1.Gleam
Gleam可能很多人沒有聽說過,它是一個(gè)很棒的工具,用于創(chuàng)建帶有頁面、面板和按鈕的交互式可視化項(xiàng)目。這些交互式Web可視化也完全與Web集成在一起,這意味著可以將它們放到網(wǎng)站到端點(diǎn)的任何地方。Gleam使用wtforms進(jìn)行交互,可以使用任何的不同可視化工具來實(shí)際顯示數(shù)據(jù)。

如果想要一個(gè)很酷的交互式窗格,基本上可以使用任何圖形庫,那么Gleam是你的優(yōu)秀選擇。
2.Table
放著pandas不用,為什么要去用Table呢?這當(dāng)然是一個(gè)可行的方法。Table包使得該列表輕松成為pandas的輕量級(jí)替代品,使用Table.py讀取龐大的數(shù)據(jù)集要比使用Pandas.py容易得多??傮w而言,在某些情況下它可能更合適。
- import pandas as pd
3.Mlpy
Mlpy為監(jiān)督和無監(jiān)督學(xué)習(xí)提供了大量比較先進(jìn)的機(jī)器學(xué)習(xí)方法。與同類產(chǎn)品不同,它旨在為數(shù)據(jù)科學(xué)提供一種多合一的方法。雖然有點(diǎn)過時(shí),但對于快速增長的Python機(jī)器學(xué)習(xí)包來說無疑是一個(gè)很好的起步,它的易用性、有趣的算法和包容性是比較大的亮點(diǎn)。
Mlpy試圖創(chuàng)建一種能平衡重現(xiàn)性、模塊化和效率的包。該包在這方面取得了成功,因?yàn)楸M管許多同類包的更新頻率更高,而且肯定是行業(yè)標(biāo)準(zhǔn),但許多此類想法似乎在編譯中丟失了。因?yàn)檫@些都是由成千上萬的開發(fā)人員以C語言編寫的龐大的包,但這可能也是使用它們的缺點(diǎn)所在。
4.Shogun
Shogun是一個(gè)用C++編寫的機(jī)器學(xué)習(xí)庫,恰巧擁有Python端口。Shogun的一大優(yōu)點(diǎn)是,它可用于多種不同的編程語言,并且相對統(tǒng)一。學(xué)習(xí)Shogun,你可以將所學(xué)知識(shí)應(yīng)用于支持的任何其他語言。
Shortgun擁有廣泛的前沿機(jī)器學(xué)習(xí)算法,它也是開源的,并且根據(jù)GNU(自由軟件基金會(huì))通用許可發(fā)行,這是一個(gè)加分項(xiàng)。
5.OpenCV
OpenCV最初是由Intel開發(fā)的。盡管是Intel的獨(dú)家包,但它是開源的,并根據(jù)FreeBSD許可證發(fā)布。OpenCV非常優(yōu)秀的一點(diǎn)是,它著重于實(shí)時(shí)計(jì)算機(jī)視覺,與Shogun一樣,OpenCV最初是用C++編寫的,但是具有Python和其他語言的接口。
說實(shí)話,這五個(gè)包還不夠普及,對它們的評(píng)價(jià)也很鮮見。這些軟件包確實(shí)很酷,但可以肯定,還有數(shù)百個(gè)甚至數(shù)千個(gè)其他很酷的模塊可以添加到Pip環(huán)境中,這些模塊也很棒卻鮮為人知。
Python有一個(gè)完善的生態(tài)系統(tǒng)和許多可挖掘的包,這正是它如此強(qiáng)大的原因。不斷學(xué)習(xí)新模塊,也能讓你保持頭腦活躍。