成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

9個鮮為人知的Python數(shù)據(jù)科學庫

開發(fā) 后端 大數(shù)據(jù)
在本文中,我們將看到 Python 庫中的一些數(shù)據(jù)科學工具,而不是那些常用的工具,如 pandas、scikit-learn 和 matplotlib。雖然像 pandas、scikit-learn 這樣的庫是機器學習中最常想到的,但是了解這個領域的其他 Python 庫也是非常有幫助的。

[[252070]]

除了 pandas、scikit-learn 和 matplotlib,還要學習一些用 Python 進行數(shù)據(jù)科學的新技巧。

Python 是一種令人驚嘆的語言。事實上,它是世界上增長最快的編程語言之一。它一次又一次地證明了它在各個行業(yè)的開發(fā)者和數(shù)據(jù)科學者中的作用。Python 及其庫的整個生態(tài)系統(tǒng)使其成為全世界用戶的恰當選擇,無論是初學者還是高級用戶。它成功和受歡迎的原因之一是它的一組強大的庫,使它如此動態(tài)和快速。

在本文中,我們將看到 Python 庫中的一些數(shù)據(jù)科學工具,而不是那些常用的工具,如 pandas、scikit-learn 和 matplotlib。雖然像 pandas、scikit-learn 這樣的庫是機器學習中最常想到的,但是了解這個領域的其他 Python 庫也是非常有幫助的。

Wget

提取數(shù)據(jù),尤其是從網(wǎng)絡中提取數(shù)據(jù),是數(shù)據(jù)科學家的重要任務之一。Wget 是一個免費的工具,用于從網(wǎng)絡上非交互式下載文件。它支持 HTTP、HTTPS 和 FTP 協(xié)議,以及通過 HTTP 代理進行訪問。因為它是非交互式的,所以即使用戶沒有登錄,它也可以在后臺工作。所以下次你想下載一個網(wǎng)站或者網(wǎng)頁上的所有圖片,wget 會提供幫助。

安裝:

  1. $ pip install wget

例子:

  1. import wget
  2. url = 'http://www.futurecrew.com/skaven/song_files/mp3/razorback.mp3'
  3.  
  4. filename = wget.download(url)
  5. 100% [................................................] 3841532 / 3841532
  6.  
  7. filename
  8. 'razorback.mp3'

鐘擺

對于在 Python 中處理日期時間感到沮喪的人來說, Pendulum 庫是很有幫助的。這是一個 Python 包,可以簡化日期時間操作。它是 Python 原生類的一個替代品。有關詳細信息,請參閱其文檔

安裝:

  1. $ pip install pendulum

例子:

  1. import pendulum
  2.  
  3. dt_toronto = pendulum.datetime(2012, 1, 1, tz='America/Toronto')
  4. dt_vancouver = pendulum.datetime(2012, 1, 1, tz='America/Vancouver')
  5.  
  6. print(dt_vancouver.diff(dt_toronto).in_hours())
  7.  
  8. 3

不平衡學習

當每個類別中的樣本數(shù)幾乎相同(即平衡)時,大多數(shù)分類算法會工作得***。但是現(xiàn)實生活中的案例中充滿了不平衡的數(shù)據(jù)集,這可能會影響到機器學習算法的學習和后續(xù)預測。幸運的是,imbalanced-learn 庫就是為了解決這個問題而創(chuàng)建的。它與 scikit-learn 兼容,并且是 scikit-learn-contrib 項目的一部分。下次遇到不平衡的數(shù)據(jù)集時,可以嘗試一下。

安裝:

  1. pip install -U imbalanced-learn
  2. # or
  3. conda install -c conda-forge imbalanced-learn

例子:

有關用法和示例,請參閱其文檔 。

FlashText

在自然語言處理(NLP)任務中清理文本數(shù)據(jù)通常需要替換句子中的關鍵詞或從句子中提取關鍵詞。通常,這種操作可以用正則表達式來完成,但是如果要搜索的術語數(shù)達到數(shù)千個,它們可能會變得很麻煩。

Python 的 FlashText 模塊,基于 FlashText 算法,為這種情況提供了一個合適的替代方案。FlashText 的***部分是運行時間與搜索項的數(shù)量無關。你可以在其 文檔 中讀到更多關于它的信息。

安裝:

  1. $ pip install flashtext

例子:

提取關鍵詞:

  1. from flashtext import KeywordProcessor
  2. keyword_processor = KeywordProcessor()
  3.  
  4. # keyword_processor.add_keyword(<unclean name>, <standardised name>)
  5.  
  6. keyword_processor.add_keyword('Big Apple', 'New York')
  7. keyword_processor.add_keyword('Bay Area')
  8. keywords_found = keyword_processor.extract_keywords('I love Big Apple and Bay Area.')
  9.  
  10. keywords_found
  11. ['New York', 'Bay Area']

替代關鍵詞:

  1. keyword_processor.add_keyword('New Delhi', 'NCR region')
  2.  
  3. new_sentence = keyword_processor.replace_keywords('I love Big Apple and new delhi.')
  4.  
  5. new_sentence
  6. 'I love New York and NCR region.'

有關更多示例,請參閱文檔中的 用法 一節(jié)。

模糊處理

這個名字聽起來很奇怪,但是 FuzzyWuzzy 在字符串匹配方面是一個非常有用的庫。它可以很容易地實現(xiàn)字符串匹配率、令牌匹配率等操作。對于匹配保存在不同數(shù)據(jù)庫中的記錄也很方便。

安裝:

  1. $ pip install fuzzywuzzy

例子:

  1. from fuzzywuzzy import fuzz
  2. from fuzzywuzzy import process
  3.  
  4. # 簡單的匹配率
  5. fuzz.ratio("this is a test", "this is a test!")
  6. 97
  7.  
  8. # 部分的匹配率
  9. fuzz.partial_ratio("this is a test", "this is a test!")
  10.  100

更多的例子可以在 FuzzyWuzy 的 GitHub 倉庫得到。

PyFlux

時間序列分析是機器學習中最常遇到的問題之一。PyFlux 是 Python 中的開源庫,專門為處理時間序列問題而構(gòu)建的。該庫擁有一系列優(yōu)秀的現(xiàn)代時間序列模型,包括但不限于 ARIMA、GARCH 以及 VAR 模型。簡而言之,PyFlux 為時間序列建模提供了一種概率方法。這值得一試。

安裝:

  1. pip install pyflux

例子:

有關用法和示例,請參閱其 文檔

IPyvolume

交流結(jié)果是數(shù)據(jù)科學的一個重要方面,可視化結(jié)果提供了顯著優(yōu)勢。 IPyvolume 是一個 Python 庫,用于在 Jupyter 筆記本中可視化 3D 體積和形狀(例如 3D 散點圖),配置和工作量極小。然而,它目前處于 1.0 之前的階段。一個很好的類比是這樣的: IPyVolumee volshow 是 3D 陣列,Matplotlib 的 imshow 是 2D 陣列。你可以在其 文檔 中讀到更多關于它的信息。

安裝:

  1. Using pip
  2. $ pip install ipyvolume
  3.  
  4. Conda/Anaconda
  5. $ conda install -c conda-forge ipyvolume

例子:

動畫:

體繪制:

Dash

Dash 是一個用于構(gòu)建 Web 應用程序的高效 Python 框架。它構(gòu)建于 Flask、Plotty.js 和 Response.js 之上,將下拉菜單、滑塊和圖形等流行 UI 元素與你的 Python 分析代碼聯(lián)系起來,而不需要JavaScript。Dash 非常適合構(gòu)建可在 Web 瀏覽器中呈現(xiàn)的數(shù)據(jù)可視化應用程序。有關詳細信息,請參閱其 用戶指南 。

安裝:

  1. pip install dash==0.29.0  # The core dash backend
  2. pip install dash-html-components==0.13.2  # HTML components
  3. pip install dash-core-components==0.36.0  # Supercharged components
  4. pip install dash-table==3.1.3  # Interactive DataTable component (new!)

例子:

下面的示例顯示了一個具有下拉功能的高度交互的圖表。當用戶在下拉列表中選擇一個值時,應用程序代碼將數(shù)據(jù)從 Google Finance 動態(tài)導出到 Pandas 數(shù)據(jù)框架中。

Gym

從 OpenAI 而來的 Gym 是開發(fā)和比較強化學習算法的工具包。它與任何數(shù)值計算庫兼容,如 TensorFlow 或 Theano。Gym 是一個測試問題的集合,也稱為“環(huán)境”,你可以用它來制定你的強化學習算法。這些環(huán)境有一個共享的接口,允許您編寫通用算法。

安裝:

  1. pip install gym

例子:

以下示例將在 CartPole-v0 環(huán)境中,運行 1000 次,在每一步渲染環(huán)境。

你可以在 Gym 網(wǎng)站上讀到 其它的環(huán)境 。

結(jié)論

這些是我挑選的有用但鮮為人知的數(shù)據(jù)科學 Python 庫。如果你知道另一個要添加到這個列表中,請在下面的評論中提及。 

 

責任編輯:龐桂玉 來源: Linux中國
相關推薦

2020-07-03 18:05:04

Python開發(fā)工具

2020-11-25 08:00:00

數(shù)據(jù)分析人工智能技術

2009-09-14 09:45:20

Chrome谷歌操作系統(tǒng)

2023-04-23 15:11:26

2019-10-08 16:24:33

Chrome瀏覽器

2014-07-29 14:25:43

Unix命令

2017-11-08 14:55:16

Linux命令sudo

2010-01-07 10:05:51

IT顧問特質(zhì)

2023-09-08 13:11:00

NumPyPandasPython庫

2019-12-12 20:49:05

JavaScript語言運算符

2024-03-04 16:32:02

JavaScript運算符

2023-09-26 12:34:29

Python迭代過濾函數(shù)

2011-05-03 13:13:52

編程PHPJava

2014-04-22 16:38:12

GitHubGitHub 使用技巧

2013-07-15 09:14:00

2024-05-20 13:02:30

Python編程開發(fā)

2021-07-07 10:59:48

python代碼編程語言

2021-08-03 09:55:37

Python函數(shù)編程語言

2015-03-04 09:30:34

數(shù)據(jù)庫

2024-09-10 08:35:57

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲狠狠爱 | 欧美一区二区三区日韩 | 一区二区视频 | 亚洲视频一区二区三区四区 | 久久久久久久av | 青青久在线视频 | 国产一区二区三区视频免费观看 | 精品亚洲一区二区三区四区五区 | 免费精品在线视频 | 国产精品日韩在线观看一区二区 | 国产一区二区在线免费播放 | 在线日韩| 粉色午夜视频 | 中文字幕乱码一区二区三区 | av网站在线免费观看 | 性大毛片视频 | 亚洲精品久久久久久久不卡四虎 | 国产乱码精品一区二区三区五月婷 | 国产激情视频网 | 91精品国产色综合久久 | 亚洲欧美男人天堂 | 91精品久久久久久久久久入口 | 精品欧美激情精品一区 | 免费毛片www com cn| 高清一区二区三区 | 欧美日韩三区 | 一区二区三区欧美在线 | 欧美激情综合 | www.日韩欧美 | 国产精品视频综合 | 日韩欧美在线观看 | 三级免费av| 亚洲精品久久久一区二区三区 | 成人精品一区 | 亚洲欧美中文日韩在线v日本 | 精品久久久久久久久久久久久久久久久 | 精品网| 久久久久一区二区三区 | 91中文在线观看 | 欧美一区视频 | 黑人巨大精品欧美一区二区免费 |