成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Python 數據分析:初識 Pandas

開發 數據分析
本文我們了解了Pandas擴展包的安裝、導入,以及創建Series、DataFrame格式數據(后面會詳細講這兩種格式)。

Python作為一個腳本語言,其廣泛的擴展包生態,使得我們可以利用Python完成幾乎所有的數據分析。也就是說,在我們辦公場景下,幾乎可以勝任所有的日常工作。利用Python辦公主要是用擴展包完成,其中最著名的當屬Pandas,它也是數據分析三劍客之一。

1. Pandas是什么?

首先,我們來認識一下Pandas。它是一個開源、BSD許可的庫,為Python編程語言提供高性能、易于使用的數據結構和數據分析工具。

通常我們使用Pandas完成如下工作:

  • 格式化數據的讀取、處理與存儲;
  • 數據清洗,如空值、異常值的處理;
  • 數據處理分析,支持數據的增刪改查操作、數據描述、相關性分析等;
  • 跨表處理,支持多張表的組合、連接和堆疊等操作;
  • 繪圖,自帶繪圖功能,可以完成散點圖、線圖、柱狀圖等繪圖;

2. 安裝Pandas環境

安裝pandas非常簡單,只需要在命令提示符窗口執行pip install pandas命令即可。

C:\Users\william>pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
Lookingin indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Collectingpandas
Downloadinghttps://pypi.tuna.tsinghua.edu.cn/packages/ab/63/966db1321a0ad55df1d1fe51505d2cdae191b84c907974873817b0a6e849/pandas-2.2.2-cp311-cp311-win_amd64.whl (11.6 MB)
----------------------------------------11.6/11.6 MB 16.4 MB/s eta 0:00:00
Successfully installed pandas-2.2.2

這里加了-i參數,意思是指定包源,也就是從哪個服務器上搜索并下載,主要是為了提高下載速度,畢竟默認是指向國外的服務器的,速度較慢。

常用的國內源:

  • 清華大學:https://pypi.tuna.tsinghua.edu.cn/simple
  • 阿里云:https://mirrors.aliyun.com/pypi/simple
  • 中國科學技術大學:https://pypi.mirrors.ustc.edu.cn/simple

3. 第一次使用

第一次使用Pandas需要在使用前導入包,一般我們會起個別名pd,如下:

import pandas as pd

這里給pandas的包起的別名pd,將會在本系列教程中默認使用,后面直接使用pd.methodname()實現對于方法的調用。

下面先來看看Series數據的生成,以及描述統計信息查看。

# 利用range()函數創建元素和索引
>>> s = pd.Series(range(5),index=['r0','r1','r2','r3','r4'])
>>>s   # 可以觀測到S是一個類似字典的結構,由索引和值構成。
r0    0
r1    1
r2    2
r3    3
r4    4
dtype: int64


# 查看統計描述信息
>>>s.describe()  
count    5.000000
mean     2.000000
std      1.581139
min      0.000000
25%      1.000000
50%      2.000000
75%      3.000000
max      4.000000
dtype: float64

下面再來看看DataFrame數據的生成,以及描述統計信息查看。

# 先利用numpy創建一個二維數組
>>> import numpy as np
>>> array0 = np.arange(12).reshape(3,4)
>>> array0
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])


# 創建DataFrame格式數據,并分別設置行列索引
>>> df0 = pd.DataFrame(array,
...                    columns=['a','b','c','d'],
...                    index=['r0','r1','r3'])
>>> df0
    a  b   c   d
r0  0123
r1  4567
r3  891011


# 查看統計描述信息
>>> df0.describe()
         a    b     c     d
count  3.03.03.03.0
mean   4.05.06.07.0
std    4.04.04.04.0
min    0.01.02.03.0
25%    2.03.04.05.0
50%    4.05.06.07.0
75%    6.07.08.09.0
max    8.09.010.011.0

4. 小結

本節我們了解了Pandas擴展包的安裝、導入,以及創建Series、DataFrame格式數據(后面會詳細講這兩種格式)。并使用describe()方法查看各列的統計描述信息,它可以幫我們觀察每數據的聚集、離散程度。

責任編輯:趙寧寧 來源: Python知識驛站
相關推薦

2020-06-05 14:29:07

PythonPandas數據分析

2024-01-09 13:58:22

PandasPython數據分析

2017-09-01 09:52:20

PythonPandas數據分析

2023-11-21 09:11:31

2022-11-11 11:35:14

2023-01-28 10:09:00

Pandas數據分析Python

2020-04-21 10:11:03

Python數據分析Pandas

2024-04-09 08:47:34

PandasRollingPython

2019-09-02 15:12:46

Python 開發數據分析

2022-07-08 06:01:37

D-Tale輔助工具

2019-11-04 15:00:01

DatatableR語言數據科學

2021-12-24 10:45:19

PandasLambda數據分析

2022-03-24 09:36:28

Pandas數據分析代碼

2025-04-02 09:33:01

2023-12-10 14:06:04

數據庫pythonduckdb

2023-05-05 18:45:21

Python人工智能機器學習

2020-08-30 14:29:01

Pandas數據分析函數

2023-11-15 18:03:11

Python數據分析基本工具

2020-03-19 15:11:14

Pandas數據分析代碼

2025-06-06 08:35:41

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 羞羞的视频免费看 | 成人三级在线播放 | 少妇精品亚洲一区二区成人 | 久久午夜国产精品www忘忧草 | 日韩午夜 | 欧美视频三区 | 精品成人免费一区二区在线播放 | 国产日产欧产精品精品推荐蛮挑 | 在线播放中文字幕 | 2023亚洲天堂| 81精品国产乱码久久久久久 | 日本二区在线观看 | 国产伦一区二区三区久久 | 97精品国产一区二区三区 | 一级二级三级在线观看 | 欧美一区二区大片 | 午夜精品在线 | 最新免费黄色网址 | 亚洲久久久 | 亚洲在线高清 | 草b视频 | xxxxxx国产| 91视频入口 | 久久久久久久久久久成人 | 婷婷不卡| 少妇午夜一级艳片欧美精品 | 久久久这里都是精品 | a天堂在线 | 一区二区三区精品视频 | 蜜桃免费一区二区三区 | av日韩在线播放 | 亚洲自拍一区在线观看 | 久草免费在线视频 | 久久中文视频 | 欧美日产国产成人免费图片 | 亚洲在线| 久久久涩| 日本一区二区三区四区 | 免费黄色大片 | 亚洲精品福利视频 | 亚洲一区二区三区视频在线 |