成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

總結了Pandas實現數據清洗的7種方式

大數據 數據分析
最近在做“對比excel,學習pandas系列”,今天給大家介紹一下excel和pandas實現數據清洗的種方式。

 最近在做“對比excel,學習pandas系列”,前面發了一篇 很受讀者喜愛,今天給大家介紹一下excel和pandas實現數據清洗的種方式

1.處理數據中的空值

我們在處理真實的數據時,往往會有很多缺少的的特征數據,就是所謂的空值,必須要進行處理才能進行下一步分析

空值的處理方式有很多種,一般是刪除或者填充

Excel通過“查找和替換”功能實現空值的統一替換:

通過“定位”刪除空值:

pandas處理空值的方式比較靈活,可以使用dropna函數刪除空值

  1. import pandas as pd 
  2. data=pd.read_csv('成績表.csv',encoding='gbk'
  3. data.dropna(how='any'

用fillna函數實現空值的填充

①使用數字0填充數據表中的空值

  1. data.fillna(value=0)   

②使用平均值填充數據表中的空值

  1. data['語文'].fillna(data['語文'].mean()) 

2.刪除空格

excel中清理空格很簡單,直接替換即可

pandas刪除空格也很方便,主要使用map函數

  1. data['姓名']=data['姓名'].map(str.strip) 
  2. data 

3.大小寫轉換

excel中大小寫轉換函數分別為upper()和lower()

pandas中轉換函數也為upper()和lower()

  1. data['拼音']=data['拼音'].str.upper() 
  2. data 

  1. data['拼音']=data['拼音'].str.lower() 
  2. data 

4.更改數據格式

excel中更改數據格式通過快捷鍵“ctrl+1”打開“設置單元格格式”:

pandas使用astype來修改數據格式,以將“語文”列改成整數為例

  1. data['語文'].dropna(how='any').astype('int'

5.更改列名稱

excel中更改列名稱就不說了,大家都會

pandas使用rename函數更改列名稱,代碼如下:

  1. data.rename(columns={'語文':'語文成績'}) 

6.刪除重復值

excel的功能區“數據”下有“刪除重復項”,可以用來刪除表中的重復值,默認保留最第一個重復值,把后面的刪除:

pandas使用drop_duplicates函數刪除重復值:

  1. data['數學'].drop_duplicates() #默認刪除后面的重復值 
  2.  
  3. data['數學'].drop_duplicates(keep='last') #刪除第一項重復值 

7.修改及替換數據

excel中使用“查找和替換”功能實現數值的替換

pandas中使用replace函數實現數據替換

  1. data['姓名'].replace('成  功','失  敗'

 本文轉載自微信公眾號「python數據分析之禪」,可以通過以下二維碼關注。轉載本文請聯系python數據分析之禪公眾號。

 

責任編輯:武曉燕 來源: python數據分析之禪
相關推薦

2023-02-27 22:03:06

數據庫內存RocketMQ

2024-10-28 12:57:36

Pandas數據清洗

2022-04-20 15:10:55

pandas編碼函數

2022-07-11 13:30:08

Pandas數據編碼代碼

2022-03-11 12:31:04

Vue3組件前端

2021-08-25 07:47:53

Pandas函數數據處理

2022-04-28 18:47:04

Pandas函數Python

2009-07-02 14:42:55

ExtJS Grid

2022-03-09 18:09:47

前端CSS代碼

2024-11-20 07:00:00

代碼數據清洗Python

2021-04-09 16:22:39

云計算

2019-05-16 13:00:18

異步編程JavaScript回調函數

2018-09-09 15:13:53

2020-11-20 14:02:22

HashMap遍歷Java

2023-09-26 01:03:36

Pandas數據數據集

2018-04-03 12:07:53

數據清洗PandasNumpy

2021-05-17 09:31:58

爬蟲偽裝技巧

2022-08-05 08:27:05

分布式系統線程并發

2023-12-12 11:06:37

PythonPandas數據

2024-06-13 11:54:03

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 五月婷婷激情网 | 国产精品久久久久久久久久妇女 | 91亚洲精选 | 日韩精品国产精品 | 欧美成人精品一区二区三区 | 日韩久久综合网 | 国产中文| 国产精品久久久久久久久久免费看 | 国产亚洲一区精品 | 亚洲国产精品福利 | 黄色大片免费网站 | 国产高清视频在线观看播放 | 精品日韩| 欧美三级三级三级爽爽爽 | 亚洲欧美中文日韩在线 | 国产精品成人一区二区三区吃奶 | 日韩精彩视频 | 国产精品永久免费视频 | 精品一区二区三区在线视频 | 国产亚洲欧美另类一区二区三区 | 亚州精品天堂中文字幕 | 国产免费观看一级国产 | 国产成人精品免高潮在线观看 | www成人免费| 欧美视频日韩 | 国产9999精品| 国产人免费人成免费视频 | 亚洲精精品 | 国产午夜精品一区二区三区在线观看 | 在线视频一区二区三区 | av国产精品 | 精品国产久| av天空 | 91不卡在线 | 日韩国产在线 | 国产精品不卡 | 成人亚洲性情网站www在线观看 | 亚洲欧美日韩在线一区二区 | 久草网址 | 一区二区三区小视频 | 日韩中文字幕视频在线 |