成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Pandas閃回咒!如何在Python中重寫SQL查詢?

開發(fā) 后端
工作中,頻繁切換是件麻煩事兒。一些程序員只熟悉SQL中的數(shù)據(jù)操作,卻不熟悉Python中的數(shù)據(jù)操作,因此在完成項(xiàng)目時(shí),我們不得不頻繁地在SQL和Python之間進(jìn)行切換,導(dǎo)致了工作效率低下和生產(chǎn)能力下降。

工作中,頻繁切換是件麻煩事兒。一些程序員只熟悉SQL中的數(shù)據(jù)操作,卻不熟悉Python中的數(shù)據(jù)操作,因此在完成項(xiàng)目時(shí),我們不得不頻繁地在SQL和Python之間進(jìn)行切換,導(dǎo)致了工作效率低下和生產(chǎn)能力下降。

本文就教你一種方法,使用Pandas在Python中輕松重現(xiàn)SQL結(jié)果。

入門指南

如果電腦中沒有pandas包,則需要先安裝一下:

  1. Conda install pandas 

在這個(gè)階段,我們將使用著名的Kaggle泰坦尼克數(shù)據(jù)集:https://www.kaggle.com/c/titanic/data?select=test.csv。

安裝軟件包并下載數(shù)據(jù)后,需要將其導(dǎo)入Python環(huán)境中:

  1. import pandas as pd 
  2.              titanic_df = pd.read_csv("titanic_test_data.csv"

我們將使用pandas數(shù)據(jù)框架來存儲(chǔ)數(shù)據(jù),還將用到各種pandas函數(shù)來操作數(shù)據(jù)框架。

  1. SELECTDISTINCTCOUNT, LIMIT 

讓我們從經(jīng)常使用的簡(jiǎn)單SQL查詢開始。

 

titanic_df [“ age”]。unique()將在此處返回唯一值的數(shù)組,因此需要使用len()來獲取唯一值的計(jì)數(shù)。

  1. SELECTWHEREORANDIN(有條件選擇) 

現(xiàn)在你知道了如何以簡(jiǎn)單的方式探索數(shù)據(jù)框架,接著來嘗試一些條件吧(在SQL中是WHERE子句)。

 

如果只想從數(shù)據(jù)框架中選擇特定的列,則可以使用另一對(duì)方括號(hào)進(jìn)行選擇。注意,如果要選擇多列,則需要在方括號(hào)內(nèi)放置數(shù)組[“ name”,“ age”]。

isin()與SQL中的IN完全相同。要使用NOT IN,需要在Python中使用negation(〜)來獲得相同的結(jié)果。

  1. GROUP BYORDER BYCOUNT 

 GROUP BY和ORDER BY也是用來探索數(shù)據(jù)的流行SQL,讓我們?cè)赑ython中嘗試一下。

 

如果只想對(duì)COUNT進(jìn)行排序,可以將布爾值傳遞給sort_values函數(shù);如果想對(duì)多列進(jìn)行排序,則必須將布爾數(shù)組傳遞給sort_values函數(shù)。sum()函數(shù)將提供數(shù)據(jù)框架中的所有聚合數(shù)值總和列,如果只需要特定列,則需要使用方括號(hào)指定列名。

  1. MINMAX,MEAN,MEDIAN 

最后,來嘗試一些常見的統(tǒng)計(jì)功能,這些功能對(duì)于數(shù)據(jù)探索非常重要。

 

 

由于SQL沒有中位數(shù)函數(shù),因此將使用BigQuery APPROX_QUANTILES獲取年齡中位數(shù)。pandas聚合函數(shù).agg()還支持其他函數(shù),例如sum。

拒絕頻繁切換,輕松重現(xiàn)查詢,你值得擁有!

你可以在我的Github中查看完整的腳本:https://github.com/chingjunetao/medium-article/tree/master/rewrite-sql-with-python

本文轉(zhuǎn)載自微信公眾號(hào)「讀芯術(shù)」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系讀芯術(shù)公眾號(hào)。

 

責(zé)任編輯:武曉燕 來源: 讀芯術(shù)
相關(guān)推薦

2020-11-19 15:26:36

SQLPandas代碼

2024-11-14 10:00:00

Python繼承

2018-12-25 16:30:15

SQL Server高效分頁(yè)數(shù)據(jù)庫(kù)

2021-10-12 05:00:27

PandasSQL查詢

2017-10-26 15:32:23

數(shù)據(jù)庫(kù)Oracle閃回查詢

2023-10-18 18:31:04

SQL查詢數(shù)據(jù)

2022-06-22 09:56:19

PythonMySQL數(shù)據(jù)庫(kù)

2021-07-09 12:37:31

GoPython編程語(yǔ)言

2021-08-12 08:00:00

Pandas數(shù)據(jù)分析SQL

2024-11-26 08:00:00

SQLPandasPandaSQL

2009-07-15 15:18:01

JDBC連接SQL S

2014-12-15 09:59:28

LinuxApache

2020-07-06 15:50:41

Python文件Linux

2021-07-02 20:37:19

Python代碼SRP

2025-01-21 15:20:14

2024-02-20 09:54:20

MySQL數(shù)據(jù)庫(kù)

2023-09-01 08:19:21

Flask

2021-01-18 17:23:30

代碼調(diào)試VS Code

2024-07-04 07:44:19

2011-03-11 13:26:23

SQL Server數(shù)導(dǎo)入數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 精品不卡| 2019天天操| 69热视频在线观看 | 日韩精品二区 | 精品一区二区在线观看 | 午夜大片 | 日本精品一区二区在线观看 | 国产精品久久二区 | 狠狠干美女 | 国产91在线播放精品91 | 久久中文一区二区 | 国产精品视频一区二区三区 | 久久成人18免费网站 | 日韩视频二区 | 一区二区视频在线观看 | 亚洲一区 中文字幕 | 懂色av色香蕉一区二区蜜桃 | 日韩成人在线视频 | 久久精品国产免费 | 国产小视频在线 | 久久免费福利 | 日日日视频 | 在线精品亚洲欧美日韩国产 | 91社区视频 | 性大毛片视频 | 国产精品视频97 | 亚洲品质自拍视频 | 免费视频久久 | www.日本国产| 另类在线| 国产免费xxx| 黑人精品欧美一区二区蜜桃 | 2019天天操| 欧美精产国品一二三区 | 久久日韩粉嫩一区二区三区 | 国产一区二区日韩 | 久久国产精品视频 | 亚洲国产精品一区二区第一页 | 中文字幕在线不卡 | 天天夜碰日日摸日日澡 | 一区二区三区四区免费视频 |