面試官:GROUP BY和DISTINCT有什么區別?
在 MySQL 中,GROUP BY 和 DISTINCT 都是用來處理查詢結果中的重復數據,并且在官方的描述文檔中也可以看出:在大多數情況下 DISTINCT 是特殊的 GROUP BY,如下圖所示:
官方文檔地址:https://dev.mysql.com/doc/refman/8.0/en/distinct-optimization.html
但二者還是有一些細微的不同,接下來一起來看。
1.DISTINCT 介紹
- 用途:DISTINCT 用于從查詢結果中去除重復的行,確保返回的結果集中每一行都是唯一的。
- 語法:通常用于 SELECT 語句中,緊跟在 SELECT 關鍵字之后。例如以下 SQL:
SELECT DISTINCT column1, column2 FROM table_name;
- 工作機制:DISTINCT 會對整個結果集進行去重,即只要結果集中的某一行與另一行完全相同,就會被去除。
2.GROUP BY 介紹
- 用途:GROUP BY 主要用于對結果集按照一個或多個列進行分組,通常與聚合函數(如 COUNT, SUM, AVG, MAX, MIN 等)一起使用,以便對每個組進行統計。
- 語法:GROUP BY 通常跟在 FROM 或 WHERE 子句之后,在 SELECT 語句的末尾部分。例如以下 SQL:
SELECT column1, COUNT(*) FROM table_name GROUP BY column1;
- 工作機制:GROUP BY 將數據按指定的列進行分組,每個組返回一行數據。
3.舉例說明
(1)使用 DISTINCT
假設有一個表 students,包含以下數據:
id | name | age |
1 | Alice | 20 |
2 | Bob | 22 |
3 | Alice | 20 |
使用 DISTINCT 去除重復行:
SELECT DISTINCT name, age FROM students;
結果:
name | age |
Alice | 20 |
Bob | 22 |
(2)使用 GROUP BY
假設還是上面的表 students,我們想要統計每個學生的數量:
SELECT name, COUNT(*) AS count FROM students GROUP BY name;
結果:
name | count |
Alice | 2 |
Bob | 1 |
4.主要區別
- 功能不同:DISTINCT 用于去除重復行,而 GROUP BY 用于對結果集進行分組,通常與聚合函數一起使用。
- 返回結果不同:DISTINCT 返回去重后的結果集,查詢結果集中只能包含去重的列信息,有其他列信息會報錯;GROUP BY 返回按指定列分組后的結果集,可以展示多列信息,并可以包含聚合函數的計算結果。
- 應用場景不同:DISTINCT 更適合單純的去重需求,GROUP BY 更適合分組統計需求。
- 性能略有不同:如果去重的字段有索引,那么 GROUP BY 和 DISTINCT 都可以使用索引,此情況它們的性能是相同的;而當去重的字段沒有索引時,DISTINCT 的性能就會高于 GROUP BY,因為在 MySQL 8.0 之前,GROUP BY 有一個隱藏的功能會進行默認的排序,這樣就會觸發 filesort 從而導致查詢性能降低。