面試突擊:聊聊聚簇索引和非聚簇索引到底有什么區別?
在 MySQL 默認引擎 InnoDB 中,索引大致可分為兩類:聚簇索引和非聚簇索引,它們的區別也是常見的面試題,所以我們今天就來盤它們。
聚簇索引
聚簇索引(Clustered Index)一般指的是主鍵索引(如果存在主鍵索引的話),聚簇索引也被稱之為聚集索引。
聚簇索引在 InnoDB 中是使用 B+ 樹實現的,比如我們創建一張 student 表,它的構建 SQL 如下:
drop table if exists student;
create table student(
id int primary key,
name varchar(16),
class_id int not null,
index (class_id)
)engine=InnoDB;
-- 添加測試數據
insert into student(id,name,class_id) values(1,'張三',100),
(2,'李四',200),(3,'王五',300);
以上 student 表中有一個聚簇索引(也就是主鍵索引)id,和一個非聚簇索引 class_id。
聚簇索引 id 對應的 B+ 樹如下圖所示:
在聚簇索引的葉子節點直接存儲用戶信息的內存地址,我們使用內存地址可以直接找到相應的行數據。
非聚簇索引
非聚簇索引在 InnoDB 引擎中,也叫二級索引,以上面 student 表為例,在 student 中非聚簇索引 class_id 對應 B+ 樹如下圖所示:
從上圖我們可以看出,在非聚簇索引的葉子節點上存儲的并不是真正的行數據,而是主鍵 ID,所以當我們使用非聚簇索引進行查詢時,首先會得到一個主鍵 ID,然后再使用主鍵 ID 去聚簇索引上找到真正的行數據,我們把這個過程稱之為回表查詢。
總結
在 MySQL 的 InnoDB 引擎中,每個索引都會對應一顆 B+ 樹,而聚簇索引和非聚簇索引最大的區別在于葉子節點存儲的數據不同,聚簇索引葉子節點存儲的是行數據,因此通過聚簇索引可以直接找到真正的行數據;而非聚簇索引葉子節點存儲的是主鍵信息,所以使用非聚簇索引還需要回表查詢,因此我們可以得出聚簇索引和非聚簇索引的區別主要有以下幾個:
- 聚簇索引葉子節點存儲的是行數據;而非聚簇索引葉子節點存儲的是聚簇索引(通常是主鍵 ID)。
- 聚簇索引查詢效率更高,而非聚簇索引需要進行回表查詢,因此性能不如聚簇索引。
- 聚簇索引一般為主鍵索引,而主鍵一個表中只能有一個,因此聚簇索引一個表中也只能有一個,而非聚簇索引則沒有數量上的限制。