自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MySQL排序工作原理

數(shù)據(jù)庫(kù) MySQL
在程序設(shè)計(jì)當(dāng)中,我們很多場(chǎng)景下都會(huì)用 group by 關(guān)鍵字。比如在分頁(yè)讀取數(shù)據(jù)時(shí),為了避免重復(fù)掃描記錄,這就是必須要使用 group by 了。

MySQL的 order by 工作原理

在程序設(shè)計(jì)當(dāng)中,我們很多場(chǎng)景下都會(huì)用 group by 關(guān)鍵字。比如在分頁(yè)讀取數(shù)據(jù)時(shí),為了避免重復(fù)掃描記錄,這就是必須要使用 group by 了。

比如我們使用如下 DDL 創(chuàng)建表:

  1. CREATE TABLE `user_info` ( 
  2.  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主鍵ID'
  3.  `city` varchar(16) NOT NULL COMMENT '城市'
  4.  `namevarchar(16) NOT NULL COMMENT '姓名'
  5.  `age` int(11) NOT NULL COMMENT '年齡'
  6.  `addr` varchar(128) DEFAULT NULL COMMENT '地址'
  7.  PRIMARY KEY (`id`), 
  8.  KEY `city` (`city`) 
  9. ) ENGINE=InnoDB DEFAULT CHARSET=utf8 

并且我們會(huì)執(zhí)行如下查詢語句

  1. SELECT city,`name`,age FROM user_info WHERE city='上海' ORDER BY `name` LIMIT 1000; 

全字段排序

因?yàn)樯厦娴慕ū碚Z句已經(jīng)在 city 字段上面創(chuàng)建索引了,當(dāng)我們使用 EXPLAIN 命令時(shí),會(huì)有如下結(jié)果:

MySQL的 order by 工作原理

上面 Extra 字段中的 “Using filesort” 表示的就是需要排序,MySQL 會(huì)為每個(gè)線程分配一塊內(nèi)存用于排序,成為 sort_buffer。下面我們看一下 index(city) 的結(jié)構(gòu)示意圖。

MySQL的 order by 工作原理

執(zhí)行流程如下:

  1. 初始化 sort_buffer,確定放入 city name age 這 3 個(gè)字段;
  2. 從 city 索引中獲取到***個(gè) city='上海' 的記錄,也就是 id_x;
  3. 到主鍵索引中獲取對(duì)應(yīng)的記錄,并取出 name city age 的值放入 sort_buffer;
  4. 取下一條符合條件的記錄,重復(fù) 3 4 的操作,直至不符合條件為止;
  5. 對(duì) sort_buffer 中的數(shù)據(jù)按照 name 做快速排序;
  6. 取出前 1000 條數(shù)據(jù)并返回。

我們暫時(shí)叫這種排序過程為“全字段排序”,如下所示:

MySQL的 order by 工作原理

圖中的“按 name 排序” 可能在內(nèi)存中,也可能使用磁盤文件排序,這取決與排序所需要的內(nèi)存和 sort_buffer_size 。sort_buffer_size 就是 MySQL 為排序開辟的內(nèi)存大小,當(dāng)所需內(nèi)存小于 sort_buffer_size 時(shí),就直接在內(nèi)存中完成排序,如果所需要的內(nèi)存 大于 sort_buffer_size ,就需要額外的磁盤空間輔助排序。

rowid 排序

上面的算法在數(shù)據(jù)量比較大的時(shí)候,可能會(huì)出現(xiàn)一些問題。因?yàn)樵谂判虻臅r(shí)候,存放了所有的返回字段,增加了 排序空間 (sort_buffer)的壓力。

  1. SET max_length_for_sort_data=16; 

max_length_for_sort_data 是MySQL 限制排序行大小的參數(shù)。意思是,如果排序行大小超過了這個(gè)值,就會(huì)另選排序算法。上面 name city age 3 個(gè)字段的大小為 36,大于 16 ,在新的算法中將只有 name (排序字段) 和id 參與 sort_buffer 中的排序。過程如下

  1. 初始化 sort_buffer,確定放入 name id 這 2 個(gè)字段;
  2. 從 city 索引中獲取到***個(gè) city='上海' 的記錄,也就是 id_x;
  3. 到主鍵索引中獲取對(duì)應(yīng)的記錄,并取出 name id 的值放入 sort_buffer;
  4. 取下一條符合條件的記錄,重復(fù) 3 4 的操作,直至不符合條件為止;
  5. 對(duì) sort_buffer 中的數(shù)據(jù)按照 name 做快速排序;
  6. 取出前 1000 條數(shù)據(jù),然后根據(jù) id 取出對(duì)應(yīng)記錄的 name city age 3 個(gè)字段并返回結(jié)果。

這種排序過程,我們稱為 rowid 排序,過程如下所示:

MySQL的 order by 工作原理

全字段排序 VS rowid 排序

從上面 2 個(gè)流程看來,如果內(nèi)存足夠時(shí),MySQL 會(huì)讓返回值中所有字段存放在排序空間。當(dāng)MySQL 內(nèi)存過小時(shí),才會(huì)考慮使用rowid 排序。但是從上面的流程看來,rowid 排序在返回結(jié)果前,還會(huì)再一次的回表。因此MySQL 認(rèn)為內(nèi)存充足的時(shí)候,會(huì)優(yōu)先采用 全字段排序。

上面的場(chǎng)景是:city 字段過濾后,name 字段不是有序的。其實(shí)我們可以通過聯(lián)合索引來規(guī)避掉 name 字段的排序。

  1. alter table user_info add index idx_city_user(city, name); 

下面我們看一下聯(lián)合索引的示意圖:

MySQL的 order by 工作原理

從上面流程圖可以看出,當(dāng)我們?nèi)〕?city='上海' 的記錄時(shí),name的字段也是有序的。過程如下

  1. 從 (city, name)索引中獲取到***個(gè) city='上海' 的記錄 id_x;
  2. 到主鍵索引中獲取對(duì)應(yīng)的記錄,并取出 name city age 的值作為結(jié)果集的一部分直接返回;
  3. 取下一條符合條件的記錄,重復(fù) 2 3 的操作,直至不符合條件或者達(dá)到 1000 條為止;

MySQL的 order by 工作原理

從聯(lián)合索引看來,我們是可以不用排序操作了,那么我們是否可以直接通過 索引就直接返回結(jié)果呢?也就是不要回表操作。答案是有的,那就是覆蓋索引。

  1. alter table user_info add index idx_city_user_age(city, name, age); 

當(dāng)執(zhí)行查詢語句時(shí),不僅 name 中的字段是有序的,并且 索引中已經(jīng)包含了結(jié)果集中的所有字段,過程如下:

  1. 從 (city, name,age)索引中獲取到***個(gè) city='上海' 的記錄,并取出 name city age 的值作為結(jié)果集的一部分直接返回;
  2. 取下一條符合條件的記錄,重復(fù) 1 2 的操作,直至不符合條件或者達(dá)到 1000 條為止;

MySQL的 order by 工作原理

 

責(zé)任編輯:龐桂玉 來源: 今天頭條
相關(guān)推薦

2010-11-25 10:28:28

MySQL查詢優(yōu)化器

2009-06-18 13:31:03

Spring工作原理

2009-08-14 13:19:23

2019-04-29 11:14:25

MySQL存儲(chǔ)排序

2020-06-15 07:00:00

GitOpsKubernetesDevOps

2009-07-16 10:23:30

iBATIS工作原理

2009-06-15 15:57:21

Spring工作原理

2010-09-25 13:11:48

DHCP工作原理

2021-02-05 15:01:41

GitLinux命令

2019-08-20 14:01:22

HTTPSSSL協(xié)議

2013-06-04 13:53:30

OSPF路由協(xié)議OSPF協(xié)議OSPF

2013-09-18 14:01:46

JavaScript

2010-08-02 16:14:54

2010-09-29 09:28:04

DHCP工作原理

2011-03-25 09:34:34

Nagios網(wǎng)絡(luò)監(jiān)控

2020-09-16 10:31:58

SMTP網(wǎng)絡(luò)電子郵件

2009-07-06 12:32:26

JSP引擎

2010-05-05 16:47:57

Unix Tripwi

2015-11-04 09:23:17

JavaServlet工作原理

2020-05-19 09:11:20

機(jī)器學(xué)習(xí)技術(shù)數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)