成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

TiDB SQL調優案例之避免TiFlash幫倒忙

數據庫 其他數據庫
TiFlash雖然是個好東西,但是優化器還在進化當中,難免有判斷失誤的時候,那么會導致適得其反的效果,我們要及時通過人工手段介入。再給TiDB優化器一些時間。

背景

早上收到某系統的告警tidb節點掛掉無法訪問,情況十萬火急。登錄中控機查了一下display信息,4個TiDB、Prometheus、Grafana全掛了,某臺機器hang死無法連接,經過快速重啟后集群恢復,經排查后是昨天上線的某個SQL導致頻繁OOM。

于是開始亡羊補牢,來一波近期慢SQL巡檢 #手動狗頭#。。。

隨便找了一個出現頻率比較高的慢SQL,經過優化后竟然性能提升了1500倍以上,感覺有點東西,分享給大家。

分析過程

該慢SQL邏輯非常簡單,就是一個單表聚合查詢,但是耗時達到8s以上,必有蹊蹺。

脫敏后的SQL如下:

SELECT
cast( cast( CAST( SUM( num ) / COUNT( time ) AS CHAR ) AS DECIMAL ( 9, 2 )) AS signed ) speed,
... -- 此處省略n個字段
FROM
(
SELECT
DATE_FORMAT( receive_time, '%Y-%m-%d %H:%i:00' ) AS time,
COUNT(*) AS num
FROM
db1.table
WHERE
create_time > DATE_SUB( sysdate(), INTERVAL 20 MINUTE )
GROUP BY
time
ORDER BY
time
) speed;

碰到慢SQL不用多想,第一步先上執行計劃:

很明顯,這張900多萬行的表因為創建了TiFlash副本,在碰到聚合運算的時候優化器選擇了走列存查詢,最終結果就是在TiFlash完成暴力全表掃描、排序、分組、計算等一系列操作,返回給TiDB Server時基本已經加工完成,總共耗時8.02s。

咋一看好像沒啥優化空間,但仔細觀察會發現一個不合理的地方。執行計劃倒數第二排的Selection算子,也就是SQL里面子查詢的where過濾,實際有效數據1855行,卻掃描了整個表接近950W行,這是一個典型的適合索引加速的場景。但遺憾的是,在TiFlash里面并沒有索引的概念,所以只能默默地走全表掃描。

那么優化的第一步,先看過濾字段是否有索引,通常來說create_time這種十有八九都建過索引,檢查后發現確實有。

第二步,嘗試讓優化器走TiKV查詢,這里直接使用hint的方式:

SELECT /*+ READ_FROM_STORAGE(TIKV[db1.table]) */
cast( cast( CAST( SUM( num ) / COUNT( time ) AS CHAR ) AS DECIMAL ( 9, 2 )) AS signed ) speed,
... -- 此處省略n個字段
FROM
(
SELECT
DATE_FORMAT( receive_time, '%Y-%m-%d %H:%i:00' ) AS time,
COUNT(*) AS num
FROM
db1.table
WHERE
create_time > DATE_SUB( sysdate(), INTERVAL 20 MINUTE )
GROUP BY
time
ORDER BY
time
) speed;

再次生成執行計劃,發現還是走了TiFlash查詢。這里就引申出一個重要知識點,關于hint作用域的問題,也就是說hint只能在指定的查詢范圍內生效。具體到上面這個例子,雖然指定了db1.table走TiKV查詢,但是對于它所在的查詢塊來說,壓根不知道db1.table是誰直接就忽略掉了。所以正確的寫法是把hint寫到子查詢中:

SELECT
cast( cast( CAST( SUM( num ) / COUNT( time ) AS CHAR ) AS DECIMAL ( 9, 2 )) AS signed ) speed,
... -- 此處省略n個字段
FROM
(
SELECT /*+ READ_FROM_STORAGE(TIKV[db1.table]) */
DATE_FORMAT( receive_time, '%Y-%m-%d %H:%i:00' ) AS time,
COUNT(*) AS num
FROM
db1.table
WHERE
create_time > DATE_SUB( sysdate(), INTERVAL 20 MINUTE )
GROUP BY
time
ORDER BY
time
) speed;

對應的執行計劃為:

小提示:也可以通過set session tidb_isolation_read_engines = 'tidb,tikv';來讓優化器走tikv查詢。

發現這次雖然走了TiKV查詢,但還是用的TableFullScan算子,整體時間不降反升,和我們預期的有差距。

沒走索引那肯定是和查詢字段有關系,分析上面SQL的邏輯,開發是想查詢table表創建時間在最近20分鐘的數據,用了一個sysdate()函數獲取當前時間,問題就出在這。

獲取當前時間常用的函數有now()和sysdate(),但這兩者是有明顯區別的。引用自官網的解釋:

  • now()得到的是語句開始執行的時間,是一個固定值
  • sysdate()得到的是該函數實際執行的時間,是一個動態值

聽起來比較饒,來個栗子一看便知:

mysql> select now(),sysdate(),sleep(3),now(),sysdate();
+---------------------+---------------------+----------+---------------------+---------------------+
| now() | sysdate() | sleep(3) | now() | sysdate() |
+---------------------+---------------------+----------+---------------------+---------------------+
| 2023-03-16 15:55:18 | 2023-03-16 15:55:18 | 0 | 2023-03-16 15:55:18 | 2023-03-16 15:55:21 |
+---------------------+---------------------+----------+---------------------+---------------------+
1 row in set (3.06 sec)

這個動態時間就意味著TiDB優化器在估算的時候并不知道它是個什么值,走索引和不走索引哪個成本更高,最終導致索引失效。

從業務上來看,這個SQL用now()和sysdate()都可以,那么就嘗試改成now()看看效果:

SELECT
cast( cast( CAST( SUM( num ) / COUNT( time ) AS CHAR ) AS DECIMAL ( 9, 2 )) AS signed ) speed,
... -- 此處省略n個字段
FROM
(
SELECT /*+ READ_FROM_STORAGE(TIKV[db1.table]) */
DATE_FORMAT( receive_time, '%Y-%m-%d %H:%i:00' ) AS time,
COUNT(*) AS num
FROM
db1.table
WHERE
create_time > DATE_SUB( now(), INTERVAL 20 MINUTE )
GROUP BY
time
ORDER BY
time
) speed;

最終結果4.43ms搞定,從8.02s到4.43ms,1800倍的提升。

濫用函數,屬于是開發給自己挖的坑了。

解決方案

經過以上分析,優化思路已經很清晰了,甚至都是常規優化不值得專門拿出來講,但前后效果差異太大,很適合作為一個反面教材來提醒大家認真寫SQL。

其實就兩點:

  • 讓優化器不要走TiFlash查詢,改走TiKV,可通過hint或SQL binding解決
  • 非必須不要使用動態時間,避免帶來索引失效的問題

深度思考

優化完成之后,我開始思考優化器走錯執行計劃的原因。

在最開始的執行計劃當中,優化器對Selection算子的估算值estRows和實際值actRows相差非常大,再加上本身計算和聚合比較多,這可能是導致誤走TiFlash的原因之一。不清楚TiFlash的estRows計算原理是什么,如果在估算準確的情況并且索引正常的情況下會不會走TiKV呢?

另外,我還懷疑過動態時間導致優化器判斷失誤(認為索引失效才選擇走TiFlash),但是在嘗試只修改sysdate()為now()的情況下,發現依然走了TiFlash,說明這個可能性不大。

在索引字段沒問題的時候,按正常邏輯來說,我覺得一個成熟的優化器應該要能夠判斷出這種場景走TiKV更好。

總結

TiFlash雖然是個好東西,但是優化器還在進化當中,難免有判斷失誤的時候,那么會導致適得其反的效果,我們要及時通過人工手段介入。再給TiDB優化器一些時間。

良好的SQL習慣至關重要,這也是老生常談的問題了,再好的數據庫也扛不住亂造的SQL。?

責任編輯:武曉燕 來源: 今日頭條
相關推薦

2017-07-21 08:55:13

TomcatJVM容器

2011-01-21 08:38:20

2023-11-10 09:29:30

MySQLExplain

2011-09-02 14:05:25

SQL Server性能調優

2009-01-08 19:14:37

服務器應用程序SQL Server

2021-11-07 23:49:19

SQL數據庫工具

2009-11-17 13:45:12

Oracle SQL調

2011-03-21 09:35:38

LAMP調優網絡文件

2019-09-25 15:09:30

MySQL索引SQL

2012-01-10 14:35:08

JavaJVM

2009-01-08 19:11:39

服務器應用程序SQL Server

2009-01-08 19:06:13

服務器應用程序SQL Server

2020-06-10 10:40:03

JavaJMH字符串

2021-03-17 11:35:11

JVM代碼Java

2010-07-19 13:35:51

SQL Server性

2010-07-19 09:39:53

SQL Server

2010-04-12 17:30:44

Oracle SQL調

2021-07-15 08:00:47

系統性能調優cpunuma架構

2023-11-28 08:43:48

2021-03-04 08:39:21

SparkRDD調優
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美不卡一区二区三区 | 欧美日韩国产在线观看 | 日韩1区| 午夜性色a√在线视频观看9 | 最新黄色毛片 | 人人做人人澡人人爽欧美 | 日韩欧美网 | 久久精品小视频 | 日韩视频在线播放 | 成人久久18免费网站 | 成人国产精品色哟哟 | 久久久久久久久99 | 欧美日韩三区 | 99精品视频免费在线观看 | 中文字幕第三页 | 欧美在线a | 影音先锋成人资源 | 亚洲男女视频在线观看 | 久久99深爱久久99精品 | 婷婷桃色网| 亚洲精品在线视频 | 精品在线一区 | 中文字幕1区2区3区 日韩在线视频免费观看 | 一区二区三区不卡视频 | 国产精品久久久久久久久免费软件 | 免费在线视频a | 精品国模一区二区三区欧美 | 亚洲一区二区三区免费视频 | 国产激情视频在线免费观看 | 成人在线一区二区三区 | 成人在线中文字幕 | 久久9久| 97av视频在线 | 香蕉一区 | 91av大全 | 成人亚洲 | 一区二区日本 | 久久久久久免费毛片精品 | 仙人掌旅馆在线观看 | 欧美国产精品一区二区三区 | 91久色|