Oracle性能優化之SQL優化【上】
(1) 選擇最有效率的表名順序 (只在基于規則的優化器 (Oracle 有兩種優化器:RBO 基于規則的優化器和 CBO 基于成本的優化器) 中有效):
ORACLE 的解析器按照從右到左的順序處理 FROM 子句中的表名,FROM 子句中寫在***的表 (基礎表 driving table) 將被***處理,在 FROM 子句中包含多個表的情況下, 你必須選擇記錄條數最少的表作為基礎表。如果有 3 個以上的表連接查詢, 那就需要選擇交叉表 (intersection table) 作為基礎表, 交叉表是指那個被其他表所引用的表。
(2) WHERE 子句中的連接順序.:
ORACLE 采用自下而上的順序解析 WHERE 子句,根據這個原理,表之間的連接必須寫在其他 WHERE 條件之前,那些可以過濾掉***數量記錄的條件必須寫在 WHERE 子句的末尾。
(3) SELECT 子句中避免使用 ‘ * ‘:
ORACLE 在解析的過程中, 會將’*’ 依次轉換成所有的列名, 這個工作是通過查詢數據字典完成的,這意味著將耗費更多的時間。
(4) 減少訪問數據庫的次數:
ORACLE 在內部執行了許多工作: 解析 SQL 語句,估算索引的利用率,綁定變量,讀數據塊等;
(5) 在 SQL*Plus , SQL*Forms 和 Pro*C 中重新設置 ARRAYSIZE 參數,可以增加每次數據庫訪問的檢索數據量, 建議值為 200。
(6) 使用 DECODE 函數來減少處理時間:
使用 DECODE 函數可以避免重復掃描相同記錄或重復連接相同的表。
(7) 整合簡單, 無關聯的數據庫訪問:
如果你有幾個簡單的數據庫查詢語句, 你可以把它們整合到一個查詢中 (即使它們之間沒有關系)
(8) 刪除重復記錄:
***效的刪除重復記錄方法 (因為使用了 ROWID) 例子:
DELETE FROM EMP E WHERE E.ROWID > (SELECT MIN(X.ROWID)
FROM EMP X WHERE X.EMP_NO = E.EMP_NO);
(9) 用 TRUNCATE 替代 DELETE:
當刪除表中的記錄時,在通常情況下,回滾段 (rollback segments) 用來存放可以被恢復的信息。 如果你沒有 COMMIT 事務, ORACLE 會將數據恢復到刪除之前的狀態 (準確地說是恢復到執行刪除命令之前的狀況) 而當運用 TRUNCATE 時, 回滾段不再存放任何可被恢復的信息。 當命令運行后,數據不能被恢復。 因此很少的資源被調用,執行時間也會很短. (譯者按: TRUNCATE 只在刪除全表適用, TRUNCATE 是 DDL 不是 DML)
(10) 盡量多使用 COMMIT:
只要有可能,在程序中盡量多使用 COMMIT,這樣程序的性能得到提高,需求也會因為 COMMIT 所釋放的資源而減少:
COMMIT 所釋放的資源:
a. 回滾段上用于恢復數據的信息
b. 被程序語句獲得的鎖
c. redo log buffer 中的空間
d. ORACLE 為管理上述 3 種資源中的內部花費
(11) 用 Where 子句替換 HAVING 子句:
避免使用 HAVING 子句, HAVING 只會在檢索出所有記錄之后才對結果集進行過濾。這個處理需要排序,總計等操作。如果能通過 WHERE 子句限制記錄的數目,那就能減少這方面的開銷。(非 oracle 中)on、where、having 這三個都可以加條件的子句中,on 是***執行,where 次之,having ***,因為 on 是先把不符合條件的記錄過濾后才進行統計,它就可以減少中間運算要處理的數據,按理說應該速度是最快的,where 也應該比 having 快點的,因為它過濾數據后才進行 sum,在兩個表聯接時才用 on 的,所以在一個表的時候,就剩下 where 跟 having 比較了。在這單表查詢統計的情況下,如果要過濾的條件沒有涉及到要計算字段,那它們的結果是一樣的,只是 where 可以使用 rushmore 技術,而 having 就不能,在速度上后者要慢如果要涉及到計算的字段,就表示在沒計算之前,這個字段的值是不確定的,根據上篇寫的工作流程,where 的作用時間是在計算之前就完成的,而 having 就是在計算后才起作用的,所以在這種情況下,兩者的結果會不同。在多表聯接查詢時,on 比 where 更早起作用。系統首先根據各個表之間的聯接條件,把多個表合成一個臨時表后,再由 where 進行過濾,然后再計算,計算完后再由 having 進行過濾。由此可見,要想過濾條件起到正確的作用,首先要明白這個條件應該在什么時候起作用,然后再決定放在那里
(12) 減少對表的查詢:
在含有子查詢的 SQL 語句中, 要特別注意減少對表的查詢。 例子:
SELECT TAB_NAME FROM TABLES WHERE (TAB_NAME,DB_VER) = ( SELECT
TAB_NAME,DB_VER FROM TAB_COLUMNS WHERE VERSION = 604)
(13) 通過內部函數提高 SQL 效率.:
復雜的 SQL 往往犧牲了執行效率。 能夠掌握上面的運用函數解決問題的方法在實際工作中是非常有意義的
(14) 使用表的別名 (Alias):
當在 SQL 語句中連接多個表時, 請使用表的別名并把別名前綴于每個 Column 上。這樣一來, 就可以減少解析的時間并減少那些由 Column 歧義引起的語法錯誤。
(15) 用 EXISTS 替代 IN、用 NOT EXISTS 替代 NOT IN:
在許多基于基礎表的查詢中, 為了滿足一個條件,往往需要對另一個表進行聯接. 在這種情況下,使用 EXISTS(或 NOT EXISTS) 通常將提高查詢的效率。 在子查詢中,NOT IN 子句將執行一個內部的排序和合并。 無論在哪種情況下,NOT IN 都是***效的 (因為它對子查詢中的表執行了一個全表遍歷)。 為了避免使用 NOT IN,我們可以把它改寫成外連接 (Outer Joins) 或 NOT EXISTS.
例子:
(高效)SELECT * FROM EMP (基礎表) WHERE EMPNO > 0 AND EXISTS (SELECT ‘X’ FROM DEPT WHERE DEPT.DEPTNO = EMP.DEPTNO AND LOC = ‘MELB’)
(低效)SELECT * FROM EMP (基礎表) WHERE EMPNO > 0 AND DEPTNO IN(SELECT DEPTNO FROM DEPT WHERE LOC = ‘MELB’)
(16) 識別’低效執行’的 SQL 語句:
雖然目前各種關于 SQL 優化的圖形化工具層出不窮, 但是寫出自己的 SQL 工具來解決問題始終是一個***的方法:
SELECT EXECUTIONS , DISK_READS, BUFFER_GETS,
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio,
ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT
FROM V$SQLAREA
WHERE EXECUTIONS>0
AND BUFFER_GETS > 0
AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8
ORDER BY 4 DESC;
(17) 用索引提高效率:
索引是表的一個概念部分, 用來提高檢索數據的效率,ORACLE 使用了一個復雜的自平衡 B-tree 結構。 通常, 通過索引查詢數據比全表掃描要快。 當 ORACLE 找出執行查詢和 Update 語句的***路徑時, ORACLE 優化器將使用索引。 同樣在聯結多個表時使用索引也可以提高效率。 另一個使用索引的好處是,它提供了主鍵 (primary key) 的唯一性驗證。那些 LONG 或 LONG RAW 數據類型,你可以索引幾乎所有的列。通常, 在大型表中使用索引特別有效。 當然,你也會發現, 在掃描小表時,使用索引同樣能提高效率。 雖然使用索引能得到查詢效率的提高, 但是我們也必須注意到它的代價。 索引需要空間來存儲, 也需要定期維護,每當有記錄在表中增減或索引列被修改時, 索引本身也會被修改, 這意味著每條記錄的 INSERT , DELETE , UPDATE 將為此多付出 4 , 5 次的磁盤 I/O 。 因為索引需要額外的存儲空間和處理, 那些不必要的索引反而會使查詢反應時間變慢。定期的重構索引是有必要的:
ALTER INDEX REBUILD