Mysql數(shù)據(jù)庫大表優(yōu)化方案和Mysql大表優(yōu)化步驟

2019-03-07 14:41:49 來源：互聯(lián)網(wǎng)作者：佚名人氣：次閱讀 918 條評論

當(dāng)MySQL單表記錄數(shù)過大時，增刪改查性能都會急劇下降，可以參考以下步驟來優(yōu)化。單表優(yōu)化　　除非單表數(shù)據(jù)未來會一直不斷上漲，否則不要一開始就考慮拆分，拆分會帶來邏輯、部...

當(dāng)MySQL單表記錄數(shù)過大時，增刪改查性能都會急劇下降，可以參考以下步驟來優(yōu)化。

單表優(yōu)化

除非單表數(shù)據(jù)未來會一直不斷上漲，否則不要一開始就考慮拆分，拆分會帶來邏輯、部署、運(yùn)維的各種復(fù)雜度，一般以整型值為主的表在 千萬級以下，字符串為主的表在 五百萬以下是沒有太大問題的。而事實(shí)上很多時候MySQL單表的性能依然有不少優(yōu)化空間，甚至能正常支撐千萬級以上的數(shù)據(jù)量。

字段

盡量使用 TINYINT、 SMALLINT、 MEDIUM_INT作為整數(shù)類型而非 INT，如果非負(fù)則加上 UNSIGNED
VARCHAR的長度只分配真正需要的空間
使用枚舉或整數(shù)代替字符串類型
盡量使用 TIMESTAMP而非 DATETIME
單表不要有太多字段，建議在20以內(nèi)
避免使用NULL字段，很難查詢優(yōu)化且占用額外索引空間
用整型來存IP

索引

索引并不是越多越好，要根據(jù)查詢有針對性的創(chuàng)建，考慮在 WHERE和 ORDER BY命令上涉及的列建立索引，可根據(jù) EXPLAIN來查看是否用了索引還是全表掃描
應(yīng)盡量避免在 WHERE子句中對字段進(jìn)行 NULL值判斷，否則將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描
值分布很稀少的字段不適合建索引，例如"性別"這種只有兩三個值的字段
字符字段只建前綴索引
字符字段最好不要做主鍵
不用外鍵，由程序保證約束
盡量不用 UNIQUE，由程序保證約束
使用多列索引時主意順序和查詢條件保持一致，同時刪除不必要的單列索引

查詢SQL

可通過開啟慢查詢?nèi)罩緛碚页鲚^慢的SQL
不做列運(yùn)算： SELECT id WHERE age+1=10，任何對列的操作都將導(dǎo)致表掃描，它包括數(shù)據(jù)庫教程函數(shù)、計算表達(dá)式等等，查詢時要盡可能將操作移至等號右邊
sql語句盡可能簡單：一條sql只能在一個CPU運(yùn)算；大語句拆小語句，減少鎖時間；一條大sql可以堵死整個庫
不用 SELECT*
OR改寫成 IN： OR的效率是n級別， IN的效率是log(n)級別，in的個數(shù)建議控制在200以內(nèi)
不用函數(shù)和觸發(fā)器，在應(yīng)用程序?qū)崿F(xiàn)
避免 %xxx式查詢
少用 JOIN
使用同類型進(jìn)行比較，比如用 '123'和 '123'比， 123和 123比
盡量避免在 WHERE子句中使用!=或<>操作符，否則將引擎放棄使用索引而進(jìn)行全表掃描
對于連續(xù)數(shù)值，使用 BETWEEN不用 IN： SELECT id FROM t WHERE num BETWEEN1AND5
列表數(shù)據(jù)不要拿全表，要使用 LIMIT來分頁，每頁數(shù)量也不要太大

引擎

目前廣泛使用的是MyISAM和InnoDB兩種引擎：

MyISAM

MyISAM引擎是MySQL 5.1及之前版本的默認(rèn)引擎，它的特點(diǎn)是：

不支持行鎖，讀取時對需要讀到的所有表加鎖，寫入時則對表加排它鎖
不支持事務(wù)
不支持外鍵
不支持崩潰后的安全恢復(fù)
在表有讀取查詢的同時，支持往表中插入新紀(jì)錄
支持 BLOB和 TEXT的前500個字符索引，支持全文索引
支持延遲更新索引，極大提升寫入性能
對于不會進(jìn)行修改的表，支持壓縮表，極大減少磁盤空間占用

InnoDB

InnoDB在MySQL 5.5后成為默認(rèn)索引，它的特點(diǎn)是：

支持行鎖，采用MVCC來支持高并發(fā)
支持事務(wù)
支持外鍵
支持崩潰后的安全恢復(fù)
不支持全文索引

總體來講，MyISAM適合 SELECT密集型的表，而InnoDB適合 INSERT和 UPDATE密集型的表

系統(tǒng)調(diào)優(yōu)參數(shù)

可以使用下面幾個工具來做基準(zhǔn)測試：

sysbench：一個模塊化，跨平臺以及多線程的性能測試工具
iibench-mysql：基于 Java 的 MySQL/Percona/MariaDB 索引進(jìn)行插入性能測試工具
tpcc-mysql：Percona開發(fā)的TPC-C測試工具

具體的調(diào)優(yōu)參數(shù)內(nèi)容較多，具體可參考官方文檔，這里介紹一些比較重要的參數(shù)：

backlog：backlog值指出在MySQL暫時停止回答新請求之前的短時間內(nèi)多少個請求可以被存在堆棧中。也就是說，如果MySql的連接數(shù)據(jù)達(dá)到maxconnections時，新來的請求將會被存在堆棧中，以等待某一連接釋放資源，該堆棧的數(shù)量即backlog，如果等待連接的數(shù)量超過back_log，將不被授予連接資源。可以從默認(rèn)的50升至500
wait_timeout：數(shù)據(jù)庫連接閑置時間，閑置連接會占用內(nèi)存資源。可以從默認(rèn)的8小時減到半小時
maxuserconnection: 最大連接數(shù)，默認(rèn)為0無上限，最好設(shè)一個合理上限
thread_concurrency：并發(fā)線程數(shù)，設(shè)為CPU核數(shù)的兩倍
skipnameresolve：禁止對外部連接進(jìn)行DNS解析，消除DNS解析時間，但需要所有遠(yuǎn)程主機(jī)用IP訪問
keybuffersize：索引塊的緩存大小，增加會提升索引處理速度，對MyISAM表性能影響最大。對于內(nèi)存4G左右，可設(shè)為256M或384M，通過查詢 show status like'key_read%'，保證 key_reads/key_read_requests在0.1%以下最好
innodbbufferpool_size：緩存數(shù)據(jù)塊和索引塊，對InnoDB表性能影響最大。通過查詢 show status like'Innodb_buffer_pool_read%'，保證 (Innodb_buffer_pool_read_requests–Innodb_buffer_pool_reads)/Innodb_buffer_pool_read_requests越高越好
innodbadditionalmempoolsize：InnoDB存儲引擎用來存放數(shù)據(jù)字典信息以及一些內(nèi)部數(shù)據(jù)結(jié)構(gòu)的內(nèi)存空間大小，當(dāng)數(shù)據(jù)庫對象非常多的時候，適當(dāng)調(diào)整該參數(shù)的大小以確保所有數(shù)據(jù)都能存放在內(nèi)存中提高訪問效率，當(dāng)過小的時候，MySQL會記錄Warning信息到數(shù)據(jù)庫的錯誤日志中，這時就需要該調(diào)整這個參數(shù)大小
innodblogbuffer_size：InnoDB存儲引擎的事務(wù)日志所使用的緩沖區(qū)，一般來說不建議超過32MB
querycachesize：緩存MySQL中的ResultSet，也就是一條SQL語句執(zhí)行的結(jié)果集，所以僅僅只能針對select語句。當(dāng)某個表的數(shù)據(jù)有任何任何變化，都會導(dǎo)致所有引用了該表的select語句在Query Cache中的緩存數(shù)據(jù)失效。所以，當(dāng)我們的數(shù)據(jù)變化非常頻繁的情況下，使用Query Cache可能會得不償失。根據(jù)命中率 (Qcache_hits/(Qcache_hits+Qcache_inserts)*100))進(jìn)行調(diào)整，一般不建議太大，256MB可能已經(jīng)差不多了，大型的配置型靜態(tài)數(shù)據(jù)可適當(dāng)調(diào)大. 可以通過命令 show status like'Qcache_%'查看目前系統(tǒng)Query catch使用大小
readbuffersize：MySql讀入緩沖區(qū)大小。對表進(jìn)行順序掃描的請求將分配一個讀入緩沖區(qū)，MySql會為它分配一段內(nèi)存緩沖區(qū)。如果對表的順序掃描請求非常頻繁，可以通過增加該變量值以及內(nèi)存緩沖區(qū)大小提高其性能
sortbuffersize：MySql執(zhí)行排序使用的緩沖大小。如果想要增加 ORDER BY的速度，首先看是否可以讓MySQL使用索引而不是額外的排序階段。如果不能，可以嘗試增加sortbuffersize變量的大小
readrndbuffer_size：MySql的隨機(jī)讀緩沖區(qū)大小。當(dāng)按任意順序讀取行時(例如，按照排序順序)，將分配一個隨機(jī)讀緩存區(qū)。進(jìn)行排序查詢時，MySql會首先掃描一遍該緩沖，以避免磁盤搜索，提高查詢速度，如果需要排序大量數(shù)據(jù)，可適當(dāng)調(diào)高該值。但MySql會為每個客戶連接發(fā)放該緩沖空間，所以應(yīng)盡量適當(dāng)設(shè)置該值，以避免內(nèi)存開銷過大。
record_buffer：每個進(jìn)行一個順序掃描的線程為其掃描的每張表分配這個大小的一個緩沖區(qū)。如果你做很多順序掃描，可能想要增加該值
threadcachesize：保存當(dāng)前沒有與連接關(guān)聯(lián)但是準(zhǔn)備為后面新的連接服務(wù)的線程，可以快速響應(yīng)連接的線程請求而無需創(chuàng)建新的
tablecache：類似于threadcache_size，但用來緩存表文件，對InnoDB效果不大，主要用于MyISAM

升級硬件

Scale up，這個不多說了，根據(jù)MySQL是CPU密集型還是I/O密集型，通過提升CPU和內(nèi)存、使用SSD，都能顯著提升MySQL性能

讀寫分離

也是目前常用的優(yōu)化，從庫讀主庫寫，一般不要采用雙主或多主引入很多復(fù)雜性，盡量采用文中的其他方案來提高性能。同時目前很多拆分的解決方案同時也兼顧考慮了讀寫分離

緩存

緩存可以發(fā)生在這些層次：

MySQL內(nèi)部：在系統(tǒng)調(diào)優(yōu)參數(shù)介紹了相關(guān)設(shè)置
數(shù)據(jù)訪問層：比如MyBatis針對SQL語句做緩存，而Hibernate可以精確到單個記錄，這里緩存的對象主要是持久化對象 PersistenceObject
應(yīng)用服務(wù)層：這里可以通過編程手段對緩存做到更精準(zhǔn)的控制和更多的實(shí)現(xiàn)策略，這里緩存的對象是數(shù)據(jù)傳輸對象 DataTransferObject
Web層：針對web頁面做緩存
瀏覽器客戶端：用戶端的緩存

可以根據(jù)實(shí)際情況在一個層次或多個層次結(jié)合加入緩存。這里重點(diǎn)介紹下服務(wù)層的緩存實(shí)現(xiàn)，目前主要有兩種方式：

直寫式（Write Through）：在數(shù)據(jù)寫入數(shù)據(jù)庫后，同時更新緩存，維持?jǐn)?shù)據(jù)庫與緩存的一致性。這也是當(dāng)前大多數(shù)應(yīng)用緩存框架如Spring Cache的工作方式。這種實(shí)現(xiàn)非常簡單，同步好，但效率一般。
回寫式（Write Back）：當(dāng)有數(shù)據(jù)要寫入數(shù)據(jù)庫時，只會更新緩存，然后異步批量的將緩存數(shù)據(jù)同步到數(shù)據(jù)庫上。這種實(shí)現(xiàn)比較復(fù)雜，需要較多的應(yīng)用邏輯，同時可能會產(chǎn)生數(shù)據(jù)庫與緩存的不同步，但效率非常高。