MySQL 大表的count()優(yōu)化實現(xiàn)
以下是基于我結(jié)合B+樹的數(shù)據(jù)結(jié)構(gòu)和對實驗結(jié)果的推測作出的判斷,如有錯誤,懇請指正!
今天實驗了一下MySQL的count()操作優(yōu)化, 以下討論基于mysql5.7 InnoDB存儲引擎. x86 windows操作系統(tǒng)。
創(chuàng)建的表的結(jié)構(gòu)如下(數(shù)據(jù)量為100萬):
首先是關(guān)于mysql的count(*),count(PK), count(1)哪個快的問題。 實現(xiàn)結(jié)果如下:
并沒有什么區(qū)別!加上了WHERE子句之后3個查詢的時間也是相同的,我就不貼圖片了。
之前在公司的時候就寫過一個select count(*) from table的SQL語句,在數(shù)據(jù)多的時候非常慢。所以要怎么優(yōu)化呢?
這要從InnoDB的索引說起, InnoDB的索引是B+Tree。
對主鍵索引來說:它只有在葉子節(jié)點上存儲數(shù)據(jù),它的key是主鍵,并且value為整條數(shù)據(jù)。 對輔助索引來說:key為建索引的列,value為主鍵。
這給我們兩個信息: 1. 根據(jù)主鍵會查到整條數(shù)據(jù) 2. 根據(jù)輔助索引只能查到主鍵,然后必須通過主鍵再查到剩余信息。
所以如果要優(yōu)化count(*)操作的話,我們需要找一個短小的列,為它建立輔助索引。 在我的例子中就是status,雖然它的”severelity”幾乎為0.
先建立索引:ALTER TABLE test1 ADD INDEX (status); 然后查詢,如下圖:
可以看到,查詢時間從3.35s下降到了0.26s,查詢速度提升近13倍。
如果索引是str這一列,結(jié)果又會是怎么樣呢? 先建立索引: alter table test1 add index (str) 結(jié)果如下:
可以看到,時間為0.422s,也很快,但是比起status這列還是有著1.5倍左右的差距。
再大膽一點做個實驗,我把status這列的索引刪掉,建立一個status和left(omdb,200)(這一列平均1000個字符)的聯(lián)合索引,然后看查詢時間。 建立索引: alter table test1 add index (status,omdb(200)) 結(jié)果如下:
時間為1.172s
alter table test1 add index (status,imdbid);
補充!! 要注意索引失效的情況! 建立了索引后正常的的樣子:
可以看到key_len為6, Extra的說明是using index.
而如果索引失效的話:
索引失效有很多種情況,比如使用函數(shù),!=操作等,具體請參考官方文檔。
對MySQL沒有很深的研究,以上是基于我結(jié)合B+樹的數(shù)據(jù)結(jié)構(gòu)和對實驗結(jié)果的推測作出的判斷,如有錯誤,懇請指正!
到此這篇關(guān)于MySQL 大表的count()優(yōu)化實現(xiàn)的文章就介紹到這了,更多相關(guān)MySQL 大表count()優(yōu)化內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. mybatis 連接mysql數(shù)據(jù)庫 tinyint 為boolean類型詳解2. Oracle數(shù)據(jù)庫不完全恢復(fù)實例3. Oracle數(shù)據(jù)庫備份與恢復(fù)精華資料集錦4. Oracle冷備份的不完全恢復(fù)5. 怎樣才能保護好SQL Server 數(shù)據(jù)庫6. Sql Server 壓縮數(shù)據(jù)庫日志文件的方法7. MySQL case when使用方法實例解析8. 如何在Windows 2000下將Oracle完全卸載9. MySQL索引背后的數(shù)據(jù)結(jié)構(gòu)及算法原理10. MySQL 性能、監(jiān)控與災(zāi)難恢復(fù)
