刚给一个朋友解决他写的Discuz!插件的问题,说到MySQL的COUNT(*)的效率,发现越说越说不清楚,干脆写下来,分享给大家.
COUNT(*)与COUNT(COL),网上搜索了下,发现各种说法都有.
比如认为COUNT(COL)比COUNT(*)快的,认为COUNT(*)比COUNT(COL)快的,还有朋友很搞笑的说到这个其实是看人品的.
在不加WHERE限制条件的情况下,COUNT(*)与COUNT(COL)基本可以认为是等价的,但是在有WHERE限制条件的情况下,COUNT(*)会比COUNT(COL)快非常多.
具体的数据参考如下:
- mysql> SELECT COUNT(*) FROM cdb_posts where fid = 604;
- +
- | COUNT(fid) |
- +
- | 79000 |
- +
- 1 row in set (0.03 sec)
-
- mysql> SELECT COUNT(tid) FROM cdb_posts where fid = 604;
- +
- | COUNT(tid) |
- +
- | 79000 |
- +
- 1 row in set (0.33 sec)
-
- mysql> SELECT COUNT(pid) FROM cdb_posts where fid = 604;
- +
- | COUNT(pid) |
- +
- | 79000 |
- +
- 1 row in set (0.33 sec)
COUNT(*)通常是对主键进行索引扫描,而COUNT(COL)就不一定了,另外前者是统计表中的所有符合的纪录总数,而后者是计算表中所有符合的COL的纪录数。还有有区别的。
COUNT时的WHERE解决办法
顺便提下mysql的DISTINCT的关键字有很多你想不到的用处
1.在count 不重复的记录的时候能用到,代码如下:
SELECT COUNT( DISTINCT id ) FROM tablename;
就是计算talbebname表中id不同的记录有多少条.
2,在需要返回记录不同的id的具体值的时候可以用,代码如下:
SELECT DISTINCT id FROM tablename;
返回talbebname表中不同的id的具体的值.
3.上面的情况2对于需要返回mysql表中2列以上的结果时会有歧义,代码如下:
SELECT DISTINCT id, type FROM tablename;
实际上返回的是 id与type同时不相同的结果,也就是DISTINCT同时作用了两个字段,必须得id与tyoe都相同的才被排除了,与我们期望的结果不一样.
简单说下,就是COUNT的时候,如果没有WHERE限制的话,MySQL直接返回保存有总的行数,而在有WHERE限制的情况下,总是需要对MySQL进行全表遍历.
优化总结,对于MyISAM表来说:
1.任何情况下SELECT COUNT(*) FROM tablename是最优选择;
2.尽量减少SELECT COUNT(*) FROM tablename WHERE COL = 'value' 这种查询;
3.杜绝SELECT COUNT(COL) FROM tablename WHERE COL2 = 'value' 的出现。 |