用户名:
密 码: 记住
您当前的位置:首页 > 网络编程 > mysql教程

MySQL高效分页,子查询分页实例

时间:2015-01-23  来源:西部数据  作者:西部数据

mysql分页多半是使用limit s,e这种进行查询数据了,这种办法也是一种不错的mysql分页办法,但是如果你要在千万级的数据量前和它,就要撑握技巧了哈.

一般MYSQL最基本的分页方式,代码如下:

select * from content order by id desc limit 0, 10

在中小数据量的情况下,这样的SQL足够用了,唯一需要注意的问题就是确保使用了索引,随着数据量的增加,页数会越来越多,查看后几页的SQL就可能类似,代码如下:

select * from content order by id desc limit 10000, 10

一言以蔽之,就是越往后分页,LIMIT语句的偏移量就会越大,速度也会明显变慢.

首先看一下分页的基本原理,代码如下:

  1. mysql> explain SELECT * FROM message ORDER BY id DESC LIMIT 10000, 20G 
  2. ***************** 1. row ************** 
  3. id: 1 
  4. select_type: SIMPLE 
  5. table: message 
  6. type: index 
  7. possible_keys: NULL 
  8. keyPRIMARY 
  9. key_len: 4 
  10. ref: NULL 
  11. rows: 10020 
  12. Extra: 
  13. 1 row in set (0.00 sec) 

limit 10000,20的意思扫描满足条件的10020行,扔掉前面的10000行,返回最后的20行,问题就在这里,如果是limit 100000,100,需要扫描100100行,在一个高并发的应用里,每次查询需要扫描超过10W行,性能肯定大打折扣。文中还提到limit n性能是没问题的,因为只扫描n行。

文中提到一种”clue”的做法,给翻页提供一些”线索”,比如还是SELECT * FROM message ORDER BY id DESC,按id降序分页,每页20条,当前是第10页,当前页条目id最大的是9527,最小的是9500,如果我们只提供”上一页”、”下一页”这样的跳转(不提供到第N页的跳转),那么在处理”上一页”的时候SQL语句可以是,代码如下:

SELECT * FROM message WHERE id > 9527 ORDER BY id ASC LIMIT 20;

处理”下一页”的时候SQL语句可以是:

SELECT * FROM message WHERE id < 9500 ORDER BY id DESC LIMIT 20;

不管翻多少页,每次查询只扫描20行.

缺点是只能提供”上一页”、”下一页”的链接形式,但是我们的产品经理非常喜欢”<上一页 1 2 3 4 5 6 7 8 9 下一页>”这样的链接方式,怎么办呢?

如果LIMIT m,n不可避免的话,要优化效率,只有尽可能的让m小一下,我们扩展前面的”clue”做法,还是SELECT * FROM message ORDER BY id DESC,按id降序分页,每页20条,当前是第10页,当前页条目id最大的是9527,最小的是9500,比如要跳到第8页,我看的SQL语句可以这样写:

SELECT * FROM message WHERE id > 9527 ORDER BY id ASC LIMIT 20,20;

跳转到第13页:

SELECT * FROM message WHERE id < 9500 ORDER BY id DESC LIMIT 40,20;

原理还是一样,记录住当前页id的最大值和最小值,计算跳转页面和当前页相对偏移,由于页面相近,这个偏移量不会很大,这样的话,值相对较小,大大减少扫描的行数,其实传统的limit m,n,相对的偏移一直是第一页,这样的话越翻到后面,效率越差,而上面给出的方法就没有这样的问题.

注意SQL语句里面的ASC和DESC,如果是ASC取出来的结果,显示的时候记得倒置一下。

此时,我们可以通过2种方式:

一,子查询的分页方式来提高分页效率,飘易用的SQL语句如下:

  1. SELECT * FROM `content` WHERE id <=  
  2. (SELECT id FROM `content` ORDER BY id desc LIMIT ".($page-1)*$pagesize.", 1) ORDER BY id desc LIMIT $pagesize 

为什么会这样呢?因为子查询是在索引上完成的,而普通的查询时在数据文件上完成的,通常来说,索引文件要比数据文件小得多,所以操作起来也会更有效率,(via)通过explain SQL语句发现,子查询使用了索引,代码如下:

  1. id select_type table type possible_keys key key_len ref rows Extra 
  2. PRIMARY content range PRIMARY PRIMARY 4 NULL 6264 Using where 
  3. 2 SUBQUERY content index NULL PRIMARY 4 NULL 27085 Using index 

经过飘易的实测,使用子查询的分页方式的效率比纯LIMIT提高了14-20倍.

二,JOIN分页方式,代码如下:

  1. SELECT * FROM `content` AS t1  
  2. JOIN (SELECT id FROM `content` ORDER BY id desc LIMIT ".($page-1)*$pagesize.", 1) AS t2  //phpfensi.com
  3. WHERE t1.id <= t2.id ORDER BY t1.id desc LIMIT $pagesize;  

经过我的测试,join分页和子查询分页的效率基本在一个等级上,消耗的时间也基本一致,explain SQL语句,代码如下:

  1. id select_type table type possible_keys key key_len ref rows Extra 
  2. PRIMARY <derived2> system NULL NULL NULL NULL 1   
  3. PRIMARY t1 range PRIMARY PRIMARY 4 NULL 6264 Using where 
  4. 2 DERIVED content index NULL PRIMARY 4 NULL 27085 Using index 
来顶一下
返回首页
返回首页
推荐资讯
WiFi太不安全:7岁女孩11分钟内入侵公共网络 WiFi太不安全:7岁女孩11分钟内入侵近期刚刚发布研究说WiFi网络能获得人们手机里多少私人信息,
不服跑个分?人工智能也出现“刷分”乱象 不服跑个分?人工智能也出现“刷分2014年,人工智能领域突然爆发,成为了科研和科技创业的热门
相关文章
栏目更新
栏目热门