记一次神奇的sql查询经历,group by慢查询优化(已解决)
一、问题背景 现网出现慢查询,在500万数量级的情况下,单表查询速度在30多秒,需要对sql进行优化,sql如下: 我在测试环境构造了500万条数据,模拟了这个慢查询。 简单来说,就是查询一定条件下,都有哪些用户的。很简单的sql,可以看到,查询耗时为37秒。 说一下app_account字段的分布情况,随机生成了5000个不同的随机数,然后分布到了这500万条数据里,平均来说,每个app_account都会有1000个是重复的值,种类共有5000个。 二、看执行计划 可以看到,group by字段上我是加了索引的,也用到了。 三、优化 说实话,我是不知道该怎么优化的,这玩意还能怎么优化啊!先说下,下面的思路都是没用的。 思路一: 后面应该加上 order by null;避免无用排序,但其实对结果耗时影响不大,还是很慢。 思路二: where条件太复杂,没索引,导致查询慢,但我给where条件的所有字段加上了组合索引,也还是没用 思路三: 既然group by慢,换distinct试试??(这里就是本篇博客里说的神奇的地方了) 卧槽???!!!这是什么情况,瞬间这么快了??!!! 虽然知道group by和distinct有很小的性能差距,但是真没想到,差距居然这么大!!!大发现啊!! 四、你以为这就结束了吗 我是真的希望就这么结束了,那这个问题就很简单的解决了