MySQL,Join语句的优化

Anonymity | | 访问(162)

  1. 尽可能减少Join语句中Nested Loop的循环总次数

  如何减少Nested Loop的循环总次数?最有效的办法是让驱动表的结果集尽可能地小,“永远用小结果集驱动大结果集”。

  因为驱动结果集越大,意味着需要循环的次数越多,也就是说在被驱动结果集上所需要执行的查询检索次数会越多。比如,当两个表(表A和表B)Join时,如果表A通过WHERE条件过滤后有10条记录,而表B有20条记录。如果选择表A作为驱动表,也就是被驱动表的结果集为20,那么我们通过Join条件对被驱动表(表B)的比较过滤就会进行10次。反之,如果选择表B作为驱动表,则须要进行20次对表A的比较过滤。

  当然,此优化的前提条件是通过Join条件每次对各个表进行访问的资源消耗差别不是太大。如果资源消耗存在较大的差别(一般都是因为索引的区别),就不能简单地通过结果集的大小来判断Join语句的驱动顺序,而是要通过比较循环次数和每次循环所须消耗之乘积大小来确定优化方案了。

  2. 优先优化Nested Loop的内层循环

  不仅在数据库的Join中应该这样做,实际上在优化程序语言时也有类似的优化原则。内层循环是循环中执行次数最多的,每次循环节约很少的资源,就能在整个循环中节约很多的资源。

  3. 保证Join语句中被驱动表的Join条件字段已经被索引

  其目的正是基于上面两点的考虑,只有让被驱动表的Join条件字段被索引了,才能保证循环中每次查询都能够消耗较少的资源,这也正是内层循环的实际优化方法。

  4. 当无法保证被驱动表的Join条件字段被索引且内存资源充足时,不要太吝惜Join Buffer的设置

  在Join是All、Index、range或index_merge类型的特殊情况下,Join Buffer才能派上用场。在这种情况下,Join Buffer的大小将对整个Join语句的消耗起到非常关键的作用。