MySQL索引 - 索引的类型

橙三吉。 提交于 2020-02-02 12:15:08
  • 索引的类型
    • B-Tree索引
      • B-Tree 索引 通常意味着所有的值都是按顺序存储的,并且每一个叶子页到根的距离相同。
      • B-Tree 索引 能够加快访问数据的速度,存储引擎不再需要进行全表扫描来获取需要的数据,取而代之的是从索引的根节点开始搜索
      • B-Tree 索引 适用于全键值、键值范围或键前缀查找(最左前缀原则)。
    • 哈希索引
      • 哈希索引 基于哈希表实现,只有精确匹配索引所有列的查询才有效。
      • 哈希索引 是Memory引擎表的默认索引类型,但Memory同时也支持B-Tree索引。
      • 哈希索引 自身只需存储对应的哈希值和行指针,而不存储字段值,所以索引的结构十分紧凑,这也让哈希索引查找的速度非常快。
      • 哈希索引 数据并不是按照索引值顺序存储的,所以无法用于排序
      • 哈希索引 不支持部分索引列匹配查找,因为哈希索引始终是使用索引列的全部内容来计算哈希值的。例如数据列(A,B)上建立索引,如果查询只有数据列A,则无法使用该索引。
      • 哈希索引 不支持任何范围查询,如WHERE score > 60。
      • 哈希索引 只支持等值比较查询,包括=、IN()、<=>(注意<>和<=>是不同的操作)。
      • 介绍一个使用场景:如需要存储大量的URL,并需要根据URL进行搜索查找。如果使用B-Tree来存储URL,存储的内容就会非常大,因为URL本身很长。
        • 创建表
          1 mysql> CREATE TABLE TB3 (
          2     -> id INT UNSIGNED NOT NULL AUTO_INCREMENT,
          3     -> url VARCHAR(255) NOT NULL,
          4     -> url_crc INT UNSIGNED NOT NULL DEFAULT 0,
          5     -> PRIMARY KEY(id),6     -> KEY IDX(url_crc)
          7     -> );
        • 创建触发器
          mysql> DELIMITER //
          mysql> CREATE TRIGGER TB3_CRC_INS BEFORE INSERT ON TB3 FOR EACH ROW BEGIN SET NEW.url_crc=CRC32(NEW.url);
              -> END;
              -> //
          mysql> CREATE TRIGGER TB3_CRC_UPD BEFORE UPDATE ON TB3 FOR EACH ROW BEGIN SET NEW.url_crc=CRC32(NEW.url);
              -> END;
              -> //
          mysql> DELIMITER ;
        • 插入或更新数据
        •  1 mysql> INSERT INTO TB3(url) VALUES('http://www.mysql.com');
           2 mysql> SELECT * FROM TB3;
           3 +----+----------------------+------------+
           4 | id | url                  | url_crc    |
           5 +----+----------------------+------------+
           6 |  1 | http://www.mysql.com | 1560514994 |
           7 +----+----------------------+------------+
           8 
           9 mysql> UPDATE TB3 SET url="https://www.mysql.com" WHERE id=1;
          10 mysql> SELECT * FROM TB3;
          11 +----+-----------------------+------------+
          12 | id | url                   | url_crc    |
          13 +----+-----------------------+------------+
          14 |  1 | https://www.mysql.com | 1053537447 |
          15 +----+-----------------------+------------+
          查询(可以看出ref: const,已经是最好的级别了),有同学问为什么在WHERE条件中不直接使用一个url_crc作为筛选条件,因为一旦出现哈希冲突,另一个字符串的哈希值也恰好一样的时候,只是用url_crc来来查询是无法工作的,所以要避免冲突问题,必须在WHERE中带入哈希值和对应的列值。
           1 mysql> EXPLAIN SELECT * FROM TB3 WHERE url_crc=CRC32('https://www.mysql.com') AND url="https://www.mysql.com"\G
           2 *************************** 1. row ***************************
           3            id: 1
           4   select_type: SIMPLE
           5         table: TB3
           6    partitions: NULL
           7          type: ref
           8 possible_keys: IDX
           9           key: IDX
          10       key_len: 4
          11           ref: const
          12          rows: 1
          13      filtered: 100.00
          14         Extra: Using where

          PS:如果采用这种方式,不要使用SHA1()和MD5()作为哈希函数,因为这两个函数计算出来的哈希值是非常长的字符串,会浪费大量空间,比较时也会更慢。 但如果数据表非常大,CRC32会出现大量的哈希冲突,可以自己实现一个简单的64位哈希函数,如SELECT CONV(RIGHT(MD5("https://www.mysql.com"), 16), 16, 10) AS HASH64;

    • 空间数据索引
      •  MyISAM表支持空间索引,可以用作地理数据存储。
      •  MySQL的GIS支持并不完善,所以大部分人都不会使用该特性。
      •  空间索引会从所有维度来索引数据,和B-Tree不同,这类索引无须前缀查询
      •  必须使用MySQL的GIS相关函数如MBRCONTAINS()等来维护数据。
    • 全文索引
      •  全文索引是一种特殊类型的索引,它查找的是文本中的关键词,而不是直接比较索引中的值。
      •  全文索引使用与MATCH AGAINST操作,而不是普通的WHERE条件操作。
    • 其他索引
      •  TokuDB 使用分形树索引,既有B-Tree的很多优点,又避免了B-Tree的一些缺点。
      •  ScaleDB 使用Patricia tries。
      •  InfiniDB 和 Infobright 使用了一些特殊的数据结构来优化某些特殊的查询。

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!