【索引】索引的作用？为什么能够提高查询速度？以及索引用法（索引的原理）...

阅读量：7202 次

发布时间：2019-06-29

本文共 5093 字，大约阅读时间需要 16 分钟。

MySQL索引的建立对于MySQL的高效运行是很重要的，索引可以大大提高MySQL的检索速度。打个比方，如果合理的设计且使用索引的MySQL是一辆兰博基尼的话，那么没有设计和使用索引的MySQL就是一个人力三轮车。索引分单列索引和组合索引。单列索引，即一个索引只包含单个列，一个表可以有多个单列索引，但这不是组合索引。组合索引，即一个索引包含多个列。创建索引时，你需要确保该索引是应用在 SQL 查询语句的条件(一般作为 WHERE 子句的条件)。实际上，索引也是一张表，该表保存了主键与索引字段，并指向实体表的记录。上面都在说使用索引的好处，但过多的使用索引将会造成滥用。因此索引也会有它的缺点：虽然索引大大提高了查询速度，同时却会降低更新表的速度，如对表进行INSERT、UPDATE和DELETE。因为更新表时，MySQL不仅要保存数据，还要保存一下索引文件。建立索引会占用磁盘空间的索引文件。

为什么能够提高查询速度？

索引就是通过事先排好序，从而在查找时可以应用二分查找等高效率的算法。

一般的顺序查找，复杂度为O(n)，而二分查找复杂度为O(log2n)。当n很大时，二者的效率相差及其悬殊。

举个例子：

表中有一百万条数据，需要在其中寻找一条特定id的数据。如果顺序查找，平均需要查找50万条数据。而用二分法，至多不超过20次就能找到。二者的效率差了2.5万倍！

在一个或者一些字段需要频繁用作查询条件，并且表数据较多的时候，创建索引会明显提高查询速度，因为可由全表扫描改成索引扫描。

（无索引时全表扫描也就是要逐条扫描全部记录，直到找完符合条件的，索引扫描可以直接定位）

不管数据表有无索引，首先在SGA的中查找所需要的数据，如果中没有需要的数据时，服务器进程才去读磁盘。

1、无索引，直接去读表数据存放的磁盘块，读到中再查找需要的数据。

2、有索引，先读入索引表，通过索引表直接找到所需数据的物理地址，并把数据读入数据缓冲区中。

索引有什么副作用吗？

（1）索引是有大量数据的时候才建立的，没有大量数据反而会浪费时间，因为索引是使用二叉树建立.

（2）当一个系统查询比较频繁，而新建，修改等操作比较少时，可以创建索引，这样查询的速度会比以前快很多，同时也带来弊端，就是新建或修改等操作时，比没有索引或没有建立覆盖索引时的要慢。

（3）索引并不是越多越好，太多索引会占用很多的索引表空间，甚至比存储一条记录更多。

对于需要频繁新增记录的表，最好不要创建索引，没有索引的表，执行insert、append都很快，有了索引以后，会多一个维护索引的操作，一些大表可能导致insert 速度非常慢。

例子:

建立索引:(在username列建立索引)

ALTER table tableName ADD INDEX indexName(username)

利用explain分析索引: 参考：

1.没有查询username(不用索引)

EXPLAIN SELECT * FROM USER

2.根据username进行比对:(使用索引)

EXPLAIN SELECT * FROM USER WHERE username='qlq'

索引用法:

普通索引创建索引这是最基本的索引，它没有任何限制。它有以下几种创建方式：CREATE INDEX indexName ON mytable(username(length)); 　　　　如果是CHAR，VARCHAR类型，length可以小于字段实际长度；如果是BLOB和TEXT类型，必须指定 length。修改表结构(添加索引)　　　　ALTER table tableName ADD INDEX indexName(columnName)创建表的时候直接指定CREATE TABLE mytable(   ID INT NOT NULL,    username VARCHAR(16) NOT NULL,   INDEX [indexName] (username(length))   );  删除索引的语法DROP INDEX [indexName] ON mytable; ALTER TABLE `exam5`.`questions` DROP KEY `question_type_index`;唯一索引它与前面的普通索引类似，不同的就是：索引列的值必须唯一，但允许有空值。如果是组合索引，则列值的组合必须唯一。它有以下几种创建方式：创建索引CREATE UNIQUE INDEX indexName ON mytable(username(length)) 修改表结构ALTER table mytable ADD UNIQUE [indexName] (username(length))创建表的时候直接指定CREATE TABLE mytable(   ID INT NOT NULL,    username VARCHAR(16) NOT NULL,   UNIQUE [indexName] (username(length))   );  使用ALTER 命令添加和删除索引有四种方式来添加数据表的索引：    ALTER TABLE tbl_name ADD PRIMARY KEY (column_list): 该语句添加一个主键，这意味着索引值必须是唯一的，且不能为NULL。    ALTER TABLE tbl_name ADD UNIQUE index_name (column_list): 这条语句创建索引的值必须是唯一的（除了NULL外，NULL可能会出现多次）。    ALTER TABLE tbl_name ADD INDEX index_name (column_list): 添加普通索引，索引值可出现多次。    ALTER TABLE tbl_name ADD FULLTEXT index_name (column_list):该语句指定了索引为 FULLTEXT ，用于全文索引。以下实例为在表中添加索引。mysql> ALTER TABLE testalter_tbl ADD INDEX (c);你还可以在 ALTER 命令中使用 DROP 子句来删除索引。尝试以下实例删除索引:mysql> ALTER TABLE testalter_tbl DROP INDEX c;使用 ALTER 命令添加和删除主键主键只能作用于一个列上，添加主键索引时，你需要确保该主键默认不为空（NOT NULL）。实例如下：mysql> ALTER TABLE testalter_tbl MODIFY i INT NOT NULL;mysql> ALTER TABLE testalter_tbl ADD PRIMARY KEY (i);你也可以使用 ALTER 命令删除主键：mysql> ALTER TABLE testalter_tbl DROP PRIMARY KEY;删除主键时只需指定PRIMARY KEY，但在删除索引时，你必须知道索引名。显示索引信息你可以使用 SHOW INDEX 命令来列出表中的相关的索引信息。

mysql查看表索引

mysql> show index from tblname;

mysql> show keys from tblname;

· Table

表的名称。

· Non_unique

如果索引不能包括重复词，则为0。如果可以，则为1。

· Key_name

索引的名称。

· Seq_in_index

索引中的列序列号，从1开始。

· Column_name

列名称。

· Collation

列以什么方式存储在索引中。在MySQL中，有值‘A’（升序）或NULL（无分类）。

· Cardinality

索引中唯一值的数目的估计值。通过运行ANALYZE TABLE或myisamchk -a可以更新。基数根据被存储为整数的统计数据来计数，所以即使对于小型表，该值也没有必要是精确的。基数越大，当进行联合时，MySQL使用该索引的机会就越大。

· Sub_part

如果列只是被部分地编入索引，则为被编入索引的字符的数目。如果整列被编入索引，则为NULL。

· Packed

指示关键字如何被压缩。如果没有被压缩，则为NULL。

· Null

如果列含有NULL，则含有YES。如果没有，则该列含有NO。

· Index_type

用过的索引方法（BTREE, FULLTEXT, HASH, RTREE）。

· Comment

参考:

自己的实践:

1.单列建立索引

表名　　questions

结构:

未建立索引

　　查看一个数据量非常大的试题表，根据试题的类型查:

SELECT * FROM questions WHERE TYPE='单选题'

结果:花费1062ms

/*[15:03:40][1062 ms]*/ SELECT * FROM questions WHERE TYPE='单选题'  LIMIT 0, 1000;

用explain解释语句之后:

EXPLAIN SELECT * FROM questions WHERE TYPE='单选题'

结果:可以简单的看到一些参数，扫描了7134行，命中率大概为10%.

建立索引

在type这一列建立索引

ALTER TABLE questions ADD INDEX index_ques_type(TYPE)

再次用explain分析执行语句

EXPLAIN SELECT * FROM questions WHERE TYPE='单选题'

结果: 扫描的行数明显减少，且命中率明显上升

2.建立组合索引

(1)未加索引

SELECT *FROM questionsWHERE TYPE = '单选题'    AND questionBankId = '40b7fedfbd1c4cc680d93782a033a518'

结果:

explain解释执行

EXPLAINSELECT *FROM questionsWHERE TYPE = '单选题'    AND questionBankId = '40b7fedfbd1c4cc680d93782a033a518'

(2)建立多列索引

ALTER TABLE `exam5`.`questions` ADD INDEX `index_duolie` (`questionBankId`, `type`)

(3) 查询:(速度明显提高)

SELECT *FROM questionsWHERE     questionBankId = '40b7fedfbd1c4cc680d93782a033a518' AND TYPE = '单选题'

explain解释语句(使用了索引)

EXPLAINSELECT *FROM questionsWHERE     questionBankId = '40b7fedfbd1c4cc680d93782a033a518' AND TYPE = '单选题'

(4)查看索引

SHOW INDEX FROM questions

(5)使用单列索引中的一列

　　1.只使用questionBankId 这一列看到查询时使用了索引

EXPLAINSELECT *FROM questionsWHERE     questionBankId = '40b7fedfbd1c4cc680d93782a033a518'

　　2.只使用type这一列没有使用索引

EXPLAINSELECT *FROM questionsWHERE TYPE = '单选题'

　　3 type和questionBankId交换位置使用索引

EXPLAINSELECT *FROM questionsWHERE TYPE = '单选题'  AND questionBankId = '40b7fedfbd1c4cc680d93782a033a518'

总结:对于单列索引，使用where条件就可以进行查询

　　对于多列索引(A,B)，如果where中只有A可以起到作用，只有B不会使用索引，A、B都有会使用索引，也就是在有A的条件下才会使用索引。

参考:

转载地址：http://huzum.baihongyu.com/

你可能感兴趣的文章

JSP里request变量列表

查看>>

#python#面向对象练手+模仿Amazon的物流追踪显示

查看>>

器者，道之所载

查看>>

谁能告诉我mybatis中使用#和$的区别？

通过创建一个简单的骰子游戏来探究 Python

查看>>

linux 下 C 编程和make的方法（五:补充怎么抓BUG）

java.sql.SQLException: Io 异常: Got minus one fro...

查看>>

PHP处理字符串

查看>>

数据库根据键值自动判断插入还是更新的SQL

Win7、Ubuntu双系统正确卸载Ubuntu系统

查看>>