黑马MySQL数据库从入门到精通-进阶篇 2

智汇君2025-01-17

黑马MySQL数据库从入门到精通-进阶篇 2

SQL优化

插入数据

批量插入

500-1000条合适
insert into table_name values(xxx,xxx,xxx),(xxx,xxx,xxx),(xxx,xxx,xxx),....;

几千几万条时可以分割成多条insert插入

手动提交事务

start transaction;
insert into table_name values(xxx,xxx,xxx);
insert into table_name values(xxx,xxx,xxx);
insert into table_name values(xxx,xxx,xxx);
...
commit;

主键顺序插入

1	不会涉及到页拆分，效率高

大批量数据插入

如果一次性需要插入大批量数据，使用inset语句插入性能较低，此时可以使用MySQL数据库提供的load指令进行插入。操作如下:

#客户端连接服务端时，加上参数 --local-infile
mysql --local-infile -u root -p
#设置全局参数local_infile为1，开启从本地加载文件导入数据的开关
set global local_infile = 1:
#执行load指令将准备好的数据，加载到表结构中
load data local infile '/root/sql1.log' into table 'tb_user' fields terminated by ',' lines terminated by '\n';

主键优化

数据组织方式

1	在InnoDB存储引擎中，表数据都是根据主键顺序组织存放的，这种存储方式的表称为索引组织表index organized table IOT)

页分裂

1	页可以为空，也可以填充一半，也可以填充100%。每个页包含了2-N行数据(如果一行数据多大，会行溢出)，根据主键排列。

主键顺序插入

主键乱序插入

页合并

当删除一行记录时，实际上记录并没有被物理删除，只是记录被标记(flaged) 为删除并且它的空间变得允许被其他记录声明使用。
当页中删除的记录达到MERGE_THRESHOLD(默认为页的50%)，innoDB会开始寻找最靠近的页(前或后)看看是否可以将两个页合并以优化空间使用

这里删除操作

1	MERGE_THRESHOLD: 合并页的阈值，可以自己设置，在创建表或者创建索引时指定

主键设计原则

满足业务需求的情况下，尽量降低主键的长度 --因为二级索引叶子节点会存储主键，会导致索引数据大
插入数据时，尽量选择顺序插入，选择使用AUTO_INCREMENT自增主键。 --避免页分裂
尽量不要使用UUID做主键或者是其他自然主键，如身份证号  --长度长且无序
业务操作时，避免对主键的修改。

order by优化

1
2

1.Using filesort:通过表的索引或全表扫描，读取满足条件的数据行，然后在排序缓冲区sort buffer中完成排序操作，所有不是通过索引直接返回排序结果的排序都叫FileSort排序。
2.Using index:通过有序索引顺序扫描直接返回有序数据，这种情况即为using index，不需要额外排序，操作效率高。

1	backward index scan反向索引扫描

1	下面这个违背最左前缀法则

1	建立联合索引时，默认每个字段都按升序排列。下面这个第二个字段索引失效

1	collation字段的A表示升序，D表示降序

1	下面这个使用了新创建的索引

1	自动选择了之前的索引

1
2
3

下面使用了*，没有使用覆盖索引，索引失效

根据另一个为文件的截图，where 联合索引时，没有使用覆盖索引，索引不会失效，但是order by联合索引，没有使用覆盖索引时会失效

总结

group by优化

1	using temporary表示性能低

1	下面这个性能也低，不满足最左前缀法则

满足最左前缀法则

1	下面这种居然也满足最左前缀法则

1 2	在分组操作时，可以通过索引来提高效率分组操作时，索引的使用也是满足最左前缀法则的。

limit优化

1	一个常见又非常头疼的问题就是limit 2000000,10 ，此时需要MySL排序前2000010 记录，仅仅返回2000000 - 2000010的记录，其他记录丢弃，查询排序的代价非常大

1	select * from tb_sku limit 0,10; 分页操作，查询第一页

1	select * from tb_sku limit 10,10; 分页操作，查询第2页

1	select * from tb_sku limit 1000000,10; 分页操作，查询第100001页此时就开始费时了

优化

1	优化思路:一般分页查询时，通过创建覆盖索引能够比较好地提高性能，可以通过覆盖索引加子查询形式进行优化。

1	select * from tb_sku limit 9000000,10;

1
2
3

当前不支持in后面加limit(先不用管，正确与否都还不知道呢)。用下面这种方式解决上面的不支持

就是先试用order by的覆盖索引，再使用聚合索引

count优化

1
2
3

explain select count(*) from tb_user ;
MyISAM引擎把一个表的总行数存在了磁盘上，因此执行count(*)的时候会直接返回这个数(前提是不要使用where)，效率很高
innoDB引擎就麻烦了，它执行 count(*)的时候，需要把数据一行一行地从引擎里面读出来，然后累积计数

优化思路：自己计数

count的几种用法

Count()是一个聚合函数，对于返回的结果集，一行行地判断，如果count函数的参数不是NULL，累计值就加1，否则不加，最后返回累计值。

用法: count(*)、count(主键)、count(字段)、count(1)

按照效率排序的话:count(字段)< count(主键id)< count(1)= count(*)，所以尽量使用count(*).

count(主键)

1 2	count(主键) lnnoDB引擎会遍历整张表，把每一行的主键id值都取出来，返回给服务层。服务层拿到主键后，直接按行进行累加(主键不可能为nul)。

count(字段)

count (字段)
没有not null约束:innoDB 引擎会遍历整张表把每一行的字段值都取出来，返回给服务层，服务层判断是否为nul，不为nul，计数累加。
有not null约束:innoDB 引警会遍历整张表把每一行的字段值都取出来，返回给服务层，直接按行进行累加。

count(1)

1 2	count (1) lnnoDB 引擎遍历整张表，但不取值。服务层对于返回的每一行，放一个数字“1”进去，直接按行进行累加。

count (*)

1 2	count(*) lnnoDB引肇并不会把全部字段取出来，而是专门做了优化，不取值，服务层直接按行进行累加。

update优化

1	InnoDB的行锁是针对索引加的锁，不是针对记录加的锁,并且该索引不能失效，否则会从行锁升级为表锁。导致并发性能降低。

锁定id为1这一行

1	此时执行下面语句成功

1	下面这个貌似是锁定id为2这一行。其实由于name此时没有建立索引，默认的是表锁，锁定这张表，此时另一个事务执行卡住