avatar

5.存储引擎

存储引擎

第1章 简介

1
相当于Linux文件系统,只不过比文件系统强大

第2章 存储引擎种类

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
mysql> show engines;
| CSV
| MRG_MYISAM
| MyISAM
| BLACKHOLE
| PERFORMANCE_SCHEMA
| MEMORY
| ARCHIVE
| InnoDB
| FEDERATED

#引擎种类查看
show engines;
存储引擎是作用在表上的,也就意味着,不同的表可以有不同的存储引擎类型。
PerconaDB:默认是XtraDB
MariaDB:默认是InnoDB
其他的存储引擎支持:
TokuDB
RocksDB
MyRocks
以上三种存储引擎的共同点:压缩比较高,数据插入性能极高
现在很多的NewSQL,使用比较多的功能特性.

2.1 InnoDB,MyISAM引擎的区别

1
2
3
4
5
6
7
8
支持事务(transaction)
支持行级锁(row level lock),MyISAM是表级锁
支持外键(FK)
支持热备(Hot Backup) ,MyISAM支持温备份
支持自动故障恢复(ACSR)
主从复制新特性(GTID,Group Commit,MTS,MGR...)
支持各类高级的缓存机制
更丰富的线程支持

2.2 简历案例—zabbix监控系统架构整改

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
环境: zabbix 3.2    mariaDB 5.5  centos 7.3
现象 : zabbix卡的要死 , 每隔3-4个月,都要重新搭建一遍zabbix,存储空间经常爆满.
问题 :
1. zabbix 版本
2. 数据库版本
3. zabbix数据库500G,存在一个文件里
优化建议:
1.数据库版本升级到5.7版本,zabbix升级更高版本
2.存储引擎改为tokudb
3.监控数据按月份进行切割(二次开发:zabbix 数据保留机制功能重写,数据库分表)
4.关闭binlog和双1
5.参数调整....
优化结果:
监控状态良好

为什么?
1. 原生态支持TokuDB,另外经过测试环境,5.7要比5.5 版本性能 高 2-3倍
2. TokuDB:insert数据比Innodb快的多,数据压缩比要Innodb高
3.监控数据按月份进行切割,为了能够truncate每个分区表,立即释放空间
4.关闭binlog ----->减少无关日志的记录.
5.参数调整...----->安全性参数关闭,提高性能.

2.3 InnoDB个MyISAM存储引擎的替换

1
2
3
4
5
6
7
8
9
10
11
12
环境: centos 5.8 ,MySQL 5.0版本,MyISAM存储引擎,网站业务(LNMP),数据量50G左右
现象问题: 业务压力大的时候,非常卡;经历过宕机,会有部分数据丢失.
问题分析:
1.MyISAM存储引擎表级锁,在高并发时,会有很高锁等待
2.MyISAM存储引擎不支持事务,在断电时,会有可能丢失数据
职责
1.监控锁的情况:有很多的表锁等待
2.存储引擎查看:所有表默认是MyISAM
解决方案:
1.升级MySQL 5.6.10版本
2. 迁移所有表到新环境
3. 开启双1安全参数

第3章 InnoDB存储引擎介绍

1
在MySQL5.5版本之后,默认的存储引擎,提供高可靠性和高性能。

第4章 存储引擎查看

4.1 使用 SELECT 确认会话存储引擎

1
2
3
4
5
6
7
8
9
10
11
12
13
SELECT @@default_storage_engine;
##存储引擎(不代表生产操作)
会话级别:
set default_storage_engine=myisam;
全局级别(仅影响新会话):
set global default_storage_engine=myisam;
重启之后,所有参数均失效.
如果要永久生效:
写入配置文件
vim /etc/my.cnf
[mysqld]
default_storage_engine=myisam
存储引擎是表级别的,每个表创建时可以指定不同的存储引擎,但是我们建议统一为innodb.

4.2 SHOW 确认每个表的存储引擎

1
2
SHOW CREATE TABLE City\G;
SHOW TABLE STATUS LIKE 'CountryLanguage'\G

4.3 INFORMATION_SCHEMA 确认每个表的存储引擎

1
2
3
[world]>select table_schema,table_name ,engine from information_schema.tables where table_schema not in ('sys','mysql','information_schema','performance_schema');
Master [world]>show table status;
Master [world]>show create table city;

4.4 修改一个表的存储引擎

1
2
db01 [oldboy]>alter table t1 engine innodb;
注意:此命令我们经常使用他,进行innodb表的碎片整理

4.5 平常处理过的MySQL问题–碎片处理

1
2
3
4
5
6
7
8
环境:centos7.4,MySQL 5.7.20,InnoDB存储引擎
业务特点:数据量级较大,经常需要按月删除历史数据.
问题:磁盘空间占用很大,不释放
处理方法:
以前:将数据逻辑导出,手工drop表,然后导入进去
现在:
对表进行按月进行分表(partition,中间件)
业务替换为truncate方式

4.6 扩展:如何批量修改

1
2
3
需求:将zabbix库中的所有表,innodb替换为tokudb
select concat("alter table zabbix.",table_name," engine tokudb;") from
information_schema.tables where table_schema='zabbix' into outfile '/tmp/tokudb.sql';

第5章 InnoDB存储引擎物理存储结构

5.1 最直观的存储方式(/data/mysql/data)

1
2
3
4
5
ibdata1:系统数据字典信息(统计信息),UNDO表空间等数据
ib_logfile0 ~ ib_logfile1: REDO日志文件,事务日志文件。
ibtmp1: 临时表空间磁盘位置,存储临时表
frm:存储表的列信息
ibd:表的数据行和索引

5.2 表空间(Tablespace)

5.2.1 共享表空间

1
2
3
4
5
需要将所有数据存储到同一个表空间中 ,管理比较混乱
5.5版本: 用户表数据和索引,系统数据字典信息,undo信息(回滚信息),临时表信息等.
5.6版本: 将用户数据和索引分离.剩下:系统数据字典信息,undo信息(回滚信息),临时表信息等.
5.7版本: 将临时表独立,剩下:系统数据字典信息,undo信息(回滚信息).人为可以undo信息独立
8.0版本: undo也独立了,数据字典只存一份.共享表空间会慢慢解耦了.

具体变化参考官方文档:
https://dev.mysql.com/doc/refman/5.6/en/innodb-architecture.html
https://dev.mysql.com/doc/refman/5.7/en/innodb-architecture.html
https://dev.mysql.com/doc/refman/5.8/en/innodb-architecture.html

5.2.2 共享表空间设置

1
2
3
4
5
共享表空间设置(在搭建MySQL时,初始化数据之前设置到参数文件中)
[(none)]>select @@innodb_data_file_path;
[(none)]>show variables like '%extend%';
innodb_data_file_path=ibdata1:512M:ibdata2:512M:autoextend
innodb_autoextend_increment=64

5.2.3 独立表空间

1
2
3
4
5
6
7
8
9
10
11
12
13
14
从5.6,默认表空间不再使用共享表空间,替换为独立表空间。
主要存储的是用户数据
存储特点为:一个表一个ibd文件,存储数据行和索引信息
基本表结构元数据存储:
xxx.frm
最终结论:
元数据 数据行+索引
mysql表数据 =(ibdataX+frm)+ibd(段、区、页)
DDL DML+DQL

MySQL的存储引擎日志:
Redo Log: ib_logfile0 ib_logfile1,重做日志
Undo Log: ibdata1 ibdata2(存储在共享表空间中),回滚日志
临时表:ibtmp1,在做join union操作产生临时数据,用完就自动

5.2.4 独立表空间设置问题

1
2
3
4
5
6
7
8
db01 [(none)]>select @@innodb_file_per_table;
+-------------------------+
| @@innodb_file_per_table |
+-------------------------+
| 1 |
+-------------------------+
alter table city dicard tablespace;
alter table city import tablespace;

第6章 故障案例

6.1 案例一

6.1.1 案例背景:

1
2
3
4
5
6
7
8
9
硬件及软件环境:
联想服务器(IBM)
磁盘500G 没有raid
centos 6.8
mysql 5.6.33 innodb引擎 独立表空间
备份没有,日志也没开

开发用户专用库:
jira(bug追踪) 、 confluence(内部知识库) ------>LNMT

6.1.2 故障描述:

1
2
3
4
5
故障:
1. 开发用的 Jira , confluence (无备份,无优化,无高可用).
2. 断电,第二天启动,"根文件系统只读,建议使用fsck命令修复文件系统"
3. 拿到手的操作系统起来了,但是数据库启动不了.
4. 检查问题,jira库目录丢失,只剩下confluence

6.1.3 解决办法

1
2
3
4
5
表空间迁移:
create table xxx
alter table confulence.t1 discard tablespace;
alter table confulence.t1 import tablespace;
虚拟机测试可行。

6.1.4 解决思路

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
confulence库中一共有107张表。
1、创建107和和原来一模一样的表。
他有2016年的历史库,我让他去他同时电脑上 mysqldump备份confulence库
mysqldump -uroot -ppassw0rd -B confulence --no-data >test.sql
拿到你的测试库,进行恢复
到这步为止,表结构有了。
2、表空间删除。
select concat('alter table ',table_schema,'.'table_name,' discard tablespace;') from information_schema.tables where table_schema='confluence' into outfile '/tmp/discad.sql';
source /tmp/discard.sql
执行过程中发现,有20-30个表无法成功。主外键关系
很绝望,一个表一个表分析表结构,很痛苦。
set foreign_key_checks=0 跳过外键检查。
把有问题的表表空间也删掉了。
3、拷贝生产中confulence库下的所有表的ibd文件拷贝到准备好的环境中
select concat('alter table ',table_schema,'.'table_name,' import tablespace;') from information_schema.tables where table_schema='confluence' into outfile '/tmp/discad.sql';
4、验证数据
表都可以访问了,数据挽回到了出现问题时刻的状态(2-8)

6.2 案例二

6.2.1 案例背景

1
2
3
4
#真实的存储引擎优化项目
背景: zabbix 2.x+ MariaDB 5.5, InnODB ,共享表空间 ,监控一共2000+
性能问题: 每隔几个月,Zabbix卡.以前的解决方案,每隔一段时间就要重新搭建zabbix.ibdata1文件已经500G+
性能问题: 每隔几个月,Zabbix卡.以前的解决方案,每隔一段时间就要重新搭建zabbix.ibdata1文件已经500G+

6.2.2 问题分析

1
2
3
4
5
6
7
1. zabbix版本较低
2. MariaDB版本较低
2.1 版本老,原生态性能低
2.2 5.5版本使用共享表空间
2.3 只保留半年以内的监控数据
2.4 安全参数都开了
2.5 使用InnoDB引擎

6.2.3 改造建议

1
2
3
4
5
6
7
8
9
10
11
12
改造建议:	
1. zabbix换成较新的版本
2. MariaDB 版本要升级,MariaDB 10.x版本或者Oracle MySQL 5.7或 8.0版本
3. 表空间模式,升级后变为独立表空间模式
5. 关闭所有安全参数和日志.
双一参数关闭
binlog关闭
6. 存储引擎 TokuDB,MyRocks
说明: TokuDB,MyRocks 等存储引擎,MariaDB原生态支持,特点是插入性能高,压缩比极高.
7. 每月进行分表,删除历史数据时,truncate.好处是:delete替换为truncate(未实现).
结果:
经过改造,zabbix没有出现卡顿的显现.

6.3 MySQL问题–碎片处理

1
2
3
4
5
6
7
8
9
10
11
12
环境:centos7.4,MySQL 5.7.20,InnoDB存储引擎
业务特点:数据量级较大,经常需要按月删除历史数据.
问题:磁盘空间占用很大,不释放
处理方法:
以前:将数据逻辑导出,手工truncate表,然后导入进去
现在:
对表进行按月进行分表(partition,中间件)
业务替换为truncate方式

整理碎片:
alter table t1 engine=innodb;
optimize table t1;

第7章 InnoDB核心特性-事务

7.1 事务功能介绍

1
2
3
4
5
6
将多条变更语句,放在一个组(事务)中同时语句,要么全成功,要么全失败.
不可以出现中间过程

我的理解:
事务是计算机中,伴随着交易类的需求出现的概念和工作机制
所有参加的交易性质的语句,必须同时成功或失败

7.2 事务的核心特性ACID介绍

1
2
3
4
5
6
7
8
Atomic(原子性)
不可再分的特性.一个事务就是一个执行单元,不可再分.必须同时成功或失败
Consistent(一致性)
在一个事务工作单元中,不管是开始时,进行中,结束后,必须数据保证最终一致.
Isolated(隔离性)
多个事务之间工作互不影响.
Durable(持久性)
事务成功完成后,所做的所有更改都会准确地记录在数据库中。所做的更改不会丢失

第8章 事务的生命周期(事务控制语句)

8.1 事务的开始

1
2
begin
说明:在5.5 以上的版本,不需要手工begin,只要你执行的是一个DML,会自动在前面加一个begin命令

8.2 事务的结束

1
2
3
4
5
6
7
commit:提交事务
完成一个事务,一旦事务提交成功 ,就说明具备ACID特性了。
rollback :回滚事务
将内存中,已执行过的操作,回滚回去
说明:
1. 已经commit成功的事务,无法进行回滚.
2. 标准事务语句: insert update delete

8.3 自动提交策略(autocommit)

1
2
3
4
5
6
7
8
9
10
11
12
db01 [(none)]>select @@autocommit;
db01 [(none)]>set autocommit=0;
db01 [(none)]>set global autocommit=0;
注:
自动提交是否打开,一般在有事务需求的MySQL中,将其关闭
不管有没有事务需求,我们一般也都建议设置为0,可以很大程度上提高数据库性能
(1)
set autocommit=0;
set global autocommit=0;
(2)
vim /etc/my.cnf
autocommit=0

8.4 隐式提交语句

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
用于隐式提交的 SQL 语句:
begin
a
b
begin

SET AUTOCOMMIT = 1

导致提交的非事务语句:
DDL语句: (ALTER、CREATE 和 DROP)
DCL语句: (GRANT、REVOKE 和 SET PASSWORD)
锁定语句:(LOCK TABLES 和 UNLOCK TABLES)
导致隐式提交的语句示例:
TRUNCATE TABLE
LOAD DATA INFILE
SELECT FOR UPDATE

8.5 开始事务流程

1
2
3
4
5
6
7
8
9
10
11
12
13
14
1、检查autocommit是否为关闭状态
select @@autocommit;
或者:
show variables like 'autocommit';
2、开启事务,并结束事务
begin
delete from student where name='alexsb';
update student set name='alexsb' where name='alex';
rollback;

begin
delete from student where name='alexsb';
update student set name='alexsb' where name='alex';
commit;

第9章 InnoDB 事务的ACID如何保证

9.1 相关概念

1
2
3
4
5
6
7
8
9
10
11
redo log ---> 重做日志 ib_logfile0~1   50M   , 轮询使用
redo log buffer ---> redo内存区域
ibd ----> 存储 数据行和索引
buffer pool --->缓冲区池,数据和索引的缓冲
LSN : 日志序列号
磁盘数据页,redo文件,buffer pool,redo buffer
MySQL 每次数据库启动,都会比较磁盘数据页和redolog的LSN,必须要求两者LSN一致数据库才能正常启动
WAL : write ahead log 日志优先写的方式实现持久化
脏页: 内存脏页,内存中发生了修改,没写入到磁盘之前,我们把内存页称之为脏页.
CKPT:Checkpoint,检查点,就是将脏页刷写到磁盘的动作
TXID: 事务号,InnoDB会为每一个事务生成一个事务号,伴随着整个事务.

9.2 redo log

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
(1)Redo是什么?
redo,顾名思义“重做日志”,是事务日志的一种
(2)作用是什么?
在事务ACID过程中,实现的是“D”持久化的作用。对于AC也有相应的作用
(3)redo日志位置?
redo的日志文件:iblogfile0 iblogfile1
(4)redo buffer
redo的buffer:数据页的变化信息+数据页当时的LSN号
LSN:日志序列号 磁盘数据页、内存数据页、redo buffer、redolog
(5)redo的刷新策略
commit;
刷新当前事务的redo buffer到磁盘
还会顺便将一部分redo buffer中没有提交的事务日志也刷新到磁盘
(6)MySQL CSR——前滚
MySQL : 在启动时,必须保证redo日志文件和数据文件LSN必须一致, 如果不一致就会触发CSR,最终 保证一致
#情况一:
我们做了一个事务,begin;update;commit.
1.在begin ,会立即分配一个TXID=tx_01.
2.update时,会将需要修改的数据页(dp_01,LSN=101),加载到data buffer中
3.DBWR线程,会进行dp_01数据页修改更新,并更新LSN=102
4.LOGBWR日志写线程,会将dp_01数据页的变化+LSN+TXID存储到redobuffer
5. 执行commit时,LGWR日志写线程会将redobuffer信息写入redolog日志文件中,基于WAL原则,在日志完全写入磁盘后,commit命令才执行成功,(会将此日志打上commit标记)
6.假如此时宕机,内存脏页没有来得及写入磁盘,内存数据全部丢失
7.MySQL再次重启时,必须要redolog和磁盘数据页的LSN是一致的.但是,此时dp_01,TXID=tx_01磁盘是LSN=101,dp_01,TXID=tx_01,redolog中LSN=102
MySQL此时无法正常启动,MySQL触发CSR.在内存追平LSN号,触发ckpt,将内存数据页更新到磁盘,从而保证磁盘数据页和redolog LSN一值.这时MySQL正长启动
以上的工作过程,我们把它称之为基于REDO的"前滚操作"

9.3 undo 回滚日志

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
#(1)undo是什么?
undo,顾名思义“回滚日志”
#(2)作用是什么?
在事务ACID过程中,实现的是“A” 原子性的作用
另外CI也依赖于Undo
在rolback时,将数据恢复到修改之前的状态
在CSR实现的是,将redo当中记录的未提交的时候进行回滚.
undo提供快照技术,保存事务修改之前的数据状态.保证了MVCC,隔离性,mysqldump的热备
#(3)概念性的东西
redo怎么应用的
undo怎么应用的
CSR(自动故障恢复)过程
LSN :日志序列号
TXID:事务ID
CKPT(Checkpoint)
#(4)锁
“锁”顾名思义就是锁定的意思。
“锁”的作用是什么?
在事务ACID过程中,“锁”和“隔离级别”一起来实现“I”隔离性和"C" 一致性 (redo也有参与).
悲观锁:行级锁定(行锁)
谁先操作某个数据行,就会持有<这行>的(X)锁.
乐观锁: 没有锁
#(5)隔离级别
影响到数据的读取,默认的级别是 RR模式.
transaction_isolation 隔离级别(参数)
负责的是,MVCC,读一致性问题
RU : 读未提交,可脏读,一般部议叙出现
RC : 读已提交,可能出现幻读,可以防止脏读.
RR : 可重复读,功能是防止"幻读"现象 ,利用的是undo的快照技术+GAP(间隙锁)+NextLock(下键锁)
SR : 可串行化,可以防止死锁,但是并发事务性能较差
补充: 在RC级别下,可以减轻GAP+NextLock锁的问题,但是会出现幻读现象,一般在为了读一致性会在正常select后添加for update语句.但是,请记住执行完一定要commit 否则容易出现所等待比较严重.
例如:
[world]>select * from city where id=999 for update;
[world]>commit;

第10章 InnoDB存储引擎核心特性-参数补充

10.1 存储引擎相关

10.1.1 查看

1
2
3
show engines;
show variables like 'default_storage_engine';
select @@default_storage_engine;

10.1.2 如何指定和修改存储引擎

1
2
3
(1) 通过参数设置默认引擎
(2) 建表的时候进行设置
(3) alter table t1 engine=innodb;

10.2 表空间

10.2.1 共享表空间

1
2
3
4
innodb_data_file_path
一般是在初始化数据之前就设置好
例子:
innodb_data_file_path=ibdata1:512M:ibdata2:512M:autoextend

10.2.2 独立表空间

1
show variables like 'innodb_file_per_table';

10.3 缓冲区池

10.3.1 查询

1
2
3
4
select @@innodb_buffer_pool_size;
show engine innodb status\G
innodb_buffer_pool_size
一般建议最多是物理内存的 75-80%

10.4 innodb_flush_log_at_trx_commit (双一标准之一)

10.4.1 作用

1
主要控制了innodb将log buffer中的数据写入日志文件并flush磁盘的时间点,取值分别为0、1、2三个。

10.4.2 查询

1
select @@innodb_flush_log_at_trx_commit;

10.4.3 参数说明:

1
2
3
4
5
6
7
8
1,每次事物的提交都会引起日志文件写入、flush磁盘的操作,确保了事务的ACID;flush  到操作系统的文件系统缓存  fsync到物理磁盘.
0,表示当事务提交时,不做日志写入操作,而是每秒钟将log buffer中的数据写入文件系统缓存并且秒fsync磁盘一次;
2,每次事务提交引起写入文件系统缓存,但每秒钟完成一次fsync磁盘操作。
--------
The default setting of 1 is required for full ACID compliance. Logs are written and flushed to disk at each transaction commit.
With a setting of 0, logs are written and flushed to disk once per second. Transactions for which logs have not been flushed can be lost in a crash.
With a setting of 2, logs are written after each transaction commit and flushed to disk once per second. Transactions for which logs have not been flushed can be lost in a crash.
-------

10.5. Innodb_flush_method=(O_DIRECT, fdatasync)

[https://dev.mysql.com/doc/refman/5.7/en/innodb-parameters.html#sysvar_innodb_flush_method]

1
2
3
4
5
6
7
8
9
0 : 每秒刷os cache,同时flushed到磁盘
1 : 每次事务commit,刷os cache,同时flushed到磁盘
2 : 每次事务commit,刷os cache,1秒flushed到磁盘

O_Direct :
数据页刷新磁盘的时候,穿过OS Cache,直接刷磁盘,建议云盘或SSD,或者高速存储
redo buffer , 先刷 os cache,再刷 磁盘
fsync :
数据页和redo buffer 在刷新时都OS buffer ,再到磁盘

10.5.1 作用

1
控制的是,log buffer 和data buffer,刷写磁盘的时候是否经过文件系统缓存

10.5.2 查看

1
show variables like '%innodb_flush%';

10.5.3 参数值说明

1
2
3
O_DIRECT  :数据缓冲区写磁盘,不走OS buffer
fsync :日志和数据缓冲区写磁盘,都走OS buffer
O_DSYNC :日志缓冲区写磁盘,不走 OS buffer

10.5.4 使用建议

1
2
3
4
5
6
最高安全模式
innodb_flush_log_at_trx_commit=1
Innodb_flush_method=O_DIRECT
最高性能:
innodb_flush_log_at_trx_commit=0
Innodb_flush_method=fsync

10.5.5 redo日志有关的参数

1
2
3
innodb_log_buffer_size=16777216
innodb_log_file_size=50331648
innodb_log_files_in_group = 3

第11章 扩展

1
2
3
4
5
6
7
8
9
10
11
12
13
14
RR模式(对索引进行删除时):
GAP: 间隙锁
next-lock: 下一键锁定

例子:
id(有索引)
1 2 3 4 5 6
GAP:
在对3这个值做变更时,会产生两种锁,一种是本行的行级锁,另一种会在2和4索引键上进行枷锁
next-lock:
对第六行变更时,一种是本行的行级锁,在索引末尾键进行加锁,6以后的值在这时是不能被插入的。
总之:
GAP、next lock都是为了保证RR模式下,不会出现幻读,降低隔离级别或取消索引,这两种锁都不会产生。
IX IS X S是什么?
文章作者: Wu Fei
文章链接: http://linuxwf.com/2020/04/15/5-%E5%AD%98%E5%82%A8%E5%BC%95%E6%93%8E/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 WF's Blog
打赏
  • 微信
    微信
  • 支付宝
    支付宝

评论