MySQL数据库 | 轻狂帅哥

# 为什么要使用数据库？

持久化将内存中的数据存储到关系型数据库中

一张表可以存储，几千万，上亿条数据。

类型多种多样，图片，大文本

使用成本低，性能卓越，服务稳定，软件体积小，社区活跃

概念：

DB 数据库实际文件
DBMS 数据库管理系统
SQL 结构化查询语言

Mysql 开放源代码的关系型数据库管理系统

2008 sun 收购，2009 oracle 收购sun mariadb 是mysql的分支项目
6.x 后分社区版和商业版
GPL 协议，修改源码来开发自己的mysql系统
mysql 支持上千万条大型数据库
mysql 在32系统下支持表文件4GB的存储，64位系统下支持表文件8TB的存储
标准的SQL 标记语言
mysql5.5 innodb 引擎作为默认存储引擎
mysql5.7 比较多 2015年
2016年 8.0

oracle 适用于大型跨国企业，性能和安全性要求高，收费

mysql 中小型网站，互联网公司首选

# RDBMS和非RDBMS

RDBMS 二维关系行和列构成表
非RDBMS 阉割版性能非常高

redis 键值型内存缓存
mongodb 文档型 xml json
搜索引擎数据库 ES solr 数据量大
列式数据库 HBase 降低IO 分布式文件系统
图形数据库存储实体对象之间的关系

# ER与表记录

实体集，属性，联系集

# 一对一关联

一对一可以创建成一张表

外键唯一，外键是主键

一对多

主表的主键是从表的非主键字段

多对多

需要关联关系表

自我引用

自己对应自己，自我引用

# Mysql卸载

mysql --version  // 数据库版本
mysql -uroot -p   // 后面接上密码
show databases;  // 数据库
use atguigudbl // 使用数据库
show tables;   // 展示表
select version();// 查询版本
mysql -uroot -pabc123 -hlocalhost -P3307  // 主机端口号
net start 服务名 // 启动服务
net stop 服务名 // 停止服务

控制面板卸载
msi 卸载
电脑管家或者360卸载
清除注册表 regedit

show databases;
information_schema; -- 系统信息，数据库名称，表名称，存储权限
mysql   -- 运行时系统信息。文件夹，字符集
performance_schema; -- 性能指标
sys -- 性能指标，开发人员监控性能
create database bdtest1; // 创建数据库
use bdtest1; // 使用数据库
create table employees(id int,name varchar(15));// 创建表
show tables;// 展示表
select * from employees;// 查看数据
insert into employees values(1002,'Tom'); // 插入数据

show create table employees; // 查看表信息

5.7 不能插入中文  数据库默认字符集 latin1 不包含汉字

show variables like 'character_%'; // 显示字符集
show variables like 'collation_%'; // 比较规则

drop database dbtest1;// 删除数据库


5.7 my.ini
[mysql]
default-character-set=utf8 #默认字符集
[mysqld]
character-set-server=utf8
collation-server=utf8_general_ci

8.0 默认 utf8mb4 4个字节表示一个字符


5.7默认是mysql_native_password
8.0默认是caching_sha2_password加密方式，需要更改加密规则

use mysql；

alter user 'root'@'localhost' IDENTIFIED with mysql_native_password by '123456'

flush privileges;


skip-grant-tables 忽略密码金融

# SQL分类

DDL: 数据定义语言  create  alter drop  rename  truncate 

DML: 数据操纵语言  insert  delete  update  select 

DCL: 数据控制语言  commit  rollback savepoint grant revoke 

windows 不区分大小写
linux 区分大小写
数据库名，表名，表的别名，变量名 区分大小写
关键字，函数名，列名，列的字段名忽略大小写

规范
数据库名，表名，表别名，字段名，字段别名都小写
sql关键字，函数名，绑定变量都大写

# 单行注释
/*
 多行注释
*/
-- 必需有空格
导入数据
source 文件的全路径名  cmd导入
基于图形化工具导入

别名 可以用双引号括起来 解决空格问题

去除重复行
distinct 关键字 只能整体不重复

空值参与运算
null 和 0 '' 是不一样的
null 参与运算的结果都是null
IFNULL(commission_pct,0)

着重号 `` 
解决order 是关键字

常数
每一行都会匹配

显示表结构
DESCRIBE 表名;
DESC 表名;

sql 在windows下是不区分大小写  字符串也不区分 ANSI 标准 是mysql放水了
oracle 字符串区分大小写  
过滤数据
where 

sql 中 + 没有连接作用。
和字母相加会当0处理

/ 除法是默认浮点型，除法自动保留小数位
100 div 0 结果为null
mod 模数的符号 和被模数有关  为偶数 %2

比较运算符
=   字符串存在隐式转换，如果转换不成功，则看做是0

两边都是字符串，通过ASNI的比较规则比较

只要有null参与运算结果就是null

<=>  安全等于 没有null 参与是一样的  null可以参与运算
一样为1 不一样为0  is null   is not null  isnull函数

select commission_pct
from employees
where not commission_pct <=> null; 也可以

LEAST 最小  GREATEST 最大 LENGTH 长度

BETWEEN AND 区间 左右都包含 要求条件1是下限 条件2是上限 

and && 且  

in 区间   not in

or 或 非零就是1  条件要完整

like 模糊查询  %a%  %不确定个数的字符

last_name like '%a%e%' or last_name like '%e%a%'

_ 代表一个不确定的字符

转义字符 \
ESCAPE '$' 告诉数据库这个是转义字符

REGEXP  RLIKE 正则
^ 开头
$ 结尾
. 任意一个字符
[...] [abc] 有a 或b 或c  -代表范围
* 匹配任意多个字符可以是零个

XOR 异或  不同为真，相同为假

and 比 or 的优先级高



默认存储顺序，先后添加的顺序 ORDER BY

使用 ORDER BY 默认升序 ASC

可以使用列的别名进行排序

列的别名只能在 ORDER BY 中使用
WHERE 不可以使用别名

二级排序 逗号分割就可以了 第一列相同
，再考虑第二列

分页节省资源 limit 偏移量 显示条目数

第二页  limit 20 20;

公式 (pageNo-1)*pageSize,pageSize

声名顺序 
1. where
2. order by
3. limit

limit 位置偏移量为0 可以省略这个0

偏移量从开始 注意一下

Mysql 8.0 新特性

OFFSET 颠倒一下原来的顺序

limit 必须在最后！！！ PGSQL，SQLITE，MARIABD

扩展： sqlserver 使用top
DB2 FETCH FIRST 5 ROWS ONLY
oracle rownum 统计 隐藏字段
前10条记录 rownum<=10

length(email) desc 邮箱字节数降序


拆表  解决冗余 IO次数变多，影响效率，粒度小的方面考虑 并发的角度

笛卡尔积：员工和部门都匹配了一遍。交叉连接
缺少连接条件  cross join  连接条件没写对
所有可能都出现一遍，元素个数的乘积

-- 关联查询
SELECT employee_id,department_name
FROM employees,departments
where employees.department_id = departments.department_id

-- 建议多表查询每个字段前都指明所在的表
SELECT employee_id,department_name,employees.department_id
FROM employees,departments
where employees.department_id = departments.department_id

-- 可以给表起别名。在select 和 where 中使用  原名和别名不能混用，用了别名就不能用原名·

n个表至少要有n-1个连接条件，否则会出现笛卡尔积


多表查询的分类
1. 等值连接和非等值连接
2. 自连接和非自连接
3. 内连接和外连接

#非等值连接
SELECT e.last_name,e.salary,j.grade_level
FROM employees e,job_grades j
where e.salary between j.lowest_sal and j.highest_sal

#自连接 查询员工id，员工姓名及其管理者的id和姓名
SELECT a.employee_id,a.last_name,b.employee_id,b.last_name
FROM employees a,employees b
WHERE a.manager_id = b.employee_id

内连接  合并具有同一列的两个以上的表的行

外连接 合并具有同一列的两个以上的表的行，与另一个表匹配的行

左外 右外  满连接

sql92 sql99 sql经典标准

sql92 外连接  使用+ 在裤子短的位置
mysql 不支持sql92   (+)

SQL99 是支持的
mysql 不支持 满外连接  FULL OUTER JOIN 
JOIN ON

INNER JOIN ON 内连接 INNER 可以省略
LEFT OUTER JOIN 外连接 OUTER 可以省略

SQL99 7种JOIN实现方式

union 合并查询结果 去重重复数据  列必须一样
union all 合并查询结果 不去重   效率高  最好用union all

使用IS NULL  去掉对应的中间部分

自然连接
两个连接条件  NATURAL JOIN  它回自动帮我查询两张连接表中的所有相同字段的，进行等值连接

USING
替换连接条件  当两张表的名字是一样的 里面是相同的字段名
USING(department_id)

阿里巴巴 规范 禁止超过三个表进行join操作

# 函数

将代码进行封装，提高了代码效率，提高了维护性，提高用户对数据库的关联效率
SQL代码移植性比较差。

# 单行函数（可以嵌套）

一行出来一行

数值函数
ABS 绝对值
SIGN 返回符号i
PI 圆周率
CEIL 和 CEILING 天花板
FLOOR 地板
LEAST 一列最小
GREATEST 一列最大
MOD 取余
RAND 随机值 0~1
RAND（x） 随机值0~1  x值会产生相同的随机数
ROUND 四舍五入  后面的参数可以是负数，抹零
TRUNCATE（x,y）  x截取y位小数
SQRT(x) x的平方根

角度和弧度的互换
RADIANS   角度变弧度
DEGREES   弧度变角度
SIN
ASIN
COS
ACOS
TAN
ATAN
ARAN2
COT

指数和对数
pow power
exp  e的x次方  e位常数2.718128182859045
ln log
log10  log2

进制转换
BIN  二进制
HEX  16进制
OCT   8进制
CONV 机制转换  conv(x,f1,f2)


字符串函数
ASCII 第一个字符有关系
CHAR_LENGTH 字符长度
LENGTH UTF8 汉字三个字节 字节长度
CONCAT 连接字符串
CONCAT_WS 指定连接字符
INSERT 字符串的索引是从1开始的    替换 从索引位置 替换多少个
REPLACE 替换
UPPER 大写
LOWER 小写
LEFT 最左面的几个字符
RIGHT 最右面的几个字符 
LPAD 左补充 一共多少位  以什么补齐
RPAD 右补充 一共多少位  以什么补齐
TRIM 去除空格
LTRIM 左去除
RTRIM 右去除
TRIM（s1 FROM S）指定去除什么
TRIM(LEADING s1 FROM S) 去除头部的S1
TRIM(TRAILING s1 FROM S) 去除尾部的S1
REPEAT 重复n次结果
SPACE 返回几个空格
STRCMP 比较ASCII码
SUBSTR 截取字符串
LOCATE 返回首次出现的位置
ELT 返回指定位置的字符串
FIELD  返回字符串s在字符串列表中首次出现的位置
FIND_IN_SET 返回字符串s1在字符串s2出现的位置
REVERSE 反转
NULLIF 相等返回NULL，不想等返回前面的

日期函数
CURDATE() 当前时间   年月日
CURTIME() 当前时间   时分秒
NOW()   当前时间
UTC_DATE()  格林威治时间 年月日
UTC_TIME()  格林威治时间 时分秒

日期转时间戳
UNIX_TIMESTAMP(date)
UNIX_TIMESTAMP()
FROM_UNIXTIME()

年，月，日，星期，时分秒的获取
YEAR MONTH DAY
HOUR MINUTE SECOND
MONTHNAME  英文月数
DAYNAME 英文周几
WEEKDAY 第几周
QUARTER 季节
WEEK 这一年的第几周
DAYOFYEAR 这一年的多少天
DAYOFMONTH 这个月的第几天
DAYOFWEEK 周几

日期的操作函数  提取日期
EXTRACT(type from date)
type 可以是对应的类型  

时间和秒数的转换
TIME_TO_SEC()
SECT_TO_TIME()

计算日期和时间的函数
DATE_ADD(dateTIME,INTERVAL expr type) 新增时间
DATE_SUB(dateTIME,INTERVAL expr type) 减去时间
ADDTIME(time1,time2)   数字值时是秒
SUBTIME(time1,time2)   数字值时是秒
DATEDIFF(date1,date2)  间隔多少天
TIMEDIFF(time1,time2)  间隔时间
FROM_DAYS(N) 从0000年1月1日。N天以后的日期
TO_DAYS(date)  返回日期date日期距离0000年1月1日所在天数
LAST_DAY()  所在年份最后一天
MAKEDATE(year,n)  根据年和日创建时间
MAKETIME(hour,minute,second) 分解小时，分，秒。计算时间返回
PERIOD_ADD(time,n) 返回time加上n后的时间

日期的格式化和解析
DATE_FORMAT(date,fmt)   
TIME_FORMAT(time,fmt)
GET_FORMAT(date_type,format_type) 获取格式化
STR_TO_DATE(str,fmt)

# 聚合函数

一行出来多行

# 流程控制函数

第一个有些像三元表达式
第4个 expr 是字段名 when 后面是常量值起别名要在END 后

# 加密和解密的操作

password ENCODE DECODE 8.0 的版本不支持，已弃用。

char_length 字符多少

length 字节多少

AVG 平均值  里面是字符串是没有意义的
SUM  和   里面是字符串是没有意义的
MAX 最大  可以是字符串或者日期
MIN 最小  可以是字符串或者日期
COUNT 作用 计算指定字段在查询结果中的作用   记录数
COUNT(1) 把每一行当成1
COUNT(*)  也可以
COUNT(具体字段) 不一定对的  不计算空值的
sum 计算不考虑null值   avg 计算也不考虑null值  里面使用ifnull(字段值，0)处理

MyISAM 存储引擎  三者效率相同 O1
Innodb 存储引擎 count(*) = count(1) > count(字段)  效率高是因为使用了二级索引 找key_len 小的

GROUP BY
SELECT 中出现一下的非组函数的字段必须声明在GROUP BY 中，反之，GROUP by 中声名的字段可以不出现在SELECT中



WITH ROLLUP 整体的分组  慎重和order by 使用 会报错

如何过滤条件中使用了聚合函数，则必须使用having来替换where，否则报错

having 必须声名在group by 的后面

开发中使用的前提是sql中，使用了group by，针对分组进行过滤的

当过滤条件中有聚合函数时候，则此过滤条件必须声名在HAVING中。
没有聚合函数声名在where中，where效率高于having

# SQL执行原理

FROM 交叉连接
ON 过滤
左外还是右外
WHERE
GROUP BY
HAVING
SELECT 列上的过滤
DISTINCT 去重
ORDER BY
LIMIT

每一个步骤都会产生一个虚拟表

# 子查询

谁的工资比Abel 高

SELECT last_name,salary
FROM employees
WHERE salary > (
			SELECT salary
			FROM employees
			WHERE last_name = 'Abel'
);

外查询（主查询）  内查询（子查询）

内查询先计算
子查询在括号内
放在比较条件的右侧 可读性比较好

单行子查询和多行子查询

分类

单行子查询和多行子查询根据查询出来的条目数去辨别
内查询是否被执行多次，相关子查询和非相关子查询

相关子查询子查询的结果是变化的

子查询有空值，不返回任何行

单行子查询 = !=> < >= <=

多行子查询 in any some all

any 和 some 是同一个 all和 any 经常和单行运算符一起用

聚合函数不能嵌套 mysql 不可以 oracle 可以

子查询作为表用的时候要有别名

查询平均工资最低的部门id

内查询有null值，not in 就不会有结果

关联子查询

结论：在SELECT 除了GROUP BY 和 LIMIT 之外其他位置，都可以声名子查询。

EXISTS 和 NOT EXISTS

自连接效率高于子查询

相关子查询比较简单从外往里面写

# 标识符命名规则

数据库和表名不能超过30个字符，变量名限制为29个
必须只能包含A-Z，a-z，0-9，_
中间不能有空格
数据库中表不能重名，表中字段不能重名
字段没有保留字，如果要用就加上着重号
表和表直接的字段名和类型要保持一致

create database if not exist 数据库名  character set 字符集
// 查看当前使用的数据库
SELECT DATABASE() FROM DUAL;
// 查看指定数据库下的表
SELECT TABLES FROM mysql;
// 查看数据库的创建信息
SHOW CREATE DATABASE 数据库名;
// 修改数据库字符集
ALTER DATABASE 数据库名 character set 字符集
可视化工具 改库名都是创建一个新的库，把数据复制过去，成本比较高
// 删除数据库
DROP DATABASE IF EXISTS 数据库名

CREATE TABLE IF NOT EXIST 表名(
字段名  字段类型  字段长度
)

desc 表名   // 查看表结构
show create table 表名 // 查看表结构

// 数据也会带过来 需要用where 1 =2 过滤数据  别名也可以用就是字段名  也可以关联表
create table 表名
as
select 字段名
FROM 表名

// 修改表  alter table
1， 添加字段  默认添加到表的最后一个字段 
ALTER TABLE 表名  ADD 字段名 字段类型  [FIRST|AFTER 字段名]
2. 修改字段 数据类型 长度
ALTER TABLE 表名 MODIFY 字段名 字段类型 [default 'aaa']
3. 重命名一个字段 有MODIFY行为
ALTER TABLE 表名 CHANGE  字段名 字段类型 新字段名 字段类型 
4. 删除一个字段
ALTER TABLE 表名 DROP COLUMN 字段名
// 重命名表
RENAME TABLE 原数据库名 TO 新数据库名
ALTER TABLE 原数据库名 RENAME TO 新数据库名
// 删除表 不能回滚  日志文件 触发器 备份 释放表空间
DROP TABLE IF EXISTS 表名
// 清空表 清空数据，表结构还在
TRUNCATE TABLE 表名

# COMMIT和ROLLBACK

commit 提交数据一旦执行，数据永久保存不可以回滚

rollback 可以实现数据的回滚，回滚到最近一次commit

// 相同点  都是对数据的删除，同时保留表结构
// 不同点
TRUNCATE 数据不可以回滚，表数据全部清除
DELETE 可以全部清除，数据可以回滚

// DDL 和 DML 的说明
DDL 一旦执行，就不可以回滚，自动COMMIT 不受我们的SET autocommit = false操作影响
DML 默认情况下，一旦执行，也不可以回滚，通过修改参数可以回滚，如在执行DML之前
SET autocommit = false 就可以回滚
// DELETE
COMMIT;
SET autocommit = false;
DELETE FROM 表名
ROLLBACK;
// TRUNCATE
COMMIT;
SET autocommit = false;
TRUNCATE TABLE 表名
ROLLBACK;

mysql8.0 的原子性要么全部成功，要么不成功区别于5.7 体现在进行DDL 操作的时候，执行成功的效果

# DML 添加数据

INSERT INTO emp1 values (字段值,字段值); // 一定要知道声名字段的先后顺序
INSERT INTO emp1(字段名) VALUES(字段值); // 推荐这种  里面的值可以少，但是要一一对应
可以使用逗号同时插入记录  插入多条记录  效率高 比单行一条一条添加快

// 将查询结果插入到表中
INSERT INTO emp1(字段名)
SELECT 查询   查询的字段名要与添加到的字段一一对应  数据范围不一样可能会报错 数据长度不够的风险

# 更新/删除数据

update 表名 set ... where ...
可以实现批量修改

修改同一数据的多个字段 逗号分割   可能存在不成功的情况 收到约束影响

DELETE FROM ... WHERE ...  删除也可能存在不成功的情况，表之间存在外键

回滚可以使用set autocommit = FALSE

# MYSQL 8.0 计算列

CREATE TABLE test(
  a INT,
  b INT,
  c INT GENERATED ALWAYS AS (a+b) VIRTUAL
)

# 去掉字符串中间的空格

replace(字段值,' ','')

# 插入/删除新方法

insert into  表名
select 字段值... union all

DELETE 表1别名，表2别名
FROM 表1 JOIN 表2 ON 条件 WHERE 过滤条件

# 数据类型

1. 创建数据库，表和字段都可以知道字符集 character set 'utf8'

ZEROFILL 零填充

INT(5) 显示宽度配合 ZEROFILL 使用当显示宽度不足五位用0填充自动加上unsigned

8.0.17 以后不要使用显示宽度了

TINYINT 设置取值范围的时候

SMALLINT 统计工厂的固定资产库存数量

MEDIUMINT 客流量

INT 商品编号

BIGINT 双十一的交易量，大型门户网站点击量

存储空间和可靠性

确保数据不会超过取值范围

# 浮点类型

REAL 默认就是double，可以改成float

REAL_AS_FLOAT

浮点数格式：符号，尾数，阶码

非标准写法 FLOAT（M,D）M是标度，D是精度

UNSIGNED 只有一半的

超过整数，报错

超过小数，四舍五入

建议不要使用等号去判断是否相等。

场景：计算化学，分子建模，流体动力学

# 定点数

decimal 最大的取值范围和DOUBLE 一样（注意不是有效取值范围）

底层使用字符串方式去存储

默认decimal (10,0)

场景：金额计算

# 位类型

BIT 2进制默认是1位

BIN（） HEX（）读取方式 2进制16进制

10进制

# 时间类型

year

TIME

DATETIME 和 TIMESTAMP 区别

set time_zone='+9:00'

TIMESTAMP 存储空间小，时间范围小

TIMESTAMP 底层是毫秒值

两个日期比较大小或日期计算时，TIMESTAMP更快

TIMESTAMP和时区有关，用户所处不同时区显示不同结果

DATETIME只能反应插入时候的时区

DATETIME 使用最多

注册时间，商品发布时间不建议使用，最好使用时间戳，因为DATETIME不方便计算。

# 字符串类型

char 默认1 右侧填充空格

varchar 必须指定 M 长度

存储很短用char

固定长度用char

十分频繁的改字段用char

存储引擎

MYISAM 建议用char 长度固定，静态化，数据检索更快

MEMORY 不管定义什么都是char

INNODB 推荐使用varchar 主要影响因素是数据行存储的总量

# TEXT 类型

# ENUM类型

忽略大小写

可以使用索引进行调用

可以添加null，没有限制非空

只能选一个

# SET类型

可以写多个，不可以写不存在的，多个会去重

# 二进制字符串

BINARY 和 VARBINARY 和 char VARCHAR类似 VARBINARY 必须指定长度 BINARY 不指明是1

BIOB 二进制大对象图片，音频，视频

开发中很少把文件存到数据库，都是存路径

OPTIMIZETABLE 功能对表进行碎片整理，空洞

前缀索引少去检索大文本

分离单独表去做，减少主表碎片

# JSON类型

数据交互格式

js JSON可以将JS对象表示一组数据转换成字符串。 js -> $.字段名

# 空间类型

单值和集合类型用的比较少地理特征的生成存储和分析

# 数据类型小结可靠性

整数 INT

小数 DECIMAL

日期和时间 DATETIME

非负数 UNSIGNED

小数超出分开存储

定长用char

长度不超过5000用VARCHAR，超出就用text

# 为什么需要约束

保证数据的完整性

# 考虑方面

实体完整性
域完整性
引用完整性
用户自定义完整性

# 约束

创建表时规定的约束，表创建之后通过语句规定约束表级的强制规定

CREATE TABLE 添加约束
ALTER TABLE 增加约束/删除约束

# 约束的分类

跟进约束数据列的限制

单列约束: 每个约束只约束一列
多列约束: 每个约束可约束多列数据

约束的作用

列级约束：只能作用一个列跟在列的后面
表级约束：可以作用在多个列上，不与列一起，而是单独定义

# 约束的种类

NOT NULL 非空约束
UNIQUE 唯一约束
PRIMARY 主键约束
FOREIGN KEY 外键约束
CHECK 检查约束
DEFAULT 默认值约束

SELECT * FROM information_schema.table_constraints
where table_name = 'employees'

# 非空约束

NOT NULL 默认都可以为NULL 列级约束

# 唯一约束

UNIQUE KEY unique_key (column1, column2) 夹在创建表里面
UNIQUE key 单个唯一约束
UNIQUE key(...,...) 复核唯一约束  会自动添加索引

# 删除约束

删除唯一索引，删除指定唯一索引名
单列就是列名，多列可以是第一个字段名
ALTER TABLE USER DROP INDEX uk_name_pwd
// 查看表索引
show index from 表名称

# 主键约束

primary key 标识表中的一条记录  唯一加非空
一个表只能有一个主键约束
主键名 primary
primary key  (column1, column2) 要求均不为空NULL
ALTER TABLE 表名	ADD primary key （字段名）
ALTER TABLE 表名 DROP primary key  删除主键

# 自增列 AUTO_INCREMENT

一个表里面只能有一个自增长列
必须是整型的
列必须有主键约束或者唯一约束
当我们向主键的字段，添加0或者null 会自动往上添加

ALTER TABLE 表名 modify 主键名 主键类型 AUTO_INCREMENT
// 删除
ALTER TABLE 表名 modify 主键名 主键类 
MYSQL 5.7 
AUTO_INCREMENT 内存中维护一个值 重启就会重新计算

MYSQL 8.0
自增主键的持久化到重做日志中，每次计数器变化都会写入重做日志， redo日志读取记录

# FOREIGN KEY 约束

限制某个表的某个字段的引用完整性

关联字段在主表，必须有主键约束或者唯一约束
默认不是列名，自动生成的
创建 先主后从
删除 先从后主
名可以不一样，数据类型要一样
外键约束也会建索引，只不过是普通索引
删除约束，要手动删除索引
// 表级约束
CONSTRAINT 约束名 FOREIGN KEY （字段名） REFERENCES 主表（主表字段）
ALTER TABLE 表名 ADD CONSTRAINT 约束名 FOREIGN KEY （字段名） REFERENCES 主表（主表字段）

# 约束等级

ON UPDATE CASCADE ON DELETE SET NULL

// 删除外键约束
ALTER TABLE 从表名 DROP FOREIGN KEY 外键的约束名
// 删除外键索引
ALTER TABLE 从表名 DROP INDEX 外键的约束名

外键约束有成本，因为外键约束的系统开销而变得非常慢

阿里开发规范

不得使用外键和级联，一切外键必须在应用层面去解决

外键适合单机，低并发

不适合分布式和高并发集群级联更新强阻塞，更新风暴，影响插入速度

# CHECK 约束 5.7不支持

检查某个字段的值，是符合要求

check(salary > 2000)

# DEFAULT 约束

默认值

# 面试题

not null default '' 或 default 0 不想让表中出现默认值
效率不高，影响提高索引的效果。
AUTO_INCREMENT跟第一条有关
外键约束不能跨引擎使用

# 数据库对象

数据字典：系统表，存放数据库信息的表
存储过程，没有返回值
存储函数，有返回值，用户自定义
触发器，事件的监听器，比如数据备份

# 视图（虚拟表）

更改视图，原表中的数据也会更改，创建视图的根据表叫基表

存储起来的select 语句

小型项目不推荐使用控制数据访问

create view 视图名 as select 语句
show tables;// 查看表和视图
desc 视图名
show table status like '视图名'
show create view vu_emp1
// 删除
drop view 视图名

可以利用视图对数据进行格式化

不能更新视图里面带聚合函数的字段

只有存在1对1的关系的数据才能更新

看表约束

JOIN 了不支持delete ，insert

主要是方便查询使用的，不建议更新，有可能会失败

操作简单

减少数据冗余

数据安全

灵活多变的需求

分解复杂的查询逻辑

视图和表息息相关，需要维护，可读性不好

# 触发器

原子性创建一个触发器，商品信息插入自动触发插入库存数据插入
5.0 支持触发器由事件（行为）触发增删改触发

CREATE TRIGGER 触发器名称
{BEFORE | AFTER }{INSERT | UPDATE | DELETE } ON 表面
FOR EACH ROW
触发器执行语句柄
单条/多条  都可以  复合语句块BEGIN END

NEW 关键字  新插入的数据
SIGNAL SQLSTATE 'HY000' SET MESSAGE_TEXT = '报错信息'
OLD 关键字 老数据

SHOW TRIGGERS;

SHOW CREATE TRIGGER 触发器名;

SELECT * FROM information_schema.TRIGGERS

DROP TRIGGER IF EXISTS 触发器名

# 优点：数据完整性，记录日志，数据合法性进行校验

# 缺点：可读性差，相关数据的变更可能会导致出错

外键不会触发触发器，比如删除父亲，影响儿子

# 存储过程

参数类型 IN 参数 OUT 返回 INOUT

CREATE PROCEDURE 存储过程名(IN | OUT | INOUT 参数名  参数类型)
[characteristics] 
BEGIN  一条可以省略


END

characteristics

LANGUAGE SQL 执行体是SQL
NOT DETRMINISTIC 是否确定执行的结果随机数
CONTAINS SQL 包含SQL NO SQL 没有SQL READS SQL DATA 包含读数据的SQL MODIFIES SQL DATA 包含写数据的SQL
SQL SECURITY {DEFINER | INVOKER} DEFINER 默认有访问权限的用户可以用 INVOKER 创建者和定义者可以用
COMMENT 'String' 注释信息

DELIMITER 指定什么什么结束 $

DELIMITER ; 改回去

# 优点

存储过程可以一次编译多次使用
可以减少开发工作量
连接一次即可，良好的封装性
安全性比较强
可以减少网络的数据传输量

# 缺点

可移植性差不能跨库移植
调试困难
存储过程的版本管理很困难
它不适合高并发的场景

# 创建存储过程

 CREATE DATABASE dbtest15;

 USE dbtest15;

 CREATE TABLE employees
 AS 
 SELECT *
 FROM atguigugb.`employees`

  CREATE TABLE departments
 AS 
 SELECT *
 FROM atguigugb.`departments`

DELIMITER  $

CREATE PROCEDURE select_all_data()
BEGIN
		SELECT * FROM employees;
END $

DELIMITER ;

调用 CALL select_all_data()

DELIMITER  $
CREATE PROCEDURE avg_employee_salary()
BEGIN 
SELECT AVG(salary) FROM employees;
END $
DELIMITER ;

DELIMITER  $
CREATE PROCEDURE show_min_salary(OUT ms   DOUBLE)
BEGIN 
SELECT MIN(salary) INTO ms
FROM employees;
END $
DELIMITER ;

CALL show_min_salary(@ms)

SELECT @ms;

DELIMITER  $
CREATE PROCEDURE show_someone_salary(IN empname VARCHAR(20))
BEGIN 
SELECT salary
FROM employees
WHERE last_name = empname;
END $
DELIMITER ;

CALL show_someone_salary('Abel')

SET @empname := 'Abel';

CALL show_someone_salary(@empname);

@@系统变量 @ 用户自定义变量 := 赋值符号

DELIMITER  $
CREATE PROCEDURE show_someone_salary2(IN empname VARCHAR(20),OUT empsalary decimal(10,2))
BEGIN 
SELECT salary INTO empsalary
FROM employees
WHERE last_name = empname;
END $
DELIMITER ;


SET @empname := 'Abel';
CALL show_someone_salary2(@empname,@empsalary);

SELECT @empsalary;

INOUT empname VARCHAR(25) 先后改变变量的值

调试非常麻烦，逐步排错。

# 存储函数的使用

CREATE FUNCTION 函数名(参数名 参数类型)
RETURNS 返回值类型
[characteristics] 
BEGIN

函数体 肯定有return 语句

END

SEKECT 函数名（参数列表）

只有IN类型（可省略不写）

DELIMITER  $
CREATE FUNCTION email_by_name()
RETURNS VARCHAR(25)
DETERMINISTIC
CONTAINS SQL
READS SQL DATA
BEGIN

RETURN(SELECT email FROM employees WHERE last_name = 'Abel');

END $

DELIMITER ;

特性不加会报错

SET GLOBAL log_bin_trust_function_creators = 1

# 存储过程和函数的查看、修改、删除

SHOW CREATE PROCEDURE 存储过程名
SHOW CREATE FUNCTION 函数名

// 查看存储过程/函数的状态  
SHOW PROCEDURE STATUS [LIKE 'show_max_salary']
SHOW FUNCTION STATUS [LIKE 'show_max_salary']

// 从information_schema.Routines表中查看存储过程和函数信息
SELECT * FROM information_schema.Routines
WHERE ROUTINE_NAME = '存储过程或者函数名' AND ROUTINE_TYPE = 'FUNCTION' // FUNCTION 区分大小写

ALTER FUNCTION|PROCEDURE 存储过程或者函数名 [characteristics]

DROP FUNCTION IF EXISTS 函数名
DROP PROCEDURE IF EXISTS 函数名

INTO 后面不要加括号逗号拼接
date_diff 相隔天数
SET 给变量赋值

# 变量

存储查询或计算的中间结果，或者输出最终的结果数据。

系统变量和用户自定义变量

# 系统变量(重启失效)

服务器，编译MySQL时参数，配置文件

查看系统变量 (opens new window)

全局 global max_connections 最大连接数

会话 session 默认

character_set_client 设置字符集变量的作用域只能时会话级别的还是全局级别的

pseudo_thread_id 标记当前会话的Mysql连接id

// 查看所有或部分系统变量
SHOW GLOBAL VARIABLES;
// 查看会话系统变量
SHOW SESSION VARIABLES; 或者 SHOW VARIABLES;

SHOW GLOBAL VARIABLES LIKE '';

SHOW GLOBAL SESSION LIKE '';

// 查看指定的全局系统变量
SELECT @@global.max_connections;
// 查看指定的会话系统变量
SELECT @@session.max_connections;

// 修改系统变量  配置文件my.ini   
SET @@global.max_connections = 161;//重启失效
SET GLOBAL max_connections = 171;

// 会话系统变量
SET @@session.character_set_client = 'gbk';
SET SESSION character_set_client = 'gbk';

# 用户变量

会话用户变量和局部变量

会话用户变量当前连接生效 @ 开头
局部变量存储过程和函数

// 定义和赋值
SET @用户变量 = 值;
SET @用户变量 ：= 值;
SELECT @用户变量 := 表达式[FROM 等子句]
SELECT 表达式 INTO @用户变量 [FROM 等子句]

// 查看
SELECT @用户变量;

// 局部变量 定义 DECLARE 声名 DECLARE 必须在BEGIN 中的首行,顺序往下排
DECLARE 变量名 类型 [default值] 可以合并
DECLARE a,b INT DEFAULT 0;

// 使用差不多
SET 变量名 = 值;
SET 变量名 ：= 值;
 
SELECT 表达式 INTO 变量名 [FROM 等子句]

// 使用
SELECT a,b,c;

# 程序出错的处理机制

1048 是MySQL_error_code 数值类型错误码

23000 是sqlstate_value 是长度为5的字符串类型错误代码

DECLARE 错误名称 CONDITION FOR 错误码（错误条件）
DECLARE Field_Not_Be_NULL CONDITION FOR 1048;
DECLARE Field_Not_Be_NULL CONDITION FOR SQLSTATE '23000';

DECLARE 处理方式 HANDLER FOR 错误类型 处理语句

# 条件判断语句

IF 表达式1 THEN 操作1
[ELSEIF 表达式2 THEN 操作2]
[ELSE 操作N] 这个可以没有
END IF

CASE 表达式
WHEN 值1 THEN 结果1或语句1(如果是语句需要加分号)
WHEN 值2 THEN 结果2或语句2(如果是语句需要加分号)

ELSE  结果n或语句n(如果是语句需要加分号)
END [case] (如果是放在begin end中需要加上case，如果放在select后面不需要)

CASE 表达式
WHEN 条件1 THEN 结果1或语句1(如果是语句需要加分号)
WHEN 条件2 THEN 结果2或语句2(如果是语句需要加分号)

ELSE  结果n或语句n(如果是语句需要加分号)
END [case] (如果是放在begin end中需要加上case，如果放在select后面不需要)

# LEAVE 跳出循环 [标签名]
标签名 LOOP 
循环执行的语句
END LOOP 标签名

call 存储函数名(@参数名);

标签名 WHILE 循环条件 DO
循环执行的语句
END WHILE [标签名]

1. 初始化条件
2. 循环条件
3. 循环体
4. 迭代条件

DROP 存储过程名 后面没有括号

循环条件 TRUE 不做限制

标签名 REPEAT 
循环执行的语句
UNTIL 结束循环的条件表达式
END REPEAT [标签名]

类似do while 先执行一次  至少执行一次

LEAVE 标签名  
相当于break

ITERATE 标签名
相当于continue;

# 游标

随意定位到某一条记录，面向过程的能力，指针，变量声明的后面

DECLARE 游标名 CURSOR FOR 查询语句

DECLARE 游标名 CURSOR IS 查询语句

OPEN 游标名

FETCH 游标名 INTO 变量名

CLOSE 游标名

会加锁，消耗系统资源。

# MySQL8.0 全局变量的持久化

set persist 设置全局变量

# 窗口函数

更简单支持NoSQL,不依赖chema
隐藏索引/降序索引
JSON支持更完善增加了聚合函数
安全和账户管理 sha2 插件
Innodb 优化
事务数据字典
原子数据定义语句
资源管理分配合理
字符集 utf8mb4 之前是latin1
优化器增强
公用表表达式替换子查询
窗口函数
正则表达式优化
内部临时表
日志记录过滤和写入
备份锁
增强Mysql复制二进制节省空间
去掉查询缓存命中率太低了
只保留 AES_ENCRYPT 和 AES_DECRYPT
\N 不再是NULL

# 窗口函数（将结果置于每一条数据记录中）

CREATE TEMPORARY TABLE 表名  后面是查询语句

分组统计，对每一天记录进行计算。对分区数据进行统计和分析不改变原来的数据

静态窗口：窗口大小固定，不会随着记录的不同而不同
动态窗口: 窗口大小不固定，随着记录的不同而不同

函数 OVER(PARTITION BY 字段名 ORDER BY 字段名 ASE|DESC)
函数 OVER 窗口名 WINDOW 窗口名 AS (PARTITION BY 字段名 ORDER BY 字段名 ASE|DESC)  简洁写法

OVER 窗口范围

PARTITION BY 分组字段可以省略

ORDER BY 排序字段

FRAME 子句定义规则，滑动窗口

ROW_NUMBER() 行号
RANK() 排序字段一样行号则一样，跳过重复编号
DENSE_RANK() 排序字段一样行号则一样，不跳过重复编号
PERCENT_RANK() 等级值百分比 rank-1/rows-1 rank 序号数 rows 总记录数
CUME_DIST() 函数小于或者等于的比例
LAG（expr，n）前n个值 LAG（price，1）
LEAD（expr，n）后n行值
FIRST_VALUE(expr) 第一个值
lAST_VALUE(expr) 最后一个值
NTH_VALUE(expr) 指定第一个的值
NTILE（n）分几组尽量均分，均分不了，前面多

# 公用表表达式

可以复用的子查询

WITH CTE名称
AS (子查询)
SELECT | DELETE | UPDATE 语句

WITH RECURSIVE
AS (子查询)
SELECT | DELETE | UPDATE 语句

替代子查询，多次被引用

# mysql优化

# suo'yisuoyi克隆虚拟机

修改mac地址右键虚拟机，找到mac地址点生成
主机名

vim /etc/hostname
reboot # 重启虚拟机

ip地址动态ip 不需要修改

vim /etc/sysconfig/network-scripts/ifcfg-ens33
systemctl restart network

UUID 调整

# centos6 和 centos7 的区别

6是iptables 7是firewalld
启动服务 6是service 7是systemctl

# mysql卸载的一些命令

rpm安装

rpm -qa | grep -i mysql # -i 忽略大小写
sytemctl status mysqld.service # 查看运行状态
sytemctl stop mysqld.service # 停止运行状态
yum remove 查看到的包名
find / -name mysql # 全局搜索mysql
最后删除etc下面的my.cnf

有依赖顺序

rpm -ivh  i 是install  v 是提示信息  h hash 进度条

cat /var/log/mysqld.log
systemctl enable mysqld # 开机自启
alter user 'root'@'localhost' identified by 'abc123' #8.0

ALTER USER 'root'@'%' INDENTIFIED WITH mysql_native_password By '新密码'

mysql8.0 校验密码插件

install plugin validate_password SONAME 'validate_password.so'

# 字符集（CHARSET）

show variables like '%character%';
character_set_server=utf8  # 设置字符集 在my.cnf
show create table 表名
表的字符集都和数据库保持一致
alter database dbtest1 character set 'utf8'   数据库字符集修改
alter table 表名 convert to character set 'utf8'  表字符集修改
保证数据是可改的

服务器级别
数据库级别
表级别
列级别

uft8 3个字节 utf8mb4 4个字节

# 比较规则（COLLATE）

SHOW CHARSET;

比较大小，排序操作

show table status from 表名

只要保证发送的和client 一样返回的和results 一样就行

set names utf8; # 三个都设置成一样的
[client]
default-character-set=utf8 # 配置文件里面

# SQL大小写规范

windows系统默认大小写不敏感

linux系统默认大小写敏感

show variables like '%lower_case_table_name%';
0 大小写敏感  1大小写不敏感   2 只有查找是小写

数据库名，表名，表的别名，变量名区分
关键字和函数不区分
列和列的别名不区分

lower_case_table_name=1

mysql 8 要先删除数据/var/lib/mysql

# 建议

关键字，函数名大写
数据库名，表名，表别名，字段名，字段别名小写
SQL语句分号结束

# sql_mode 合理设置

sql语法，数据验证检查

5.7 宽松模式

8.0 严格模式不允许零日期 0000-00-00 00:00:00

select @@session.sql_mode;

SET SESSION sql_mode = ''; # 清空

临时设置和永久设置在my.ini

sql_mode=ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION

# MYSQL数据目录

表ibd 格式

bin目录可执行文件

linux 下不一样

show variables like 'datadir';

相关命令 /usr/bin 或者 /usr/sbin 客户端程序和服务端程序的命令
配置文件 /usr/share/mysql-8.0 或 /etc/my.cnf
存储引擎把表存在磁盘上

# 默认数据库

mysql 用户账户和权限信息
information_schema 维护其他数据库的信息表，视图，触发器，列，索引
performance_schema 服务的各类性能指标
sys 监控mysql性能，视图描述

# 5.5.7~5.6.8 表数据

ibdata1 系统表空间或者 ibd 独立表空间
db.opt 是字符集或者关联关系 frm 表结构信息

[server]
innodb_file_per_table=0   0系统表空间  1 独立表空间

# 8.0 表数据

表结构和表数据合一只有ibd 方便关联

证明：ibd2sdi 工具

ibd2sdi --dump-file=文件.txt 文件.ibd

视图只有frm

# 5.7 MyISAM

frm MYD MYI 数据和索引分开存储

# 8.0 MyISAM

sdi MYD MYI 数据和索引分开存储

# 用户与权限关联

root用户创建普通用户，保证安全性。

mysql -h 主机地址 -P 3306 -p 密码 数据库 -e "sql语句"

create user '用户名' identified by '密码';
user 和 host 作为联合主键
权限有限
update user set user = '用户名' where user = '用户名';
flush privileges;
drop user '用户名'; # 不需要flush
@ 用于指定host的用户
不推荐使用delete，容易有残留

# 密码

SET PASSWORD = PASSWORD('123456'); # 8.0 不支持

alter user user() identified by '新密码';
SET PASSWORD = '新密码';
alter user '用户名'@'host' identified by '新密码'; # DDL操作
SET PASSWORD FOR '用户名'@'host'= '新密码';

8.0

密码过期

ALTER USER user PASSWORD EXPIRE; # 过期能登录，不能查询
# 配置文件
default_password_lifetime = 0  不过期  N单位天

密码重用设置

数量和时间指定

SET PERSIST password_history = 6; # 6次
SET PERSIST password_reuse_interval = 365;  一年

密码强度评估

# 权限管理

分内的事创建的用户没有给别人赋予权限的能力如需要添加WITH GRANT OPTION

权限：表，列，过程

授予权限2种

授予角色权限，再授予角色
直接授予用户

grant select,update on 数据库名.* to '用户名'@'host';
grant delete on 数据库名.* to '用户名'@'host'; 权限叠加
grant all privileges on *.* to '用户名'@'host'; # 所有权限
show grants;
show grants for '用户名'@'host';
REVOKE 权限 ON 数据库名.* FROM '用户名'@'host';

横向能看见哪个表

纵向能操作哪个表

# 权限表

# 角色管理（mysql8.0）

create ROLE '角色名'@'%' 默认为%;
GRANT 权限 ON 数据库名.* to '角色名';
GRANT all privileges ON 数据库名.* to '角色名';
SHOW GRANTS for '角色名';
REVOKE 权限 ON 数据库名.* FROM '角色名';
DROP ROLE '角色名';

GRANT '角色名' TO '用户名'; # 需要激活
SELECT CURRENT_ROLE(); # 查看
SET default role '角色名' TO '用户名'; # 激活 需要退出

SET GLOBAL activate_all_roles_on_login=ON # 设置所有角色登陆自动激活

REVOKE '角色名' FROM '用户名'; # 回收角色，需要退出

# 强制角色 不能回收或者删除
[mysqld]
mandatory_roles = '角色名'

# 配置文件

最后声明生效，如果配置一样，命令行大于启动命令

# 逻辑架构

服务端程序使用mysqld

连接池分TCP连接池和线程连接池，TCP连接池控制连接数，线程连接池用来做认证和授权，长连接模式复用TCP连接

解析器，生成语法树

优化器，生成执行计划，计算成本，选取，投影，连接

查询缓存，8.0去掉了

引擎，负责了mysql中的数据进行提取和存储，对物理服务器的底层进行操作。show engines；

# SQL执行流程

查询缓存 key-value 形式存于内存鸡肋命中率低必须完全相同操作才能命中缓存。

now函数不缓存
更新压力大，最好在静态表中，极少更新 query_cache_type=2 按需使用
SQL_NO_CACHE 不查询缓存

show status like '%Qcache%';

解析器词法分析，语法分析

优化器确定SQL语句的执行路径全表检索索引检索选择最好的执行计划

逻辑优化等价变换

物理优化索引表连接方式

执行器判断是否有权限调用存储引擎API

# 执行原理（区别就是有没有查询缓存）

开启profiling 默认不执行

select @@profiling;
SET @@SESSION.profiling;
SET profiling = 1;
show profiles; # 全部的
show profile profilefile; # 最近的
show profile for query 6;  # 指定某次
show profile cpu,block io for query 6; # 指定某次 cpu和iO的开销

# oracle SQL执行流程

缓存了执行计划，和mysql不一样，数据字典缓冲区，绑定变量来提高命中率，sql优化比较困难

Innodb存储引擎是以页为单位管理存储空间，占用内存来作为数据缓冲池，减少硬盘IO

会对频次高的热数据进行加载，每次都是完整的页加载，预定去多加载前后页

# 缓冲池读取数据

show variables like 'innodb_buffer_pool_size'; // 8.0 查看缓存池大小
SET global innodb innodb_buffer_pool_size = 268435456; // 设置缓存池大小

show variables like 'innodb_buffer_pool_instances'; // 数据缓存池实例  多个人就会分区降低了性能

# 存储引擎

存储引擎就是指表的类型，表处理器，不同存储引擎，文件的结构不一样

接收指令，对表的数据进行提取和写入

show engines; # 支持的引擎   8.0 默认innodb  XA 分布式事务  Savepoints 保存点 部分事务回滚
show @@default_storage_engine; # 查看默认的存储引擎  5.5 之后改成innodb  
SET default_storage_engine=MyISAM; # 临时修改

修改配置文件

innodb 支持外键，支持事务，行级锁，崩溃恢复功能，适用于更新和删除，适用于巨大数据量，效率差一些，内存要求高，索引即数据，8.0都在ibd中

MyISAM 5.5 不支持外键，不支持事务，适用于新增和查询，适用于小数据量，表锁，数据统计有额外的常数存储，查询效率很高。

阿里巴巴，淘宝 Xtradb 性能更好替代了innodb

Archive 数据存档插入之后不能修改，只能插入和查询，支持索引，行级锁。AUTO_INCREMENT,ZLib压缩库

.ARZ文件历史记录的存储

BlackHole 引擎丢弃写操作，读操作返回空，记录一个BlackHole表日志

CSV 引擎以逗号分割各个数据项数据交换机制 .csv文件，excel和文本编辑器读取

Memory 引擎，数据存储到内存里面，响应快，数据会丢失，长度要不可变，hash索引和B+树索引

hash索引等值比较快，范围比较慢，表的大小受到限制，目标数据小，频繁访问。丢了也无所的数据。

Federated引擎，访问远程表，默认是禁用的

Merge集合，管理多个MyISAM的表集合

NDB引擎，MySQL集群专用引擎，MySQL CLuster 分布式集群

# 索引

目录，页码，快速定位，二叉树 log2为底n的对数，减少IO次数

数据结构排好序的数据结构跟存储引擎有关 innodb是b+树，索引最多16个，长度256字节

降低IO
数据的唯一性
加速表与表之间的连接
减少查询中分组和排序的时间
创建索引和维护索引耗费时间数据量太大
占磁盘空间存储在磁盘上
降低更新表的速度

先删除索引，再更新，再创建索引小技巧

数据存储的底层是数据页，默认大小16KB

主键有序，二分法
其他列，最小记录开始依次遍历的单链表
多个页，从第一页双向链表索引应运而生

数据页之间是双向链表，伴随着记录移动，页分类，主键值递增

出现目录项 key是最小的主键值

目录页出现了数据页页目录出现了数据页也有页目录目的是使用二分法

B+树叶子节点根节点非叶子节点树的层次越低IO次数越少

compact行格式

# 聚簇索引

针对于主键构建的b+树

数据存储方式叶子节点（完整的用户记录）索引即数据，数据即索引数据和索引是一个整体

页内单项链表

页和页之间双向链表

目录项记录的页双向链表

不需要create index

数据访问快排序查找和范围查找快省IO操作

主键是自增的插入速度跟插入顺序有关主键不可更新二级索引需要访问两次索引查找

只能有一个聚簇索引非空的唯一索引替代主键隐藏列选用有序的顺序id

# 非聚簇索引（二级索引/辅助索引）

针对于非主键构建的b+树 c2 加主键

可以有多个

找c3 回聚簇索引查找要进行回表

非聚簇索引更新/删除/新增效率高聚簇索引还需要维护数据行的物理顺序，而非聚簇索引只需要更改索引

联合索引两个字段进行索引先c2再c3

注意事项

根页面的位置万年不变从上往下下沉
内节点中目录项记录是唯一的二级索引内节点也保存了主键
一个数据页最少要存两个

MyISAM 索引和数据分开存储不排序全是非聚簇索引主键加数据记录地址

主键不建议过长，会导致树过长自增主键最好

缺点

空间上 16kb的数据页存储空间大
时间上增/删/改记录移位，页分裂，页面回收索引从小到大的顺序

InnoDB使用了多种策略来决定淘汰哪些页：

LRU（最近最少使用）列表：InnoDB维护一个LRU列表，其中包含所有当前缓冲的页。最近使用的页在LRU列表的前端，而最少使用的页在列表的尾端。当空间不足时，将尾端页淘汰。
页面脏页检查：在可用空间不足时，InnoDB还会检查LRU列表中的页面是否是脏页（已修改但未写入磁盘的页）。如果是脏页，则会优先进行检查点操作，将脏页写入磁盘，然后再进行页面淘汰。
合并插入缓冲（Change Buffer）：对于非唯一索引页，如果插入或更新不会造成页的直写（直接将改动写入磁盘），可以使用合并插入缓冲区来减少I/O操作。
自适应哈希索引：InnoDB还会利用自适应哈希索引来更快地访问频繁使用的页。

如果遇到页面淘汰频繁或发生错误，可能需要调整InnoDB的缓冲池大小，优化工作负载，或考虑增加服务器的物理内存。

# 数据结构的合理性

磁盘IO的操作次数

# 全表遍历

最差

# Hash结构

相同的输入可以得到相同的输出

hashmap 操作是O1级别 key进行hash

从效率上是hash快

hash碰撞产生链表

Redis核心就是hash表

memory 等值查询用

8.0 默认开启

# 二叉搜索树

不太理想

# AVL树

二叉平衡搜索树，它的左右两个树的高度差不会超过1，高度较高

M叉树高度变小

# B-树

多路平衡查找树

关键字和叶子节点的信息都放在磁盘块2

# B+树

多路搜索树适合索引系统 mysql官网看见b树就是b+树

B+树的查询效率更稳定 b树不稳定

B+树的查询效率更高 B+树目录项的不存数据，更加矮胖，叉多

范围查找 B+树链表遍历 B树要树进行遍历

# R树

geometry 数据类型空间解决高维空间的搜索问题

# InnoDB数据存储结构

索引是在存储引擎中的，存放格式不同 Memory 内存级别的不用磁盘

# 页

默认大小16KB

在数据库，不论读一行，还是多行，都是将这些行所在的页进行加载，也就是说，数据库管理存储空间的基本单位是页(Page)，数据库IO操作的最小单位是页

show variables like '%innodb_page_size%';

不在物理结构上相连，页之间双向链表，数据页内容单向链表，每个数据页都会生成一个页目录，为了用二分法

一个区会分配64个连续的页,区是1M空间

段是数据库中的分配单位，不同类型的数据库对象以不同的段形式存在。

表空间是逻辑容器，系统表空间和独立表空间

# 页的内部结构

数据页，系统页，Undo页，事务数据页 16KB

# File Header

FIL_PAGE_TYPE

校验和

比较两个页相等，根据算法算出来一个较短的值，节省比较的时间

头部和尾部不相等，回滚或继续写入

FIL_PAGE_LSN

页面被最后修改时的日志位置

# 空闲空间

剩下空间，越来越小

# 用户记录

指定行格式，形成单链表数据如何记录记录头信息

记录头信息

delete_mask 0 没删除 1 删除重新排序消耗性能垃圾链表可重用空间删除新增时会重用

min_rec_mask 非叶子节点最小记录标记为1 自己插入的都是0

record_type 记录类型

heap_no 当前记录在本页中的位置

n_owned 页目录每个组，存储了多少记录

next_record 地址偏移量最小记录指向了第一条记录最大记录是 0

# 最小和最大记录

# Page Directory 页目录

分成几个组，包括最小和最大，不包括已删除

页目录用来存储每组最后一条记录的地址偏移量

# 页面头部

# Innodb行格式

SELECT @@innodb_default_row_format; # dynatic

# 变长字段长度列表

存储到底存了多大的数据，顺序反过来

# NULL值列表

不考虑非空和主键

# 记录的真实数据

# Dynamic和Compressed行格式

# Redundant行格式

字段长度偏移列表

记录头信息

不一样

# 区,段,碎片区

保证一段是顺序存储，不是所有

5.7 默认6个页 idb 96k

8.0 不是有表结构多了一个页

show variables like 'innodb_file_oer_table';

内部系统表数据字段

不能访问，information_schema 提供查看接口

# 索引

nnoDB 中的哈希索引其实也就是自适应哈希索引（Adaptive Hash Index）

InnoDB 会自动检测某些索引值是否使用的非常频繁

通过自动创建自适应哈希索引来提高查对热点数据的访问速度，特别是在频繁执行等值查询的情况下

# 创建索引

普通索引

最左前缀原则

不精准，速度快

# 删除索引

# 降序索引（8.0）

支持降序排列

这样就不推荐了 799了正常就是5

# 隐藏索引（8.0）

# 索引的设计原则

# 适合创建

字段的数值有唯一性限制

频繁作为WHERE 查询条件的字段

经常group by 和 order by 的字段

group by或者order by后面的字段添加索引，由于索引是排好序的，所以建立索引就等同于在查询之前已经是排好序了

UPDATE、DELETE的WHERE 条件列

DISTINCT字段需要创建索引

连接表的数量尽量不要超过三张，对where 条件创建索引，对用于连接的字段创建索引，类型必须一致
使用列的类型小的，创建索引

使用字符串前缀创建索引

区分度高(散列性高)的列适合作为索引

使用最频繁的列放到联合索引的左侧

在多个字段都要创建索引的情况下，联合索引优于单值索引

# 不适合创建

where中使用不到的字段，不要设置索引
数据量小的表最好不要使用索引

有大量重复数据的列上不要建立索引

避免对经常更新的表创建过多的索引

不建议无序的值作为索引

删除不再使用或者很少使用的索引

不要定义冗余或者重复的索引

# 性能分析工具

响应时间更快，吞吐量更大 explain 和 show profiling

# 查看系统参数

# 统计sql查询的成本

show status like 'last_query_cost';

1 就是一个数据页

# 定位执行慢的SQL：慢查询日志

show variables like '%slow_query_log%';// 查看是否开启慢查询
set global slow_query_log = ON;
show variables like '%long_query_time%';// 查看慢查询的时间阈值
set global long_query_time=1;// 新建会话生效
set session long_query_time=1;// 当前会话生效
show global status like '%slow_queries%';// 查看有多少

文件配置写法

mysqldumpslow -help
mysqldumpslow -a -s t -t 5 文件位置/文件
-a 不模糊参数
-s t 根据时间排序
-t 5 top5

# SHOW PROFILE 查看SQL执行成本

set profiling= ON;
show variables like 'profiling';
show profiles;
show profile cpu,block io for query 3;

# EXPLAIN 分析查询语句

查询优化器可能对涉及的子查询的语句进行重新，转变为多表查询的操作

union 有临时表 union all 没有

show warnings // 优化器优化后的结果

# 索引优化与查询优化

全值匹配我最爱
最佳左前缀法则

主键插入顺序

计算、函数、类型转换导致索引失效
类型转换导致索引失效
范围条件右边的列导致索引失效
不等于索引失效
is null 可以使用索引，in not null 不可以
like 以 %开头失效
or前后出现非索引列
数据库的字符要统一使用utf8mb4

内连接是可以决定谁作为驱动表，谁作为被驱动表出现的

被驱动表有索引，成本低

小表驱动大表

# 覆盖索引

一个索引包含了满足查询结果的数据就叫做覆盖索引。

索引列+主键 = SELECT 到 FROM 的查询列

# 索引下推

减少了回表的次数，针对于联合索引，过滤完再回表，有字段 ICP

不使用索引下推

# 补充优化

# 数据库设计

# 主键设计

自增id

可靠性不高自增回溯问题
安全性不高可以猜测用户数量
性能差服务器端生成
交互多 last_insert_id() 多一次交互
局部唯一

业务主键

推荐全局唯一，单调递增。

UUID 在8.0 推荐因为可以时间的高低换位

淘宝订单号时间+ 去重字段 + 用户id 后几位

# 数据库设计

节省数据的存储空间
能够保证数据的完整性
方便进行数据库应用系统的开发

冗余度较小、结构合理

# 范式

数据库设计的基本原则

阶数越高冗余度

一般也就巴斯-科德范式

# 第一范式

原子性，字段值不可再次拆分，主观性的

# 第二范式

满足数据表里面得有主键，非主键字段完全依赖于主键，不能只依赖于主键的一部分，一张表只表达一个意思。

# 第三范式

非主键字段不能依赖于其他非主键字段。他们之间必须相互独立。直接相关，消除冗余。

范式表关联多了，降低了查询效率。冗余可以反范式化。

# 反范式化

业务优先，增加冗余字段。

浪费空间，修改部门，全部的冗余字段也要修改。要不然会数据不一致。而且存储过程去更新会消耗，系统资源。并且数据量小，会使得数据库设计变复杂。

不需要经常更改的字段
查询的时候不可或缺

历史快照，订单收货信息。

数据库设计的目的是捕获数据，数据仓库是分析数据。数据仓库因为是历史数据，可以考虑反范式化。

# 巴斯-科德范式

只有一个候选键，或者每个候选键都是单属性。不存在部分依赖

仓库名，管理员，物品名，数量这个就不是BCNF

主键和候选建有依赖关系不行

学生、导师、学科、CPA

# 第四范式（很少了）

平凡的多值依赖整个表就是一组一对多的关系。

# 第五范式（完美范式）

消除不是由候选键所蕴含的连接依赖。理论中

技术服务于业务

# ER模型三要素

实体，属性，关系

可以独立存在的叫实体，不可再分的是属性。

# 数据表的设计原则

数据表的个数越少越好
数据表的字段个数越少越好
数据表中联合主键的字段个数越少越好
主键和外键越多越好

# 结构设计

冷热数据分离，减少磁盘IO，增加热数据内存缓存的命中率，更有效的利用缓存，避免读入无用的冷数据。
增加中间表，经常联合表查询，增加查询效率。不是频繁更新。
增加冗余字段
优化数据类型，最小的数据类型。字段大，空间大，每一页索引存储的数量就少，IO次数也就越多。
LOAD DATA INFILE 比insert 导入快。

分析表/检查表/优化表

ANALYZE TABLE 表名; -- 更新表的分享，比如show index from 表名;里面的区分度。
CHECK TABLE 表名; -- 查看表有没有问题，损毁。
OPTIMIZE TABLE 表名; -- 优化表 varchar blob text 优化

mysqlcheck -o 数据库表名 -uroot -p

服务器语句超时处理

创建全局通用表空间

8.0 隐藏索引进行调优看查询参数。

# 事务

InnoDB 支持事务

要么都成功，要么都失败

原子性无中间状态

一致性合法性符合现实

隔离性不能被其他事务干扰

持久性事务一旦提交数据就是永久性的

# 状态

活动的
部分提交的
失败的
中止的
提交的

# 事务基础知识

开启事务
一系列DML操作
事务结束的状态提交commit / 中止 rollback

# 显式事务

开启事务 start transaction; begin;
start transaction 后面 read only，read write（默认），with consistent snapshot
保存点 savepoint

# 隐式事务

autocommit 自动提交默认是ON
SET autocommit = OFF; 关闭自动提交 DDL无效

# 事务分类

扁平事务
带有保存点的扁平事务
链事务 set @@completion_type= 1；
嵌套事务
分布式事务

# 事务的隔离性

脏写事务A 修改了事务B未提交的数据

脏读事务A 读取了事务B未提交的数据

不可重复读事务A 读取了2次数据不一样少了可以算这里面

幻读事务A 读取了2次行数多了删除不算

读未提交最差不怎么选
读已提交解决了脏读 oracle 默认
可重复读
串行化

# MySQL支持的隔离级别

show variables like 'tx_isolation';
show variables like 'transaction_isolation';
select @@transaction_isolation;

# 事务日志

重做日志 redo日志保证持久性

回滚日志 undo日志保证一致性

redo 日志降低了刷盘频率

redo 日志占用空间小

redo 日志是顺序写入磁盘的。

redo 日志在事务执行过程中，不断的写入和 binlog 并不相同 binlog只有在事务提交才记录。

时间花费从小到大 0 < 2 < 1

Innodb的更新操作采用的是 Write Ahead Log 预先日志持久化先写日志，再写入磁盘，中间经过redo log buffer

# Undo日志

更新数据的前置操作，写入undo log 撤销日志回滚日志

回滚数据只是逻辑层面的，物理层面的不会改变，不会删除创建的数据页
MVCC 多版本并发控制

回滚段，一个回滚段1024个 undo log segment

insert undo log 直接删除

update undo log 不能直接删除，undo log 链表中，等待清除线程删除

# 锁

保证事务的隔离性，保证数据的一致性和完整性。

相同记录

锁结构和事务相关排队

lock tables 表名 write; // 写锁
lock tables 表名 read; // 读锁
unlock tables; // 解锁
show open tables where in_use > 0;// 查看锁

意向锁行级锁和表级锁共存

意向锁排外不排内相当于表级阻塞给整个表加了一个标识

自增锁表级锁

单行添加
批量添加
混合添加

对应三种模式 innodb_auto_lock_mode 0 1 2

元数据锁

表结构变更
crud MDL 读锁变更操作 MDL 写锁

# 记录锁（行锁）

# 间隙锁 gap锁

防止幻影记录，取区间加锁，在两个数值之间。大于最大的值，到正无穷

select * from performance.schema.data_locks;

聚簇索引有个无穷小和无穷大指向前面和最后的数据有可能出现死锁。

临建锁结合了记录锁和间隙锁 Innodb默认是临建锁

插入意向锁 Innodb规定事务在等待的时候也需要在内存中生成一个锁结构。并不阻止别的事务继续获取该记录上任何类型的锁。

# 页锁

介于表锁和行锁之间，也会出现表锁和锁升级。

# 悲观锁

# 乐观锁

版本号或者时间戳

读写分离强制读取主机

# 显式锁/隐式锁

插入一条数据，保护这条数据叫隐式锁。

事务2看事务1是否是活跃状态，如果是的话，帮助事务1构建一个锁结构。自己阻塞一下。

非聚簇索引 page headers 里面有个最大事务id，这个id和事务二比较，小的话就全部都提交了

延迟加锁隐式锁转成显式锁

# 全局锁

整个数据库实例加锁，当你需要让整个库处于只读，全库逻辑备份。

Flush tables with read lock

# 死锁

# 锁的内存结构

show status like '%innodb_row_lock%';

# MVCC

多版本并发控制依赖于隐藏字段、Undo log 和 Read View

一致性读快照读看见被事务更改之前的值

# 日志

flush logs; // 重新生成binlog日志

mysqlbinlog -v "/var/lib/mysql/binlog/atguigu-bin.000002"

show variables like '%log_bin%';