【MySQL】表的约束(主键、唯一键、外键等约束类型详解)、表的设计
目录
1.数据库约束
1.1 约束类型
1.2 null约束 — not null
1.3 unique — 唯一约束
1.4 default — 设置默认值
1.5 primary key — 主键约束
自增主键
自增主键的局限性:经典面试问题(进阶问题)
1.6 foreign key — 外键约束
1.7 check约束(了解)
2. 表的设计
一对一
一对多
多对多
1.数据库约束
- 约束是数据库针对里面的数据有一定的要求,有些数据认为是合法数据,有些数据是非法数据。这里给出的一组"检验规则”。
- 数据库自动的对数据的合法性进行校验检查的一系列机制。目的是为了保证数据库中能够避免被插入/修改一些非法的数据。
1.1 约束类型
- not null — 指示某列不能存储 NULL 值。 —— 必填项
- unique — 保证某列的每行必须有(是)唯一的值,不能重复。 —— 学号,手机号,身份证号
- default — 规定没有给列赋值时的默认值。—— 默认值
- primary key — not null 和 unique 的结合。确保某列(或两个列多个列的结合)有唯一标识(既不能为空,也不能重复),有助于更容易更快速地找到表中的一个特定的记录。 —— 主键
- foreign key — 保证一个表中的数据匹配另一个表中的值的参照完整性。 —— 外键
- check — 保证列中的值符合指定的条件。对于MySQL数据库,对CHECK子句进行分析,但是忽略 check子句。在mysql 5版本中,不支持,写了不会报错,但是没有实际效果。这里不做过多介绍。
设置约束条件大部分都是在创建表的时候。
1.2 null约束 — not null
创建表时,可以指定某列不为空。未指定:此时表可以随意插入空值。
可以使用 alter table给现有的表加约束,但用起来麻烦(支持的功能多),很少会使用。不做过多介绍。在创建表的时候要设计好表的属性。这里我们为了方便演示每次删了重新创建。
创建时,指定id 列为not null(不能为空),如果尝试插入或者修改为空,都会报错。
1.3 unique — 唯一约束
唯一:插入/修改数据的时候,会先查询,看看数据是否已经存在。如果不存在,就能够插入/修改成功,如果存在,则插入/修改失败。
unique没约束之前,可以插入多条重复的记录
unique约束之后,指定id列为唯一,不能插入重复记录
- 报错:重复条目。数据库怎么知道的1存在?
- 其实是在插入或者修改之前先触发一次,查询操作(正常插入直接插入,添加约束插入需要先查询一下),这里是多了个查找数据的成本。所以有unique 的约束插入/修改要比没有unique的约束插入/修改要慢一些。数据库的查询操作并不是像线性遍历的方式,一条一条的查,有更快的方式,但是还是有查询这个行为。
- 数据库引入约束之后,执行效率会受到影响,可能会降低很多。
- 意味着数据库是比较慢的系统,也比较吃资源的系统。在部署数据库的服务器,它很容易成为整个系统的“性能瓶颈"。
- 可靠数据角度:mysql数据库处理的数据多,需要更多的时间更可靠的去处理数据。俗话说慢工出细活。
- 性能效率角度:在现在很多高并发、大数据的情况下,mysql数据库的表现就差强人意了。根据实际情况,可以搭配redis数据库使用提高数据存储和访问。
1.4 default — 设置默认值
可以通过default 约束,来修改默认值。默认的默认值是空。
在insert 指定列插入的时候,其他未被指定到的列按照默认值来填充。
没有设置默认值,默认值为null
设置默认值;插入时,name列不做指定,默认值无名氏
1.5 primary key — 主键约束
- 主键,一行记录在表中的"身份标识",手机号码、身份证号码、学号等
- 要求唯一且不能为空,主键 = unique + not null ,
- 一张表里只能有一个primary key。一个表里的记录,只能有一个作为身份标识的数据。
- 创建主键的时候,可以使用一个列作为主键,也可以使用多个列作为主键(复合/联合主键,很少用)
- 看起来和not null + unique是类似的,同样对于带有主键约束的表,每次插入数据/修改数据之前要都要先查询操作,空的和重复的不会插入/修改。
- mysql会把带有unique 和 primary key的列自动生成索引,从而加快查询速度。(后续会讲解)
自增主键
如何保证主键唯一,mysql提供了一种"自增主键"这样机制。
- 主键经常会使用int / bigint类型。对于整数类型的主键,常配搭自增长 auto_increment 来使用。插入数据对应字段设置为null,mysql服务器会自动分配。从1开始,依次递增的分配主键的值。
- 自增主键 primary key auto_increment。程序猿插入数据的时候,不必手动指定主键约束的值了,不用考虑重复的情况了。
给自增主键插入数据的时候,可以手动指定一个值,也可以让mysql服务器自行分配。如果让mysql服务器自行分配,在insert语句的时候,把id设为null 即可了。
mysql服务器自行分配:在insert语句的时候,把id设为null 即可了。
自增主键可以理解为:mysql服务器给每个表维护了一个全局变量,每次自行分配一个id,全局变量自增,下次分配接着上次的继续分。
手动指定:
- 分配的时候把4-99序号跳过了,浪费了一部分序号,但没浪费空间。
- 这里手动指定是可以插入4-99序号,但是mysql服务器不能自动分配4-99序号。
- 如果mysql重复利用了中间的值,增长一定数据之后,就可能和100重复,因此mysql就需要时刻记得当前哪些id被分配了,哪些是空闲的,这么搞也能实现,太麻烦,效率也低。
- 自增主键,相当于使用了一个变量,来保存了当前表的id的最大值,后续分配自增主键都是根据这个最大值来分配的。如果手动指定 id,也会更新最大值。
自增主键的局限性:经典面试问题(进阶问题)
- 此处这里自增主键 自动分配 id,是有一定局限性的。
- 自增主键在单个mysql服务器,能很好的使用。
- 如果是一个分布式系统,有多个mysql服务器构成的集群,这时依靠自增主键就不行了。
- 面临的数据量大(大数据),客户端的请求量比较大(高并发),一台服务器存储管理不下,需要多台机器(分布式)。例如某一个表或者某几个表,数据量特别大。此时来了一个新的商品,进行分库分表。此时新增商品,id如何分配呢?肯定是要把这个记录保存在某个数据库的表中,但是如何保证这里的id和另外两个数据库中id不重复呢?
- 分布式系统中生成唯一 id的算法,实现这个算法的具体方式有很多,我们通过下面公式思想实现。
- 分布式唯一id = 时间戳 + 机房编号/主机编号 + 随机因子
- +是指字符串拼接,不是算术相加。拼出来的结果是一个比较长的字符串。
公式解读:
- 时间戳:如果添加商品的速度比较慢,直接使用时间戳表示就够了,
- 机房编号/主机号:但如果一个时间戳内,添加了多个商品,添加的多个商品,是要落到不同的主机上的。保证同一时间之内,添加到不同主机上的商品的编号,是不同的了。
- 随机因子:同一个ms之内,给同一个机器上添加的多个数据。随机因子这里有一定概率生成相同的因子,但是概率比较小,可以忽略不计。
1.6 foreign key — 外键约束
描述两张表之间相互关联,这个关联就是外键约束。外键用于关联其他表的主键或唯一键。
- 保证指定父表的列是带索引的。创建主键约束(PRIMARY KEY)、唯一约束(UNIQUE)、外键约束(FOREIGN KEY)时,会自动创建对应列的索引。
- 外键约束位置是在描述完,全部列之后写的。前面其他约束则是紧跟对应列的后面。
先创建两张表,class、student。
- 如果不写外键约束,此时student中的classId列与class中的classId列将没有任何关联。
- references,JavaSE中引用(类型),此处表示了当前这个表的这一列中的数据,出自于另一个表的哪一列。
- 此时student表中classId列的每行记录,都在class表的classld列中存在。
- class表中的数据,约束了 student表中的数据。
- 把class表称为“父表”(parent),约束其它表的表。
- 把student表称为“子表”(child),被其它表约束的表。
- 指定外键约束的时候,要求父表中被关联的这一列,是主键或者是unique约束的。否则子表不能关联到该列,会报错。
- 班级表为空,插入学生记录不会成功,报错;要插入的外键在关联表中没有。
- 这里不仅对插入有约束,还有修改也有约束
- 插入记录到班级表中
- 插入记录到学生表中,mysql会先拿着这个记录的classld(外键约束)1,查看class表中classId有没有,有则完成后续的插入,没有插入失败。
这里注意,studentId 为 2 ,是因为前面尝试插入了一次,没成功,但是自增主键增了。
- 修改学生表中记录,mysql会先拿着这个记录的classld(外键约束)10,查看class表中classId有没有,有则完成后续的插入,没有插入失败。要修改的外键在关联表中没有。
- 针对子表进行插入/修改操作,会先查看当前插入/修改的被约束的值,是否在父表中存在,有则完成后续的插入/修改,没有插入/修改失败。但可以修改其它没有约束的列。
- 外键约束始终要保持,子表中的数据在对应的,父表的列中要存在。
父表在约束子表,子表也反向的约束了父表
- 针对父表进行修改/删除操作,如果当前被修改/删除的值,已经被子表引用了,这样的操作也会失败。但可以修改该记录其它列。或者也可以修改/删除其它没有被反向约束的记录。外键准确来说,是两个表的列产生关联关系。其他的列是不受影响的。
- 例如:尝试删除班级表里面的classld为1的记录,发现删除失败。但可以修改该记录的className。或者可以修改/删除其它没有被反向约束的记录。
报错原因:要删除的记录关联到了其他表作为了外键,不能删除。
- 直接尝试drop table class 来删除表,也是不行的。要想删除表,也需要先删除记录。
- 正确的做法:先删除子表,然后再删除父表。
关于外键约束生活中的问题:
现在有一个电商网站,有个商品表(父表),订单表(子表),其中关于goodsId列外键约束关联。
有下面情景:一段时间后,商家想把这个衬衫给下架(删除掉),要如何完成删除。尝试删除父表数据的时候,如果父表的数据被子表引用,是不能删除的,会报错。电商网站如何做到,保证外键约束存在的前提下,实现"商品下架"功能的。
解决方法:
给商品表新增一个单独的列,表示是否在线。(不在线就相当于下架了)
如果需要下架商品,使用update把 isOk 从1 修改为 0即可。此时实现下架并非是delete 而是 update 把是否下架字段进行修改。
查询商品的时候,都加上where isOk = 1这样的条件。如果为0,就间接实现了商品下架。
了解:
- 我们在这里删除都是逻辑删除,把这个数据标记成无效,而不是直接把数据抹掉。
- 电脑上删除文件,也是通过逻辑删除的方式实现的。这样的删除数据还在硬盘上,只不过是被标记成无效了。后续其他文件是可以重复利用这块硬盘空间的。
- 通过扔进回收站,清空回收站是不能把电脑的某个文件彻底删除的。硬盘上数据彻底消亡,需要时间等待后续有文件把这块标记无效的空间重复利用了才会真正消失。
- 如何才是正确的彻底删除数据的方式,通过物理删除 -》把硬盘砸了。
- 所以按照逻辑删除的思路,表中的数据是否会无限的扩张,是否就会导致硬盘空间被占满。当然会有的。通过添加硬盘(比较便宜)、增加主机(分布式)等的方式,来进一步的扩充存储空间。
1.7 check约束(了解)
MySQL使用时不报错,但忽略该约束:
2. 表的设计
根据实际的需求场景,明确当前要创建几个表,每个表的结构以及属性,这些表之间是否存在一定联系。
设计表,分两步走:
1、梳理清楚需求中的 "实体"
例如:
一般来说每个实体,都需要安排一个表,表的列就对应到实体的各个属性。
2、梳理清楚实体之间的关系,按照关系,带入到既定的公式中。
实体之间的关系,主要有三种(严格的说是四种) 一对一, 一对多 , 多对多 , 没关系。都属于设计数据库表结构的固定套路。
三大范式:
一对一
一个学生,只能有一个账号。一个账号,只能供一个学生所有。—— 1、创建一个大表,包含全部列。2、创建两个表、相互关联。
一对多
一个班级可以包含多个学生。一个学生只能处于一个班级。—— 通过外键关联,要注意谁为父表,谁为子表。
- mysql不支持数组类型,使用mysql时是用第二种方式来实现的。
- 第一种写法,可以在redis这样能够支持数组类型的数据库中使用。
多对多
一个学生可以选择多个课程。一个课程也可以提供给多个学生。—— 借助关联表
- 没关系:上述三种关系都无法套入进去。此时这样的表就完全没有关系,各自独立设计即可,不必考虑对方。
- 一般来说,只要实体和关系都明确了,此时表的设计就基本差不多了。如果实体比较多,关系比较复杂,可以画一个"实体关系图"(ER图),来表示这个关系。
- 实际开发中,很少会画ER图。即使画也不必严格的遵守ER图的语法,大概画一下就行。
好啦Y(^o^)Y,本节内容到此就结束了。下一篇内容一定会火速更新!!!
后续还会持续更新MySQL方面的内容,还请大家多多关注本博主,第一时间获取新鲜的知识。
如果觉得文章不错,别忘了一键三连哟!