
1、规范化设计——工匠精神。
2、1NF、2NF、3NF——基本范式,没有规矩,不成方圆。


我们来看下面的表格,表格中记录了学生有关的信息,也记录了课程有关的信息,以及学生选修了哪些课程的信息。

不难发现,这个表格有如下的问题:
◇ 数据冗余。
数据冗余是指数据之间的重复,也可以说是同一数据存储在不同数据文件中的现象。可以说增加数据的独立性和减少数据冗余是信息资源管理和大规模信息系统获得成功的前提条件。在这个表格中张三的信息和计算思维导论课程的信息重复输入多遍,构成了数据的冗余。
◇ 插入异常
如果现在想在该表中增加一门课程,由于学号作为本表的主键,唯一标识实体,新增加的课程由于尚未学生选修,故无法添加到该表中。出现了插入异常。

◇ 删除异常
如果某位学生毕业了,比如张三同学毕业了,现在想把张三相关的信息删除,不难发现,数据库课程只有张三同学选,如果删除张三同学的记录,那么数据库课程的信息也随之被删除,出现了删除异常。
◇ 更新异常
如果课程信息发生变动,比如思维导论课程名称发生变化,则必须将课程名称列中所有课程名称为思维导论的都需要修改,如果漏改一个,则会出现更新异常。
出现上述四种问题,原因在于有太多相互之间联系的属性保存在同一关系中,这就造成了因一种信息被捆绑在其它信息上而产生的信息之间的相互依附存储的问题——数据依赖。
毫无疑问决绝上述问题,需要将没有太多相互联系的属性进行拆分,上述例子则需要拆分为三张表,将不关联的属性分别拆分到不同的表格中。如下图所示。



一个基本关系具有以下5条性质。
◇ 分量必须取原子值。即每个分量必须是不可再分的数据项。
◇ 列是同质的。即每列中的分量必须是具有相同的数据类型。
◇ 属性不能重名。即每一列的列名在一个关系中是唯一的。
◇ 行列的顺序无关。即哪一行在前,那一列在前可以是任意的。
◇ 任何两个元组不能完全相同。即关系中任意两行记录不能相同,通常由主键约束来保证。


范式(数据库设计范式,数据库的设计范式):是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。在关系数据库中,这种规则就是范式。关系数据库中的关系必须满足一定的要求,即满足不同的范式。
目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、Boyce-Codd范式(BCNF)、第四范式(4NF)和第五范式(5NF)。
满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。


在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,满足第一范式的数据库,必须首先满足关系的性质,不满足第一范式(1NF)的数据库就不是关系数据库。
所谓第一范式(1NF)是指数据库表的每一列都是不可分割的基本数据项,同一列中不能有多个值,即实体中的某个属性不能有多个值或者不能有重复的属性。简而言之,第一范式就是无表中有表的形式。比如下表中,通讯地址列就出现了多个值(省、市、...、邮编)。

针对表中有表的形式,需要对其进行拆分,通常有三种做法。
◇ 简单拆分法
可以将上述表格拆分为两种形式,一种方法是去掉首行,直通到顶,将各分量独立形成列,另一种方法是将各分量进行合并,成为同一个信息。这两种做法都不是很好,会丢失信息。如果需要检索通讯地址,由于第一种方法中,并没有指定从哪一列开始进行检索,故指代不明;第二种方法,虽将信息检索出来,但又苦于信息都在一起,无法明确细节,并非所我们需要的信息。


◇ 外键法
可以将复合属性进行拆分,拆分为新的一张表,形成一对多的联系,并用外键法,与其相连,保证数据虽然因为分家,依然可以进行关联。

这种方法虽然不丢失信息,但缺看不出隶属关系。什么意思?如何理解?我们换一个明显的例子。现有球员信息表,该表中有表中有表的形式,如下图所示。

如果用外键法拆分,就形成了下表。看出什么问题了吗?将原表拆分为两张表,一张球队表,一张球员表。球队表和球员表构成一对多关系,并将一的关键字放到多的关系中,形成外键。对于球员表来说,1球队的球员编号是正确的,1号球队的1号队员,1号球队的2号队员,...,到了2号球队就不正确了,2号球队的球员编号则从4开始了编号了,这显然和我们常规球员出场介绍方式有悖。我们期望介绍的时候是1号球队的1号队员,1号球队的2号队员,...,2号球队的1号队员,2号球队的2号队员,...,这种方式。


◇ 弱实体法
在现实世界中,有时某些实体对于另一些实体有很强的依赖关系,即一个实体的存在必须以另一实体的存在为前提。前者就称为“弱实体”,后者称为“强实体”。比如在人事管理系统中,职工子女的信息就是以职工的存在为前提的,子女实体是弱实体,子女与职工的联系是一种依赖联系。
在ER模型中也称(实体-联系图(Entity Relationship Diagram),弱实体用双线矩形框表示。与弱实体的联系用双线菱形框表示。弱实体主键的一部分或全部从其强实体中获得。
球队球员的例子中,表格拆分如下:

弱实体的方法进行拆分,对于球队球员的例子来说,是最为适合的。
