本文共 774 字,大约阅读时间需要 2 分钟。
基于3NF范式的数据表设计
范式
在关系型数据库设计中,遵循不同的规范可以设计出合理的关系型数据库。这些规范被称为不同的范式,其中越高的范式通常意味着数据库的冗余越小。目前关系数据库有六种范式,分别是第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。一般来说,只需满足第三范式(3NF)即可。
第三范式
第三范式(3NF)是建立在第二范式(2NF)基础上的进一步规范。2NF要求所有非主属性都完全依赖于任何一个候选码。而3NF则进一步要求,除了这些完全依赖的属性外,任何非主属性也不能传递依赖于候选码。简单来说,3NF要求每个非主属性既不传递依赖于主属性,也不部分依赖于主属性。
定义方面,设关系模式R<U,F>属于1NF,若R中不存在这样的属性组Y和非主属性Z,使得X->Y,Y->Z成立,其中Z不包含Y,且Y推不出X,则R<U,F>属于3NF。换句话说,3NF要求每个非主属性既不传递依赖于主属性,也不部分依赖于主属性。
举个例子
考虑学生表的设计。假设学生表有以下字段:学号、姓名、年龄、所在学院、学院地点、学院电话。从学号可以推出姓名、年龄、所在学院等字段。然而,学院地点和学院电话对学号的传递依赖关系存在,这意味着从学院地点或学院电话也能间接推出学号。这种情况违反了3NF,因为存在非主属性的传递依赖。
为了改进,我们可以将学生表拆分为两个表:
学生表:学号、姓名、年龄、所在学院
学院表:学院、地点、电话
在这种情况下,学生表中的非主属性(如年龄)完全依赖于主属性(学号),而学院表中的非主属性(如地点、电话)也完全依赖于主属性(学院)。此时,数据库既符合2NF,又符合3NF,数据冗余得到了有效消除,更新异常、插入异常和删除异常也得到了解决。
转载地址:http://gnbfk.baihongyu.com/