数据与统计

黄玉珍

目录

  • 1 第一章 绪论
    • 1.1 数据库系统概述
    • 1.2 数据模型
  • 2 第二章 数据库的基本操作
    • 2.1 文件与事务操作
    • 2.2 数据库的创建与查看、管理
  • 3 第三章 数据表的建立与操作
    • 3.1 数据表及SQL Server数据类型
    • 3.2 数据库中表的操作
  • 4 第四章  数据查询
    • 4.1 基本查询与带条件查询
    • 4.2 高级查询
  • 5 第五章 数据完整性
    • 5.1 数据完整性的基本类型与约束
    • 5.2 默认、规则、标识和自定义数据类型
  • 6 第六章 视图
    • 6.1 视图的概述及视图的操作
  • 7 第七章 存储过程
    • 7.1 存储过程的概述及存储过程的操作
  • 8 第八章 触发器
    • 8.1 触发器的概述及触发器的操作
  • 9 第九章 用户自定义函数
    • 9.1 用户自定义函数概述及操作
  • 10 第十章 安全管理
    • 10.1 安全机制、登陆账户、角色、权限
  • 11 第十一章  备份与恢复
    • 11.1 备份、恢复及其相关操作
数据模型

两类模型

数据模型是对现实世界数据特征的一种抽象,同时也是数据库系统的核心和基础。根据模型应用的不同目的,可以将其划分为两个类别,第一类是概念模型,第二类是逻辑模型理模型

概念模型也称信息模型,是按照用户的观点来对数据和信息建模,主要用于数据库的设计。

逻辑模型是按计算机系统的观点对数据进行建模,用于数据库管理系统的实现。

物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,是面向计算机系统的。

人们对现实世界中的具体事务抽象、组织为某一数据库管理系统支持的数据模型,通常是首先将现实世界抽象为信息世界,然后将信息世界转换为机器世界

概念模型

1.信息世界中的基本概念

信息世界中的基本概念有:

(1)实体:客观存在,且可相互区别的事物称为实体。

(2)属性:实体所具备的某一特性称为属性。

(3)码:唯一标示实体的属性称为码。

(4)实体型:用实体名及其属性名集合来抽象和刻画同类实体。

(5)实体集:同一类型实体的集合。

(6)联系:现实世界中,事物内部及事物之间是有联系的,实体内部的联系通常指组成各实体的各属性之间的联系,实体之间的联系通常指不同实体集之间的联系。实体之间存在一对一,一对多和多对多等多种联系。

2.概念模型表示方法:实体-联系方法

概念模型是对信息世界的建模,因此概念模型能够方便准确地描述出信息世界的常用概念, 而实体-联系方法是概念模型中最为常用的表示方法。

常用的数据模型

1. 层次模型

数据库系统中最早出现的数据模型,其满足数据结构示例如下图所示:

在数据库中定义且满足以下两个条件的基本层次联系的集合即为层次模型:

(1)有且仅有一个根节点没有双亲节点;

(2)根以外的其他节点有且仅有一个双亲节点。

层次模型的优点:

(1)数据结构简单清晰;

(2)查询效率高;

(3)提供了良好的完整性支持。

层次模型的缺点:

(1)现实世界中很多联系是非层次性的,例如节点之间具有多对多联系,不适合使用层次模型来表示;

(2)如果一个节点具有多个双亲节点,层次模型难以表示这类联系,只能通过引入冗余数据或创建非自然的数据结构来解决;

(3)查询子女节点必须经过双亲节点;

(4)结构太过严密,层次命令趋于程序化。

层次模型可以对一对多的联系产生非常自然、直观、易于理解的联系

2.网状模型

层次模型中的子女节点与双亲节点的联系是唯一的,但网状模型中这种联系可以不唯一,可以克服层次模型无法直接表示非树形结构的缺点,示例如下:

满足以下两个条件的基本层次联系集合称为网状模型:

(1)允许一个以上的节点无双亲。

(2)一个节点可以有多于一个的双亲。

网状模型的优点:

(1)能够更直接地描述现实世界;

(2)具有良好的性能,更高的存取效率;

网状模型的缺点:

(1)结构比较复杂,且随着应用环境的扩大,结构会越发复杂,不利于用户最终掌握;

(2)网状模型的数据定义语言和数据操纵语言复杂,用户不易掌握;

(3)由于记录之间的联系是通过存取路径实现的,应用程序在访问数据时必须选择适当的存取路径,因此用户必须了解系统结构的细节,加重了编写应用程序的负担。

3.关系模型

最重要的一种数据模型,建立在严格的数学概念的基础上,下面以学生登记表为例,介绍关系模型中的一些术语。

关系:一个关系对应通常来说的一张表;

•元组:表中的一行即为一个元组;

•属性:表中的一列即为一个属性,给每一个属性取一个名称即为属性名;如上表中有6列,即对应6个属性;

•码:也称为码键。表中的某个属性组,它可以唯一确定一个元组,如上表中的学号可以唯一确定一名学生,也就成为本关系中的码;

•域:域是一组具有相同数据类型的值的集合。属性的取值来自某个域,如大学生年龄属性的域大约是15~45岁,性别的域是男,女,系名的域是一个学校所有系名的集合。

•分量:元组中的一个属性值。

关系模型要求关系必须是规范化的,这些规范条件中最基本的一条就是,关系的每一个分量必须是一个不可分的数据

关系模型的优点:

(1)关系模型与格式化模型不同,是建立在严格的数学概念的基础上的。

(2)关系模型的概念单一。无论实体还是实体之间的联系都用关系来表示。对数据的检索和更新结果也是关系,所以其数据结构简单、清晰,用户易懂易用。

(3)关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作