14.计算机科学导论之数据库学习笔记

2022-06-09
计算机基础知识

14.计算机科学导论之数据库学习笔记

2022-06-09

[TOC]

计算机科学导论学习笔记

第 5 部分数据组织与抽象

此部分包含第11、12、13和14 章，讨论了数据结构、抽象数据类型、文件结构以及数据库原理。

在计算机科学中，原子数据汇集成记录、文件和数据库，而数据抽象使得程序员能创建关于数据的抽象观念。

原文地址: https://mp.weixin.qq.com/s/V3009OcqY-LHNirueqBHIQ

14.数据库

本章主要讨论数据库和数据库管理系统（DBMS）三层结构, 重点讲解关系数据库模型并举例说明其运算，然后介绍一种在关系数据库上使用的语言（结构化查询语言）, 最后简要介绍数据库设计和其他的数据库模型。

14.1 前言简述

数据的存储传统上是使用单独的没有关联的文件有时称为平面文件, 在数据库未出现之前每个应用程序都使用自己的文件, 他们是相对独立存在的为了使数据有关联性, 现在将所有这些平面文件被组合成一个实体的数据库。

(1) 数据库的定义

数据库通常的定义

数据库是一个组织内被应用程序使用的逻辑相一致的相关数据的集合。

(2) 数据库的优点

与平面文件系统相比，我们可以说出数据库系统的几个优点：

冗余较少: 平面文件系统中存在着大量的冗余，相比之下冗余较少。
避免不一致性: 如果相同的信息被存储在多个地方，那么对数据的任何修改需要在数据存储的所有地方进行, 否则就可能导致数据不一致的问题。
效率：数据库通常比平面文件系统的效率要高得多，因为数据库中一条信息存储在更少的地方。
数据完整性：数据库系统更容易维护数据的完整性，因为数据信息存储在更少的地方。
机密性: 数据是集中存放在一个地方，更容易维护信息的机密性。

(3) 数据库管理系统

数据库管理系统(DBMS)是定义、创建、维护数据库的一种工具, 其允许用户来控制数据库中数据的存取。

数据库管理系统由5部分构成∶硬件、软件、数据、用户和规程。

硬件：是指允许物理上存取数据的计算机硬件系统。例如，用户终端、硬盘、主机和工作站，都被认为是 DBMS 的硬件组成部分。
软件：是指允许用户存取、维护和更新物理数据的实际程序。另外，软件工具还可以控制哪些用户可以对数据库中的哪部分数据进行存取。
数据：数据库中的数据存储在物理存储设备上,数据是独立于软件的一个实体。
用户: 术语用户在数据库管理系统中有广泛的定义,我们可将将用户分为两类最终用户和应用程序。

最终用户: 指直接从数据库中获取信息的用户，其又划分为数据库管理员(DBA)和普通用户, 其中数据库管理员拥有数据库最大的权限，而普通用户只能使用部分数据库和有限的存取。
应用程序: 指使用应用程序对数据库进行连接、存取和处理数据。
规程: 数据库管理系统的最后一个部分就是必须被明确定义并为数据库用户所遵循的规程或规则的集合。

关系模型的实现是关系数据库管理系统 (RDBMS),RDBMS 将数据移入数据库、存储数据并检索它，以便应用程序可以操作它。

RDBMS 区分以下类型的操作：

逻辑操作: 应用程序指定什么内容为必填项。(如,应用程序请求员工姓名或将员工记录添加到表中。)
物理操作: 确定如何应该做的事情并进行操作。(如,在应用程序查询指定表中特定字段数据时,可能会使用索引来查找请求的行，将数据读入内存，并在将结果返回给用户之前执行许多其他步骤)

Tips : RDBMS 存储和检索数据，以便物理操作对数据库应用程序是透明的。

(4) 数据库分类

当前数据库类型大致分为两类，关系型数据库和非关系型数据库。

关系型数据库

描述: 在 1970 年的开创性论文“大型共享数据库的数据关系模型”中，EF Codd 定义了基于数学集合论的关系模型, 当下最广泛使用的数据库模型就是关系模型。

Q: 关系型数据库的本质是?

答: 关系数据库将数据存储在一组简单的关系中(一种关系是一组元组,一个元组是一组无序的属性值。), 数据以行（元组）和列（属性）形式的关系的二维表示，表中的每一行都具有相同的一组列。
答: 关系数据库是将数据存储在关系（表）中的数据库。

关系模型主要有以下几个方面：

数据结构: 定义良好的对象存储或访问数据库的数据。
操作控制: 明确定义的操作使应用程序能够操作数据库的数据和结构。
管理机制：完整性规则管理对数据库数据和结构的操作。

扩展常见的关系化数据库

商业化数据库
- Oracle : http://www.oracle.com/index.html
- Microsoft SQL Server: http://www.microsoft.com/SQL/default.mspx
- Microsoft access
- IBM 的DB2 : http://www-306.ibm.com/software/data/db2/9/download.html
- Sybase : http://www.sybase.com/
开源的数据库
- MySQL:http://www.mysql.com/ (PS: 已被甲骨文公司收购 MySQL的代替品可选 MariaDB (MySQL之父Michael “Monty” Widenius的新项目防止MySQL避源的风险，其它在扩展功能、存储引擎以及一些新的功能改进方面都强过MySQL) 、Percond Server)
- SQLite:http://www.sqlite.org/
- HSQLDB 纯Java小型数据库:http://www.hsqldb.org/
- PostgreSQL:http://www.postgresql.org/

非关系型数据库
描述: 非关系型数据库，即Not-OnlySQL（泛指非关系型的数据库），作为关系型数据库的补充。

问: 什么是非关系型数据库(NoSQL)?
答:它是一个Key:Value类型的数据库;

非关系型数据库产品

面向检索的列式存储 Column-Oriented

BigTable Google)
Abase( Hadoop子系统)
面向高并发的缓存存储 key-vaUe

LevelDB (Google)
Redis
MemcacheDB
面向海量数据访问的文档存储 Document-Oriented

MongoDB
CouchDB

14.2 数据库体系

美国国家标准协会/标准计划和需求委员会（ANSI/SPARC）为数据库管理系统建立了三层体系结构：内层、概念层和外层

(1) 内层

内层决定了数据在存储设备中的实际位置，此层次处理低层次的数据存取方法和如何在存储设备间传输字节。

换句话说，内层直接与硬件交互。

(2) 概念层

概念层定义数据的逻辑视图，它是中介层，它使得用户不必与内层打交道。

在此层中定义了数据模式，数据库管理系统的主要功能（如査询）都在该层，数据库管理系统把数据内部视图转化为用户所看到的外部视图。

(3) 外层

外层直接与用户（最终用户或应用程序）交互，它将来自概念层的数据转化为用户所熟悉的格式和视图。

14.3 数据库模型

数据库模型定义了数据的逻辑设计，它也描述了不同数据之间的联系，在数据库设计发展史中，有三种传统的数据库模型层次、网状和关系等模型。

(1) 层次模型

在该模型中，数据被组织成一棵倒置的树，每一个实体可以有不同的子节点，但只能有一个双亲，层次的最顶端有一个实体，称为根。 (PS: 是不是很像我们前面讲解的二叉树呀)

当前，由于层次模型已经过时，我们不再做过多的叙述，只是进行一个简单了解，下图给出层次模型的逻辑图。

(2) 网状模型

在该模型中，实体通过图来组织，图中的部分实体可通过多条路径来访问，同样由于该模型已经过时，我们也不再做过多的描述。

(3) 关系模型

在该模型中，数据组织称为关系的二维表，这里没有任何层次或网络结构强加于数据上，但表或关系相互关联，当前它作为数据库设计中最常用的模型（PS: 后续文章将会持续介绍），下图给出关系型模型的逻辑图。

在后续我将将简要地介绍另外两种常用的、派生于关系模型的数据库模型：分布式模型和面向对象模型。

14.4 关系数据库模型

在关系数据库管理系统（RDBMS-Relational Database Management System）中，数据是通过关系的集合来表示的（数据的外部视图就是关系或表的集合），从表面上看，关系就是二维表，但这并不代表数据以表的形式存储，数据的物理存储与数据的逻辑组织的方式毫无关系。

关系数据库管理系统（RDBMS）中的关系有下列特征：

名称：在关系数据库管理系统中，每一种关系具有唯一的名称，即表名。
属性：关系中的每一列都称为属性，属性在表中是列的头 ,每一个属性表示了存储在该列下的数据的含义。表中的每一列在关系范围内有唯一的名称。关系中属性的总数称为关系的度(例如，图中的关系的度3), 注意属性名并不存储在数据库中，概念层中使用属性给每一列赋予一定的意义，即列名。
元组：关系中的行叫做元组，元组定义了一组属性值。关系中元组的个数叫做关系的基数，当增加或减少元组时，关系的基数就会改变，这就实现了动态数据库，即数据。

14.5 关系数据库操作

在关系数据库中，我们可以定义一些操作来通过已知的关系创建新的关系，例如，采用数据库査询语言SQL （结构化查询语言）进行常规的CURD操作，如插入、删除、更新、选择、投影、连接、并、交和差。

Q: 什么是结构化查询语言 SQL?

它是美国国标协会（ANSI）和国际标准组织（ISO）用于关系数据库上的标准化语言，结构化査询语言于1979年首次被Oracle公司实现，它是一种描述性（不是过程化）的语言，这意味着使用者不需要一步步地编写详细的程序而只需声明它，之后有了更多的新版本。

(1) insert - 插入

插入是一元操作，它应用于一个关系，其作用是在表中插入新的元组。

SQL格式如下: INSERT INTO 表名(字段1,字段2) VALUES ("值1","值2")

温馨提示： value子句定义了要插入的相应元组的所有属性，并且字符串的值是要用引号括起来的，而数值就不需要。

(2) delete - 删除

删除也是一元操作，根据要求删除表中相应的元组。

SQL格式如下: delete from 表名 where 字段1=条件

温馨提示: 删除的条件是由where子句定义的，通常在删除数据时一定要带where防止误删表数据（从删库到跑路，😳）

(3) update - 更新操作

更新也是一元操作，它应用于一个关系，用来更新元组中的部分属性值。

SQL格式如下:

点击阅读完整原文

欢迎各位志同道合的朋友一起学习交流，如文章有误请在下方留下您宝贵的经验知识，个人邮箱地址【master#weiyigeek.top】或者个人公众号【WeiyiGeek】联系我。

更多文章来源于【WeiyiGeek Blog - 为了能到远方，脚下的每一步都不能少】, 个人首页地址( https://weiyigeek.top )

专栏书写不易，如果您觉得这个专栏还不错的，请给这篇专栏 【点个赞、投个币、收个藏、关个注、转个发、赞个助】，这将对我的肯定，我将持续整理发布更多优质原创文章！。

最后更新时间：2023-06-06 17:20:20
文章原始路径：_posts/书籍笔记/计算机科学导论/14.计算机科学导论之数据库学习笔记.md
转载注明出处，原文地址：https://blog.weiyigeek.top/2022/6-9-705.html
本站文章内容遵循知识共享署名 - 非商业性 - 相同方式共享 4.0 国际协议

WeiyiGeeker

☕️ 请作者喝杯咖啡!

14.计算机科学导论之数据库学习笔记

计算机科学导论学习笔记

第 5 部分 数据组织与抽象

14.数据库

14.1 前言简述

(1) 数据库的定义

(2) 数据库的优点

(3) 数据库管理系统

(4) 数据库分类

14.2 数据库体系

(1) 内层

(2) 概念层

(3) 外层

14.3 数据库模型

(1) 层次模型

(2) 网状模型

(3) 关系模型

14.4 关系数据库模型

14.5 关系数据库操作

(1) insert - 插入

(2) delete - 删除

(3) update - 更新操作

计算机科学导论学习笔记

第 5 部分 数据组织与抽象

14.数据库

14.1 前言简述

(1) 数据库的定义

(2) 数据库的优点

(3) 数据库管理系统

(4) 数据库分类

14.2 数据库体系

(1) 内层

(2) 概念层

(3) 外层

14.3 数据库模型

(1) 层次模型

(2) 网状模型

(3) 关系模型

14.4 关系数据库模型

14.5 关系数据库操作

(1) insert - 插入

(2) delete - 删除

(3) update - 更新操作

(4) select - 选择操作

(5) select - 投影操作

(6) select - 连接操作

(7) union - 联合查询

(8) intersection - 交查询

(9) minus - 差查询

14.6 数据库设计

(1) 实体关系模型

(2) 从E-R图到关系

(3) 规范化

14.7 其他数据库模型

(1) 分布式数据库

(2) 面向对象数据库

如果此篇文章对您有帮助，就请作者喝杯 Coffee ☕️☕️!

第 5 部分数据组织与抽象

第 5 部分数据组织与抽象