资料库管理系统

April, 2004
资料库管理系统
绪 论
定 义
资料库由不同的档案构成
就办公室或机关内的需求加以规划
以资料不重覆的方法储存在一起
优 点
避免资料的重覆
维持资料的一致性
资料具独立性, 程式撰写较简单
资料具保密性和安全性
强化制度的标准化
平衡企业各方面之需求
缺 点
设计及维护成本高
资料库管理师(DBA) 不容易培训
需经常备份,否则意外状况将造成重大伤害
DBMS
资料库管理系统 (Database Management System)
一套独特的软体,同时用来建立以及维持资料库,使能针对每一不同的商业应用0取资料,并产生其所需之报表.
DBMS的三元件
资料定义语言(DDL)
资料使用语言(DML)
资料字典(Data Dictionary)
功 能
具亲和力的使用介面
可事先检查存取资料之权利
可事先检查欲储存资料的合理性, 以确保资料的完整性
提供资料共享能力
DBA 之职责
决定资料库的内容及关系
决定档案结构及存取方式
决定资料一致性及安全性之检查方法
定义备份及复原之步骤
监视日常作业并配合需求改变资料库
控制重覆(redundancy)
限制未授权者使用
提供多位使用者之介面
DBS 资料库系统
硬体: CPU,记忆体,各种输出入设备软体(存取资料之应用程式,资料库管理系统)
资料: 以不重覆储存为目标,以达多人共享之目的
使用者: 如连线作业之使用者
资料库管理师: 负责建立,修正,维护及管理资料库
资料库基本特性
独立性: 防止应用程式因 "资料储存结构" 和 "资料存取方法" 的改变, 而牵一发动全身
安全性: 只有合法授权的使用者才能使用资料库中的资料
复原性: 可将资料恢复成正确状态
同作性: 可避免多个使用者同时存取同一笔资料
完整性: 随时保持资料的正确性
资料库的三层及观点 (view)
Conceptual Schema
Conceptual Level
Internal schema
Internal Level
External Level
External
View A
External
View B
External
View N
external/conceptual mapping
conceptual/internal mapping
End Users
Stored Database
外层:最接近使用者, 不同的使用者使用不同的资料, 对资料库也产生不同的观点
概念层:外层是资料库某部分之表示, 概念层则是对整个资料及其可能关系之描述, 所以此层是群体使用者的观点
内层:最接近系统底层实体储存媒体的部份,以一逻辑的位址空间对应於资料实际存放的位置
资料库逻辑结构 -1
阶层式 (Hierarchical Model):
将资料组织成如树状之结构,每笔记录可将其划分成数个区段(Segments)
上层与下层具有一对多之亲子关系
在实体观中,藉pointers之建立连结上下层之区段(作为资料搜寻用)
适用於较固定之资料搜寻内容以及报告列印格式
由上层对下层搜寻容易, 但由下层往上层搜寻则难
同层搜寻亦难
root
资料库逻辑结构 -2
网路式(Network Model):
区段之间为多对多之关系
可与阶级式资料库相互转换
比阶级式资料库少重复之资料,较多弹性
利用网状结构,提供多对多关系,较复杂且存取路径须事先设定,重新建立关系或新链结,亦较麻烦
必须建立复杂的指标 Pointers 资料结构
资料库逻辑结构 -3
关连式(Relational):
以表格(Table) 表示个体之间的关系,交易量属中-低,易取用资料,且易使用
利用Relation (or Table二维度表格)作查询,可从不同的表格内, 经由作业(operations)而得到所需报表之内容及资料
Operations的种类: Select, Join, Project,
#Truple指在Relational Database下之 Record
其利用共用值(Shared Value)来建立个体关系,不用任何指标结构
资料库 vs 资讯系统
在关联式资料库尚未成熟前,企业资讯系统的重点在於资料处理,功能为增加效率及降低成本
关连式资料库成功发展后,资料间的关系即不受限制 (Logicl & Physical Independent),使决策者容易找出各资料间的关系来制定决策
透过网路,使得EIS逐渐受重视
往后还会发展出具地域独立性的分散式资料库,具推理能的知识库,物件导向资料库及多媒体资料库等,皆以关连式资料库为基础
资料库发展新趋势
分散性资料库系统 (Distributed Database)
物件导向式 (Object-Oriented, OO)
资料库系统
超媒体资料库 (Hypermedia Database)
资料仓库 (Data Warehouse)
资料探勘 (Data Mining)
知识库 (Knowledge Management)
E/R Model
目的
虽然DBMS不支援语意模型, 但使用者在设计资料库之前, 应先用语意模型去模型化真实世界中所感兴趣之资料
根据所建立之语意模型去规划资料库的基本关联 (Base Relation)
在设计 SQL程式时, 遵循语意模型中之语意规定, 以避免不当之操作
常用语意概念
基本三元素:
个体 (Entity):基本资料处理单元, 如: 张小姐是客户资料,玫瑰花是销售产品,订购也是一项资料记录
关联 (Relationship):描述个体与个体间之关系,如: 订购行为把客户与销售产品间建立了关系
属性 (Property):描述个体之属性,如: 客户姓名,地址,身高,体重,出生日期,学历,嗜好…
Entity
Relation-ship
Property
常用语意概念-属性表
个体(资料表) 与属性 (栏位)表示:
资料表名称 (一)

栏位三
栏位二
栏位一
Primary Key
资料表名称 (二)

栏位三
栏位二
栏位一
Foreign Key
EXAMPLE:
客户资料

最爱销售产品
电话
客户姓名
客户编号
Primary Key
订购
产品编号
客户编号
Foreign Key
销售产品

品种
单位
产品名称
产品编号
Primary Key
E/R Diagram 1
实体(entity)可分为二类
一般实体(regular entity):不属於 weak entity 的实体称为regular entity, 又可称为强实体 (strong entity)
弱实体(weak entity): 此实体的存在相依於另一个实体的存在, 即当所依存的实体不存在时, 它就无法存在. 例如学生家长即为一弱实体, 当学生实体不存在时, 学生家长就无存在之必要
E/R Diagram 2
属性 (property)
简单值(simple) 或 组合值 (composite)
键值(key): 用以唯一识别每个实体
单值(single-valued)或多值(multi-valued):如年龄和奖惩记录
从缺(missing):表不详或不需要记录, 如身分证上的父母栏可为不详
基本(base)性质或衍生(derived)性质:如重量与密度
关系 (relationship)
次型别 (subtype)
以不同角度观看实体时,一个实体型别依照某些性质可以再细分为多种不同的型别,称之为次型别 (subtype)
最原始的实体型则称为超型别 (supertype)
各种键之定义
主键(Primary Key): 辨识所有值组的某(些)个属性
唯一性(Uniqueness): 不会有相同的主键值
最小性(Minimality): 去除其任一属性皆会破坏其唯一性
外键(Foreign Key): 为另一表格中之主键,用以连结原来之表格
候选键(Candidate): 符合唯一性及最小性两种特性之属性集合
候补键(Alternate): 除去主键以外之候选键
超键(Super Key): 用来辨识值组(tuple) 之属性集合, 最大超键为所有属性之集合,而最小超键则候选键
资料库设计
需求分析: 不同使用者及群体有关应用系统及资讯需求之确认
概念设计: 对使用者及应用系统 (如人事薪资管理系统)之资讯观点, 建立E-R Model)
正规化
逻辑设计: 将观念架构转换成所选定之DBMS
实体设计
需求分析
定义资料库的范围
确立原始资料内容
确定使用者对资料之观点
确立资料之生命周期
明定操作上之需求
制作资料流程图 (Data Flow Diagram)
建立资料辞典 (Data Dictionary)
文件:各种报表,档案,文件及萤幕显示
概念设计 Conceptual
寻找个体和属性
建立个体关系
作法
Entity, Attribute,Relation (含Constraints), Keys
文件: E/R Model
正规化 Normalization
浓缩复杂的使用者观点(view)
去除重复的资料储存
得一组简化且稳定的资料结构
做法: 至少经第一~第三正规化
文件: E/R Diagram
正规化
第一正规化 (1NF, First Normal Form):一笔记录没有重覆的资料项
第二正规化 (2NF , Second Normal Form):已1NF,且记录中每笔资料可由主键单一辨视,但不能由部份主键来辨识
第三正规化 (3NF, Third Normal Fomr):已2NF,且所有和主键无关之资料项彼此间独立
Boyce-Codd正规化:将多个候选键中挑出一个决定因子作为主键
4NF:去除多值相依性
5NF:克服合并相依性
Boyce-Codd及第四,第五正规化等格式,实务上不常发生
逻辑设计Logical design
转换: E/R Model Mapping →资料库 Model
资料限制 (Constraints)
栏位限制条件, 如NOT NULL, UNIQUE
判断式(assertion), 如CHECK(…)
指定必要的index field和Primary key
建立各表格的关连
分割
垂直切割:将档案中最常用的属性与较不常用的属性各自独立为两个档案
水平切割:将档案中较常用的记录(row)与较不常用的记录各自独立为两个档案
实体设计Physical
将逻辑资料模式转换成硬体及所选用的DBMS所适用之形式
决定资料储存之结构与检索路径