管理信息系统的系统设计.ppt
第7章 管理信息系统的系统设计,7.1 系统设计概述 7.2 代码设计 7.3 功能结构图设计7.4 信息系统流程图设计7.5 系统配置方案设计7.6 输出设计 7.7 输入设计7.8 数据存储设计 7.9 处理流程图设计7.10 制定设计规范7.11 编写程序设计说明书和系统设计报告,系统分析,系统设计,系统实施,系统开发简要流程,7.1 系统设计概述,7.1.1 系统设计的任务7.1.2 系统设计的工作7.1.3 系统设计中应遵循的原则,7.1.1 系统设计的任务,系统设计的任务是:在系统分析提出的逻辑模型的基础上,科学合理地进行物理模型的设计。,逻辑模型,物理模型,做什么,如何做,科学合理地提出,从具体到抽象,从抽象又回到具体,系统分析,系统设计,7.1.1 系统设计的主要工作,7.1.2 系统设计中应遵循的原则,指系统抵御外界干扰的能力及受外界干扰时的恢复能力,代码统一、设计规范标准、数出一处、全局共享、一次输入得到多次利用,环境适应性模块的独立性,尽可能减小系统的开销,7.2 代码设计,7.2.1 代码及代码的功能7.2.2 代码设计的原则7.2.3 代码的分类7.2.4 代码的校验,7.2.1 代码及代码的功能,图书馆管理:借阅证(J72157)、图书(D035.1 41)驾照申领管理:牌照号(渝AC5316)、机动车驾驶证号教学管理:课程号(10031)、学号(),代码的定义,代码:代表事物名称、属性、状态等的符号。为了便于计算机处理,一般用数字、字母或它们的组合来表示。,系统分析阶段:数据字典,系统设计阶段:代码设计,代码的功能,1、为事物提供一个概要而不含糊的认定,便于数据的存储和检索。2、使用代码可以提高处理的效率和精度。3、提高了数据的全局一致性。4、是人和计算机的共同语言,是两者交换信息的工具。,7.2.2 代码设计的原则,1、设计的代码在逻辑上必须能满足用户的需要,在结构上应当与处理的方法相一致。2、一个代码应惟一标志它所代表的事物或属性。3、代码设计时,要预留足够的位置,以适应不断变化的需要。一般来说,代码愈短,分类、准备、存储和传送的开销愈低;代码愈长,对数据检索、统计分析和满足多样化的处理要求就愈好。但编码太长,留空太多,多年用不上,也是一种浪费。4、注意避免误读,不要使用易于混淆的字符。如O、z、I、S、V与0、2、1、5、U易混;不要把空格作代码;要使用24小时制表示时间等,7.2.2 代码设计的原则,5、要注意尽量采用不易出错的编码结构。例如字母字母数字的结构(如WW2)比字母数字字母的结构(如W2W)发生错误的机会要少一些6、当代码长于4个字母或5个数字字符时,应分成小段,这样人们读写时不易发生错误。7、注意代码的可扩充性。若已知码的位数为P,每一位上可用字符数为Si,则可以组成码的总数为:C=S1*S2*Sp例如,对每位字符为09的三位码,共可组成C1010101000种码。,代码容量计算,计算代码的容量,即它所能表达的个体的个数。例如:一个三位数的数字代码,可以区分一千个不同的个体;一个由两个英文字母组成的代码,可以表达676个不同的个体(2626)如果区分大小写,并且可以用数字出现在其中,那么同样是两位的代码可以表达3844个不同的个体(6262)。在计算容量时,都应该考虑到今后的发展与扩充,而不能只看当前的情况。,7.2.3 代码的种类,1.顺序码2.区间码3.助忆码,1.顺序码,顺序码又称系列码,它是一种用连续数字代表编码对象的码.例如,用1 代表厂长,2代表科长,3代表科员,4代表生产工人等。顺序码的优点:短而简单,记录的定位方法简单,易于管理。顺序码的缺点:没有逻辑基础,本身不能说明任何信息的特征。新加的代码只能列在最后,删除则造成空码。通常,顺序码作为其他码分类中细分类的一种补充手段。,1.顺序码,2.区间码,区间码:把数据项分成若干组,每一区间代表一个组,码中数字的值和位置都代表一定意义。邮政编码。,邮政编码,某企业的用户分类代码,区间码的类型,(1)多面码(2)上下关联区间码(3)十进位码,多面码,多面码:一个数据项可能具有多方面的特性。如果在码的结构中,为这些特性各规定一个位置,就形成多面码。,材料代码,上下关联区间码,上下关联区间码:由几个意义上相互有关的区间码组成,其结构一般由左向右排列。,身份证号码,十进位码,此法相当于图书分类中沿用已久的十进位分类码,它是由上下关联区间码发展而成的。如D035.1 41,小数点左边的数字组合代表主要分类,小数点右边的指出子分类。子分类划分虽然很方便,但所占位数长短不齐,不适于计算机处理。显然,只要把代码的位数固定下来,仍可利用计算机处理。,十进位码,TP3 计算技术、计算机技术 TP30 一般性问题 TP31 计算机软件 TP311 程序设计、软件工程 TP311.1 程序设计 程序正确性理论入此。TP311.11 程序设计方法 TP311.12 数据结构 TP311.13 数据库理论与系统 TP311.131 数据库理论 各种数据库语言和数据库管理系统入此。TP311.132 数据库系统 按类型分,总论数据库系统入此。TP311.132.1 层次数据库 TP311.132.2 网状数据库 TP311.132.3 关系数据库 TP311.133.1 分布式数据库 TP311.133.2 并行数据库 TP311.134.1 模糊数据库 TP311.134.3 多媒体数据库 TP311.135.1 文献型数据库 TP311.135.3 事实型数据库 TP311.135.4 超文本数据库,判断?,判断?,1.邮政编码?2.学号?3.汽车牌照号?4.电话号码?,区间码的优点,区间码的优点:信息处理比较可靠,排序、分类、检索等操作易于进行。区间码的缺点:码的长度与它分类属性的数量有关,有时可能造成很长的码。在许多情况下,码有多余的数。码的维修比较困难。,3.助忆码,助忆码:用文字、数字或文字数字结合起来描述。(表示产品的规格、型号)例如,用TV-B-12代表12英时黑白电视机,用TV-C-20代表20英时彩色电视机。又如在开发一个商业经贸性公司的信息系统时,在数据库中需要分别存储商品的进、存、销3个环节的价格、成本、资金占用等信息。为了区别起见,可以规定:字段的前两位分别用J-,C-,X-来表示进、存、销,用后5位数来代表价格、成本、费用、资金占用等等。例如J-price表示进价。这就是一个典型的纯字条符码。,助忆码的特点,特点:可以通过联想帮助记忆。优点:可辅助记忆缺点:校对不易,不易反映分类的结构。太长的助忆码占用计算机容量太多,不宜采用。汉字不宜作为编码的符号。助忆码适用于数据项数目较少的情况(一般少于50个),否则可能引起联想出错。,7.2.4 代码的校验,抄写错误,易位错误,隔位易位错误,如何解决,如何保证代码的正确性?,7.2.4 代码的校验,避免代码录入出现错误的办法在设计好的代码(代码本体)后,再增加一位,作为代码的组成部分。增加的这一位,即为校验位。,校验位的确定步骤,设有一组代码为:C1C2C3C4Ci第一步:为设计好的代码的每一位Ci确定一个权数Pi(权数可为算术级数、几何级数或质数)。第二步:求代码每一位Ci与其对应的权数Pi的乘积之和S S=C1*P1+C2*P2+Ci*Pi(i=1,2,n)n=Ci*Pi(i=1,2,n)i=1第三步:确定模M(11,13,10)第四步:取余R=S MOD M第五步:校验位Ci+1=R最终代码为:C1C2C3C4CiCi+1使用时:C1C2C3C4CiCi+1,算术级数法,某金属材料公司的黑色金属材料分类代码为:1080103(代码本体)权自左向右为:1 2 3 4 5 6 7得出乘积之和:l1十02十83十04十15十0 6十37=51除以模11 R=51 MOD 11=7原编码加上校验位7,最终设计的代码便是:10801037,几何级数法,原编码 1 2 3 4 各乘以权 16 8 4 2乘积之和 16+16+12+852以11为模去除乘积之和,把得出的余数作为校验码:521148因此编码为 12348。,质数法,原编码 1 2 3 4各乘以权 13 7 5 3乘积之和 13+14+15+12=54以11为模去除乘积之和,把得出余数作为校验码:5411410因此编码为 12340。注意:以11为模时,若余数是10,则校验码取0。,7.3 功能结构图设计,1、结构化设计思想系统性。层次性。,自顶向下分解步骤(功能分层),1.功能分层方法:将系统分解为子系统,各子系统功能总和为上层系统的总的功能,再将子系统分解为功能模块:上层功能包括(或控制)下层功能愈上层功能愈笼统,愈下层功能愈具体下层功能模块能实现上层的模块功能2.功能分层原则:从上往下,由抽象到具体,由复杂到简单。,功能结构图,功能结构图:就是按功能从属关系画成的图表,图中每一个框称为一个功能模块。,2、模块化设计思想,模块化设计思想模块化:把一个信息系统设计成若干模块的方法。模块化设计思想:(1)把一个复杂的系统分解为一些规模较小、功能较简单的、更易于建立和修改的部分;(2)一方面,各个模块具有相对独立性,可以分别加以设计实现;(3)另一方面,模块之间的相互关系(如信息交换、调用关系)则通过一定的方式予以说明;(4)模块结构整体上具有较高的正确性、可理解性与可维护性;(5)各模块在这些关系的约束下共同构成一个统一的整体,完成系统的功能;,7.5 系统物理配置方案设计,7.5.1 设计依据7.5.2 计算机硬件选择7.5.3 计算机网络的选择7.5.4 数据库管理系统的选择7.5.5 应用软件的选择,1、系统的吞吐量,每秒钟执行的作业数称为系统的吞吐量。系统的吞吐量越大,则系统的处理能力就越强。系统的吞吐量与系统硬、软件的选择有着直接的关系如果要求系统具有效大的吞吐量,就应当选择且有效高性能的计算机和网络系统。,2、系统的响应时间,从用户向系统发出一个作业请求开始,经系统处理后,给出应答结果的时间称为系统的响应时间。如果要求系统具有较短的响应时间,就应当选择CPU运算速度较快的计算机及具有较高传递速率的通讯线路,如实时应用系统。,3、系统的可靠性,系统的可靠性可以用连续工作时间表示。例如,对于每天需要24小时连续工作的系统,则系统的可靠性就应该很高,这时可以来用双机双工结构方式。,4、集中式还是分布式,如果一个系统的处理方式是集中式的,则信息系统既可以是主机系统,也可以是网络系统,若系统的处理方式是分布式的,则采用微机网络将更能有效地发挥系统的性能。,5、地域范围,对于分布式系统,要根据系统覆盖的范围决定采用广域网还是局域网。,6、数据管理方式,如果数据管理方式为文件系统,则操作系统应具备文件管理功能;如果数据管理方式为数据库管理方式,系统中应配备相应的数据库管理系统。,7.5.2 计算机硬件选择,(1)计算机主存;(2)CPU时钟;(3)输入、输出和通信的通道数目;(4)显示方式;(5)外接转储设备及其类型。,7.5.3 计算机网络的选择,1、网络拓扑结构2、网络的逻辑设计3、网络操作系统,7.5.4 数据库管理系统的选择,数据库管理系统选择的原则是:支持先进的处理模式,具有分布处理数据,多线索查询,优化查询数据,联机事务处理功能;具有高性能的数据处理能力;具有良好图形界面的开发工具包;具有较高的性能/价格比;具有良好的技术支持与培训。普通的数据库管理系统有Foxpro,lipper和Paradox等。大型数据库系统有Microsoft SQL Server,Oracle Server,Sybase SQL Server和Informix Server 等。,7.5.5 应用软件的选择,软件的选择包括:操作系统;数据库管理系统;汉字系统;设计语言;应用软件包等软件。软件的选择原则1、软件是否能够满足用户的需求2、软件是否具有足够的灵活性3、软件是否能够获得长期、稳定的技术支持,7.6 输出设计,7.6.1 输出设计的内容7.6.2 输出设计的方法7.6.3 信息系统输出的设计原则7.6.4 输出设计评价7.6.5 输出设计报告7.6.6 输出设计举例,服装管理采购订单,服装管理采购统计,服装管理采购统计(打印),速达管理销售图表,系统登录界面后,进入系统设置窗口,为什么系统设计要先进行输出设计?,即系统设计过程中为什么要“量出而入”?输出设计的目的:正确及时地反映用于生产和服务部门的有用信息(*)。首先根据进行输出设计,再根据输出所应获得的信息来进行输入设计,更能反映管理者和用户对信息的需求。,7.6.1 输出设计的内容,输出设计的任务是使管理信息系统输出满足用户需求的信息。输出设计的内容:输出信息使用情况。信息的使用者、使用目的、信息量、输出周期、有效期、保管方法和输出份数。输出信息内容。输出项目、精度、信息形式(文字、数字)。输出格式。表格、报告、图形等。输出设备和介质。设备如:打印机、显示器等;介质如:磁盘、磁带、纸张(普通、专用)等。,表7.3输出设备和介质一览表,常用的输出方法,表格信息。图形信息。,表格输出,图形输出,图形输出,常用的输出方法,7.6.3 信息系统输出的设计原则(补充),(1)信息系统的输出应该简洁明了,易于阅读和理解。(2)信息系统输出应该是及时的。(3)访问信息系统输出信息的用户必须是经过授权的,这是信息系统输出安全的基本保证。(4)信息系统的输出必须是有效的。,出错表的设计,为了保证输入数据正确无误,数据输入过程中需要通过程序对输入的数据进行严格的校验,发现有错时,程序应当自动地打印出出错信息一览表(主要指应用程序中的出错信息提示系统容错功能的体现),7.6.4 输出报告,输出报告定义的内容(系统的输出):标出了各常量、变量的详细信息;给出各种统计量及其计算公式、控制方法。,设计输出报告时要注意以下几点:,1、方便使用者;2、要考虑系统的硬件性能;3、尽量利用原系统的输出格式,确需修改,应与有关部门协商,征得用户同意;4、输出表格要考虑系统发展的需要。5、输出的格式和大小要根据硬件能力,认真设计,并试制输出样品,经用户同意后才能正式使用。6、设计输出报告之前应收集好各项的有关内容,填写到输出设计书上,输出设计说明书,千叶眼镜连锁店MIS费用单打印,单表输出格式下图的费用单打印设计,就是在费用单输入并成功保存后,打印出的结果。业务部单表的打印格式与此单相似。单表包括:费用单、付款单、发票单。,费用单打印输出格式,带有单价与金额的入库单输出格式,输出设计小结,能否为用户提供及时、准确、全面的信息服务;是否便于阅读和理解,符合用户的习惯;是否充分考虑和利用了输出设备的功能;是否为今后的发展预留一定的余地。,7.7 输入设计,输入设计对系统的质量有着决定性的重要影响:输出数据的正确性直接决定处理结果的正确性,如果输入数据有误,即使计算和处理十分正确,也无法获得可靠的输出信息。输入设计是信息系统与用户之间交互的纽带,决定着人机交互的效率。,输入设计的目的,提高输入效率,减少输入错误,输入设计的原则,控制输入量(尽可能利用计算)减少输入延迟(批量输入、周转文件输入)减少输入错误(采用多种校验方法和验证技术)避免额外步骤简化输入过程,输入设计的原则,避免额外步骤,简化输入过程,控制输入量,减少输入错误,输入设计的原则,控制输入量,减少输入延迟,数据输入设备的选择,1、读卡机,3、手持扫描仪,6、终端输入,4、声音识别仪,2、键盘-磁盘输入装置(最常用的方式),5、光笔输入,输入检验,输入设计的目标:是要尽可能减少数据输入中的错误,在输入设计中,要对全部输入数据设想其可能发生的错误,对其进行校验。,输入检验,1.输入的错误类型在输入过程中,要保证输入的速度和质量,以及输入信息的正确性,还要考虑对数据出错的校验。常见有以下几种错误类型:(1)数据本身错误。(2)数据多余或不足。(3)数据的延误。,输入数据出错的校验方法,(1)重复校验这种方法将同一数据先后输入两次,然后由计算机程序自动予以对比校验,如两次输入内容不一致,计算机显示或打印出错信息。(2)视觉校验输入的同时,由计算机打印或显示输入数据,然后与原始单据进行比较,找出差错。视觉校验不可能查出所有的差错,其查错率为75,85。,输入数据出错的校验方法,(3)检验位校验(4)控制总数校验采用控制总数校验时,工作人员先用手工求出数据的总值,然后在数据的输入过程中由计算机程序累计总值,将两者对比校验。(5)数据类型校验校验是数字型还是字母型。(6)格式校验即校验数据记录中各数据项的位数和位置是否符合预先规定的格式。例如,姓名栏规定为18位,而姓名的最大位数是17位,则该栏的最后一位一定是空白。该位若不是空白,就认为该数据项错位。,输入数据出错的校验方法,(7)逻辑校验即根据业务上各种数据的逻辑性,检查有无矛盾。例如,月份最大不会超过12,否则出错。(8)界限校验即检查某项输入数据的内容是否位于规定范围之内。譬如,商品的单价,若规定在50元至1000元范围内,则检查是否有比50元小及比1000元大的数目即可。凡在此范围之外的数据均属出错。(9)顺序校验即检查记录的顺序,例如,要求输入数据无缺号时,通过顺序校验,可以发现被遗漏的记录。又如,要求记录的序号不得重复时,即可查出有无重复的记录。,输入数据出错的校验方法,(10)记录计数校验通过计算记录个数来检查记录有否遗漏和重复。不仅对输入数据,而且对处理数据、输出数据及出错数据的个数等均可进行计数校验。(11)平衡校验平衡校验的目的在于检查相反项目间是否平衡。例如,会计工作中检查借方会计科目合计与贷方会计科目合计是否一致。又如银行业务中检查普通存款定期存款等各种数据的合计,是否与日报表各种存款的分类合计相等等。(12)对照校验对照校验就是将输入的数据与基本文件的数据相核对,检查两者是否一致。例如,为了检查销售数据中的用户代码是否正确,可以将输入的用户代码与用户代码总表相核对。当两者的代码不一致时,就说明出错。,校验方法小结,输入数据的校验方法:由人工直接检查;由计算机用程序校验;人与计算机两者分别处理后再相互查对校验等。,输入设计举例单表输入设计,输入设计举例表格式输入,不简洁输入界面,7.8 数据存储设计,7.8.1 文件设计7.8.2 数据库设计,7.8 数据存储设计,文件设计:就是根据文件的使用要求、处理方式、存储量、数据的活动性以及硬件设备的条件等,合理地确定文件类别,选择文件介质,决定文件的组织方式和存取方法。,7.8.1 文件设计,1.文件的分类主文件:是系统中最重要的共享文件,主要存放具有固定值属性的数据。为发挥主文件数据的作用,它必须准确、完整并及时更新。处理文件:又称事务文件,是用来存放事务数据的临时文件。工作文件:是处理过程中暂时存放数据的文件。如排序过程中建立的排序文件,打印时建立的报表文件等。周转文件:用来存放固定个体变动属性的数据。,7.8.1 文件设计,2.文件设计的步骤(1)通常从设计共享文件开始。(2)外存配置磁盘、磁带、光盘,设备数量、功能、容量和有关文件的专储条件等;终端和其他外设的配置:涉及文件可能使用的范围等。(3)确定文件设计的基本指标与其他文件的接口文件的数据量文件的逻辑结构 文件的处理方式文件的使用率文件的存取时间文件的保密确定合适的文件组织方式、存取方式和介质(4)编写文件设计说明书,设计文件记录的格式,7.8.2 数据库设计,数据库设计:是在选定的数据库管理系统基础上建立数据库的过程。,7.8.2 数据库设计,7.8.2.1 数据库设计的基本知识7.8.2.2 数据库设计,7.8.2.1 数据库设计的基本知识,1.概念模型2.E-R方法3.数据模型4.关系的规范化,基本知识,客观 事物:事物 相关性质集合,人,实体 实体及 实体集联系 相关属性集合,加工、转换,数 记录据 文件库 相关数据项集合,加工转换,存储 二进制数据集合结构,计算机世界,DBMS,数据世界,DBMS的数据模型,现实世界,观念世界,认识、选择和描述,将外部信息转化为计算机内部的数据,需经以下几个不同的转换过程。,概念模型,98,数据库设计的基本步骤 数据库设计往往是将数据库设计与信息系统应用设计相结合的完整过程和步骤,同信息系统设计的步骤类似,按照规范设计的方法,独立的数据库设计过程一般分为以下六个阶段:需求分析 MIS系统分析阶段 概念结构设计 MIS系统分析阶段 逻辑结构设计 MIS系统设计阶段 物理结构设计 MIS系统设计阶段 数据库实施 MIS系统实施阶段 数据库运行和维护 MIS系统实施阶段,99,由图7.11可知,完整的数据库系统的建立过程包含了从需求分析到运行维护的全过程。,100,基本知识,模型,概念模型,数据模型,网状模型,层次模型,关系模型(目前最常用的模型),面向对象模型,101,(一)需求分析 需求分析的任务:通过详细调查现实世界要处理的对象,充分了解原系统工作概况,明确用户的各种需求,然后在此基础上确定新系统的功能。调查的重点是“数据”和“处理”,通过调查、收集与分析,获得用户对数据库的如下要求:1.信息要求:指用户需要从数据库中获得信息的内容与性 质,即在数据库中需要存储哪些数据(数据库设计的 基础)2.处理要求:指用户要完成什么处理功能,处理方式是批 处理还是联机处理(应用系统设计的基础)3.安全性与完整性要求:如系统的恢复功能,双机备份等。确定用户的最终需求是一件很困难的事,设计人员必须不断深入地与用户交流,才能逐步确定用户的实际需求。,102,(二)数据库的概念结构设计 数据库概念设计的任务:根据用户需求设计数据库的概念模型。概念模型是从用户角度看到的数据库,它可用第三章中介绍的E-R模型表示,也可以用3NF关系群来表示。,1.概念模型,概念模型:根据用户需求设计的数据库模型,称为概念模型,为从用户角度看到的模型。概念模型可用实体联系模型(E-R模型)表示。,有关概念,(1)实体:指客观存在并相互区别的事物。例如:实体可以是具体对象:一个教师、学生、一个部门;也可是抽象的概念和联系:学生的一次选课、一次借书等。(2)属性:指实体具有的某种特性。例如:学生实体可由学号、姓名、性别、年龄、系别等属性组成。(3)主键:惟一标识实体的属性集成为主键。例如:学生实体的学号可以作为学生实体的主键。(4)联系:事物间相互关联的状态。实体内部的联系:同一记录内部各个属性间的联系实体间联系:不同实体间的联系(如学生和教师等),105,两个实体型之间的联系可以分为三类:一对一联系:如果对于A中的一个个体,B中至多有一个个体 与其发生联系;反之,B中的一个体至多对应A中一个个 体,则称A与B是一对一联系;(如男女之间的夫妻关系)一对多联系:如果对于A中的每一个体,实体B中有一个以 上的个体与之发生联系,反之,B中的每一个体至多只能 对应于A中的一个个体,则称A与B是一对多联系;(如学 生实体与所在系实体之间构成一对多联系)多对多联系:如果A中至少有一个体对应于B中一个以上的 个体,反之;B中也至少有一个个体对应于A中一个以上 的个体,则称A与B为多对多联系。(如学生实体与课程 实体之间的联系),有关概念,(5)联系方式:若A,B为两个包含若干个体的总体,其间建立了某种联系,其联系方式可分为三类:一对一联系,记为1:1。学校和校长之间,火车座位和乘客之间。一对多联系,记为1:N。一个学校有若干学生,每个学生均在一个学校学习,学校和学生之间是一对多的关系。多对多联系:记为M:N。课程和学生之间,一个学生可选多门课程,每门课程可由多个学生选修。,2.E-R方法,E-R方法:表示实体间联系的方法,用以描述某一组织的信息模型。可用E-R图(或称E-R模型)来表示。基本符号:,实体,属性,联系,无向边,108,1:1(一对一联系)A中任意实体至多对应B中的一个实体,反之B中的任意实体至多对应A中的一个实体。如:观众与座位、乘客与车票、病人与病床、学校与校长、灯泡与灯座、夫妻关系。,109,1:n(一对多联系)A中至少有一个实体对应B中的多个实体,反之B中的任意实体至多对应A中的一个实体。如:城市与街道、宿舍与学生、父亲与子女、班级与学生。,110,m:n(多对多联系)A中任意实体至少有一个实体对应B中的多个实体,反之B中的任意实体至少对应A中的多个实体 如:学生与课程、工厂与产品、商店与顾客,E-R方法,物资,物资代码,名称,规格,备注,部门,部门号,名称,电话,员工,员工号,姓名,性别,所属,n,1,年龄,物资实体,部门和员工关系E-R模型,选课管理E-R模型,学生,课程,选修,学号,姓名,性别,课程号,课程名,学时数,成绩,n,年龄,m,专业,所属,1,n,专业号,专业名,性质,113,114,三种关系的E-R图如图所示:,115,例1:教学管理中涉及到学生、课程两个实体,用E-R图可表示为下图所示。此E-R图中实体的相关属性如下:学生实体属性:学号,学生姓名,所属系,年龄 课程实体属性:课程号,课程名,先行课程号 选课联系的属性:学号,课程号,成绩,学期,116,例2:下面用E-R图来表示某个工厂物资管理的概念模型。物资管理涉及的实体有:仓库:属性有仓库号、面积、电话号码;零件:属性有零件号、名称、规格、单价、描述;供应商:属性有供应商号、姓名、地址、电话号码、账号;项目:属性有项目号、预算、开工日期;职工:属性有职工号、姓名、年龄、职称。这些实体之间的联系如下:(1)一个仓库可以存放多种零件,一种零件可以存放在多个仓 库中,用库存量来表示某种零件在某个仓库中的数量;(2)一个仓库有多个职工当仓库保管员,一个职工只能在一个 仓库工作;,117,(3)职工之间具有领导-被领导关系,即仓库主任领导若干保管员;(4)供应商、项目和零件三者之间具有多对多的联系。即一个供 应商可以供给若干项目多种零件,每个项目可以使用不 同供应商供应的零件,每种零件可由不同供应商供给。,118,119,思考题:某医院病房计算机管理中涉及的实体有:科室:属性有科室名、地址、电话;病房:属性有病房号、病房名;医生:属性有工作证号、姓名、职称;病人:属性有病历号、姓名、性别。这些实体之间的联系描述如下:一个科室有多个病房,一个病房只属于一个科室;一个科室有多个医生,一个医生只属于一个科室;一个医生可负责多个病人的诊治工作,每个病人可由 多个医生进行治疗;一个病房住有多个病人,病人只能住在一个病房里。请用E-R图画出科室、病房、医生和病人的概念模型。,120,(三)数据库的逻辑结构设计 1.逻辑结构设计的任务:将概念结构设计阶段完成的概念模型转换成能被选定的数据库管理系统(DBMS)支持的数据模型(如关系模型),并对其进行优化(规范化理论)。,121,数据模型,数据模型:是对客观事物及其联系的数据化描述。层次模型网状模型关系模型面向对象模型,关系模型:用表格结构表示实体和实体间联系的数据模型。,选课管理E-R模型(概念模型),122,关系模型中的主要术语有:1.关系:一个关系对应于一张二维表;(学生关系,是关系 的型)2.元组:表中的一行,相当于一个记录;(学生记录,是关 系的值)3.属性:表中一列称为一个属性;(学号、姓名等)4.主码:表中的某个属性组,它唯一标识一个元组;(学号 属性)5.域:属性的取值范围;(学生的性别只能取“男”或“女”两 个值)6.分量:元组中的一个属性值;(学号为“036523”的学生 的姓名)7.关系模式:对关系的描述,用关系名(属性1,属性2,)来表示。如:学生(学号,姓名,性别,年龄,.),123,2.E-R模型向关系数据模型的转换(重点掌握的内容)E-R模型可以向现有的各种数据库模型转换,对不同的数据库模型有不同的转换规则。将E-R图转换为关系模型实际上就是要将E-R图中的实体、实体的属性和实体之间的联系转换为关系模式,这种转换一般遵循如下原则:,124,1)一个实体型转换为一个关系模式:实体的属性就是关系的属 性,实体的码就是关系的码;对于实体间的联系则有以下不同的情况:2)一个l:1联系转换为一个独立的关系模式,与该联系相连的 各实体的码以及联系本身的属性均转换为关系的属性,每个实体的码均是该关系的候选码(如男人和女人之间 的婚姻关系)3)一个1:n联系转换为一个独立的关系模式,与该联系相连的 各实体的码以及联系本身的属性均转换为关系的属性,而关系的码为n端实体的码(学生与所在系的关系),125,4)一个m:n联系转换为一个关系模式,与该联系相连的各实体 的码以及联系本身的属性均转换为关系的属性,而关系 的码为各实体码的组合(如学生课程之间的选课关系)5)三个或三个以上实体间的一个多元联系可以转换为一个关系 模式,与该多元联系相连的各实体的码以及联系本身的 属性均转换为关系的属性,而关系的码为各实体码的组 合(如供应关系),126,例题物资管理E-R模型,转化为关系模式如下:仓 库(仓库号,面积)零 件(零件号,零件名,单价)供应商(供应商号,名称,电话号码)产 品(产品号,产品名,产地)供 应(产品号,供应商号,供应量)构 成(产品号,零件号,使用量)库 存(零件号,仓库号,库存量),学生关系(表),课程关系(表),学生选课关系(成绩表),128,关系模型的特点:1.关系模型的概念单一:对于实体和实体之间的联系均以关系 来表示,如:学生(学号,学生姓名,所属系,年龄)课程(课程号,课程名,先行课程号)选课关系(学号,课程号,成绩,学期)2.关系是规范化的关系:规范化是指关系模型中的关系必须满 足一定的给定条件,最基本的要求是关系中的每一个分 量都是不可分的数据项,既表不能多于二维;3.关系模型中,用户对数据的检索和操作实际上是从原二维表 中得到一个子集,该子集仍是一个二维表。因而易于理 解,操作直接、方便。(如SELECT SNO FROM STUDENT.),129,由于关系模型概念简单、清晰、易懂、易用,并有严格的数学基础以及在此基础上发展起来的关系数据理论,简化了程序开发及数据库建立的工作量,因而迅速获得了广泛的应用,并在数据库系统中占据了统治地位。,4.关系的规范化,问题的提出:,关系数据库中只能存放二维表!,表1,4.关系的规范化,规范化理论:研究关系模式中各属性之间的依赖关系及其对关系模式性能的影响,探讨关系模式应该具备的性质和设计方法规范化理论提供了判别关系模式优劣的标准,为数据库设计工作提供了严格的理论依据。范式:表示关系模式的规范化程度,即满足某种约束条件的关系模式,4.关系的规范化,在五种范式中,通常只用到前三种:,133,范式:表示的是关系模式的规范化程度,也即满足某种约束条件的关系模式。(一)第一范式(1NF)1NF的定义:属于第一范式的关系应满足的基本条件是元组中的每一个分量都必须是不可分割的数据项。例如,表3.4所示关系不符合第一范式,而表3.5则是经过规范化处理,去掉了重复项后而符合第一范式的关系。(见P58),134,(二)第二范式(2NF)定义1:设R(U)是属性集U上的关系模式。X,Y是U(属性)的子集。若对于R(U)的任意一个可能的关系r(值),r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称X函数确定Y或Y函数依赖于X,记 XY。(即X的值唯一确定Y的值)定义2:在R(U)中,如果XY,并且对于X的任何一个真子集X,都有XY,则称Y对X完全函数依赖。2NF的定义:若R1NF,且每一个非主属性都完全函数依赖于主码,则R2NF。(如一个关系模式的主码由一个属性构成,则此模式一定满足第二范式?),135,例:关系模式 S-L-C(SNO,SDEPT,SLOC,CNO,G),某中SLOC为学生的住处,并且每个系的学生住在同一个地方。此关系模式的主码为(SNO,CNO)。函数依赖有:(SNO,CNO)G SNOSDEPT SNOSLOC SDEPTSLOC(因为每个系的学生只住一个地方),136,图中可以看到非主属性SDEPT,SLOC并不完全函数依赖于码(只依赖于码中的SNO)。因此S-L-C(SNO,SDEPT,SLOC,CNO,G)不符合2NF定义,即S-L-C2NF。一个关系模式R不属于2NF,就会产生以下几个问题:1.插入异常:假若要插入一个新学生,但该生还未选课,即这 个学生无CNO,这样的元组就插不进S-L-C中,因为元组主 码不能为空;2.删除异常:假定某个学生不再选修任何一门课,此时CNO将 为空,则其他信息也被删除了,从而造成删除异常;3.修改复杂:某个学生从数学系(MA)转到计算机科学系(CS),这本来只需修改此学生元组中的SDEPT分量,但因为S-L-C 中含有SLOC属性,因而还必须修改元组中的SLOC分量。,137,分析上面的例子,可以发现问题在于有两种非主属性:一种如G,它对码是完全函数依赖。另一种如SDEPT,SLOC,对码不是完全函数依赖。解决的办法是用投影分解把关系模式S-L-C分解为两个关系模式。SC(SNO,CNO,G)S-L(SNO,SDEPT,SLOC)(模式SC和S-L进行自然连接后就等价于模式S-L-C)关系模式SC与S-L中属性间的函数依赖可以用下图表示:,138,(三)第三范式(3NF)定义3:在R(U)中,如果XY,(YX),YX,YZ,则称Z对X传递函数依赖。3NF的定义:指这种关系不仅满足第二范式,而且它的任何一个非主属性都不传递依赖于任何主关键字。在上例中关系模式SC没有传递依赖,而关系模式S-L存在非主属性对码传递依赖。在S-L中,由SNOSDEPT,(SDEPTSNO),SDEPTSLOC,因此非主属性SLOC传递依赖于主码SNO。因此SC3NF,而S-L3NF。,139,一个关系模式R若不是3NF,同样会产生产生插入异常、删除异常和数据冗余。解决的办法同样是将S-L分解为:S-D(SNO,SDEPT)D-L(SDEPT,SLOC)分解后的关系模式S-D与D-L中不再存在传递依赖,都满足第三范式的要求。3NF消除了插入、删除异常及数据冗余、修改复杂等问题,已是比较规范的关系。(范式并非越高越好),140,例:产品关系(产品代码,产品名,生产厂名,生产厂地址,单价)结合以上例题,重点讲解:判断一个关系模式满足第几范式的正确求解过程。,4.关系的规范化,表1的问题:不是第一范式(1NF)解决方案:由非1NF规范化为1NF(如表2),表2,4.关系的规范化,表二存在的问题:数据冗余:当某个教师有多项研究课题时,必须有多条记录,而这多条记录中,该教师的姓名和职称数据项完全相同。插入异常:当新调入一个教师时,只有教师代码、姓名、职称的信息,没有研究课题的信息,而研究课题号是主关键字之一,缺少时无法输入该教师信息。反之,当插入一个新的研究课题时也往往缺少相应的教师代码,以致无法插入。删除异常:当删除某个教师的信息时,常常会丢失研究课题的信息。解决方案:将一个非2NF的关系模式分解为多个2NF的关系模式。,4.关系的规范化,将表2分解为如下三个关系教师关系:教师代码、姓名、职称、教师所在系、电话;课题关系:研究课题号、研究课题名;教师与课题关系:教师代码、研究课题号。,表3,表4,表5,4.关系的规范化,表3存在着传递依赖,同样会有高度冗余和更新异常问题。解决方案:消除传递依赖,将所有关系转换为为如下几个3NF关系:教师关系:教师代码、姓名、职称;系:系、电话课题关系:研究课题号、研究课题名;教师与课题关系:教师代码、研究课题号。3NF消除了插入异常、删除异常、数据冗余及修改复杂等问题,已经是比较规范的关系。,7.8.2.2 数据库设计,数据库设计的步骤,数据库设计的步骤,1.用户需求分析:对现实世界要处理的对象(组织、部门、企业等)进行详细调查,在了解原系统的概况,确定新系统功能的过程中,收集支持系统目标的基础数据及其处理。对对象进行系统调查,了解现有组织管理状况以及用户对信息系统功能的需求。2.概念结构设计:应在系统分析阶段进行。任务是根据用户需求设计数据库的