公共基础知识复习资料.docx
二级公共基础知识总结二级公共基础知识是参加所有计算机二级考试的考生必考的一门课,在 二级考试中占30%的分值,本资料涵盖二级公共基础知识的重点,考点。 公共基础知识的复习没有技巧,就是背诵、背诵、再背诵! !红色(即 划线)字体是至关重要的部分,框起来的字体为填空题的常考词汇,考 试之前可以将本总结全部打印出来,这里面有100分里30分的原题, 希望它能够对大家的这次考试有所帮助。注意:这是最新的公共基础知识复习资料,请大家将自己手中的资料与 这份资料比照,如有不同之处,请以本资料为准。第一章数据结构与算法1.1算法算法:是指解题方案的准确而完整的描述。一算法不等于程序,也不等计算机方法。程序的编制不可能优于算法的设计。算法的基本特征:是一组严谨地定义运算顺序的规则,每一个规则都是有效的,是明确的,此顺序将在有限的次数下终止。特征包括:(1)可行性 算法原则上能够精确地执行。(2)确定性算法中每一步骤都必须有明确定义,不允许有模棱两可的解释, 不允许有多义性。(3)有穷性 算法必须能在有限的时间内做完,即能在执行有限个步骤后终止。(4)拥有足够的情报。算法的基本要素:一是对数据对象的运算和操作;二是算法的控制结构。指令系统:一个计算机系统能执行的所有指令的集合。算法的基本运算包括:算术运算、逻辑运算、关系运算、数据传输算法的控制结构:顺序结构、选择结构、循环结构。算法基本设计方法:列举法、归纳法、递推、递归、减斗递推技术、回溯法。算法效率的度量一一算法复杂度:时间复杂度和空间复杂度。算法时间复杂度是指执行算法所需要的计算工作量。通常,一个算法所用的时间 包括编译时间和运行时间。算法空间复杂度是指执行这个算法所需要的内存空间。包括算法程序所占的空 间,输入的初始数据所占的空间,算法执行过程中所需的额外空间。空间复杂度和时间复杂度并不相关。1.2数据结构的基本基本概念数据:数据是客观事物的符号表示,是能输入到计算机中并被计算程序识别和处理的符号的总称,如文档,声音,视频等。数据元素:数据元素是数据的基本单位。数据对象:数据对象是性质相同的数据元素的集合。数据结构:是指由某一数据对象中所有数据成员之间的关系组成的集合。数据结构可分为数据的逻辑结构和存储结构 数据的逻辑结构是对数据元素之间的逻辑关系的描述,与数据的存储无关,是面 向问题的,是独立于计算机的。它包括数据对象和数据对象之间的关系。数据的存储结构也称为数据的物理结构,是数据在计算机中的存放的方式,是面 向计算机的,它包括数据元素的存储方式和关系的存储方式。数据存储结构和逻辑结构的关系:一种数据的逻辑结构可以表示成多种存储结构 即数据的逻辑结构和存储结构不一定一一对应。常见的存储结构有:顺序,链接,索引等。采用不同的存储结构其数据处理的效率是不同的。线性结构条件,(一个非空数据结构):(1) 有日只有一个税结点.(2) 每一个结点最多有一个前件,也最多有一个后件。非线性结构:不满足线性结构条件的数据结构。栈、区列、双丽表是线性结构,树、二叉树为非线性结构。1. 3线性表及线性链表线性表是由一组数据元素构成,数据元素的位置只取决于自己的序号,元素之间 的相对位置是线性的。在复杂线性表中,由若干项数据元素组成的数据元素称为记录,而由多个记录构 成的线性表又称为文件 非空线性表的结构特征:(1) 且只有一个根结点al,它无前件;(2) 有且只有一个终端结点an,它无后件;(3) 除根结点与终端结点外,其他所有结点有且只有一个前件,也有且只有一个后件。结点个数n称为|线性表的长度,当n=0时,称为空表。线性表的顺序存储结构具有以下两个基本特点:(1) 线性表中所有元素的所占的存储空间是连续的;(2) 线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。元素ai的存储地址为:ADR(ai)=ADR(a1) + (i-1)k,,ADR(a1)为第一个元素 的地址,k代表每个元素占的字节数。顺序表的运算:查找、插入、删除。线性链表是线性表的链式存储结构,数据结构中的每一个结点对应于一个存储单 元,这种存储单元称为存储结点,简称结点 结点由两部分组成:(1)用于存储数据元素值,称为数据域;(2)用于存放指 针,称为指针域,用于指向前一个或后一个结点。在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺 序与数据元素之间的逻辑关系可以不一致,而数据元素之间的逻辑关系是由指针 域来确定的。链式存储方式即可用于表示线性结构,也可用于表示非线性结构。线性单链表,HEAD称为头指针,HEAD = NULL (或0)称为空表数据域指针域数据域指针域数据域指针域图1单链表的结构双向链表有两个指针:左指针(Llink)指向前件结点,右指针(Rlink)指向后件结点。L D R L D R L D R 图2双舞表的结构循环舞表:循环链表与单舞表的不同的是它的最后一个结点的指针域存波的里指向第一个结 点的指针而单链表存放的是空指针。图3循环链表的结构线性世表的基本运算:查找、插入、删除。1. 4栈和队列栈是一种特殊的线性表,只允许在表的一端进行插入与删除的线性表,允许插入 与删除的一端称为栈顶,不允许插入与删除的另一端称为栈底。栈按照“先进后出”(FILO)或'后进先出”驴0)组织数据,栈具有记忆功能。 用top表示栈顶位置,用bottom表示栈底。栈的存储方式有顺序存储的链式存 储。栈的实例:子弹夹栈的基本运算:(1)插入元素称为入栈运算;(2)删除元素称为退栈运算;(3) 读栈顶元素是将栈顶元素赋给一个指定的变量,此时指针无变化。队列是一种特殊的线性表,只允许在一端(队尾)进入插入,而在另一端(队头) 进行删除的线性表。Rea/指针指向队尾,什ont指针指向队头。队列是“先进先出”(口。)或“后进后出”(LILO)的线性表。队列的存储结构 顺序存储:一维数组。 链式存储:线性链表。队列的实例:火车进隧道 队列运算包括(1)入队运算:从队尾插入一个元素;(2)退队运算:从队头删 除一个元素。队列的顺序存储结构一般采用队列循环的形式。循环队列:s=0表示队列空,s=1且什ont=rear表示队列满1. 5树与二叉树树是一种简单的非线性结构,所有元素之间具有明显的层次特性。树的基本概念:结点:每个结点都包含数据项和若干 个指向其子树的分支。如左图所示的 树中有7个结点。结点的度:结点所拥有的子树棵数。如左图,根结点A的度为3。结点的层次:根结点在第一层,同一 层上左右结点的子结点在下一层。如 左图,根结点A在第一层,B,C,D在第 二层,E,F,G在第三层。树的深度:所处层次最大的那个结点 的层次称为树的深度。如左图,树的 深度为3。树的度:树中所有结点的度的最大值 就是树的度。如左图,树的度为3。在树结构中,每一个结点只有一个前件,称为父结点,没有前件的结点只有一个, 称为树的根结点,简称树的根。每一个结点可以有多个后件,称为该结点的子结 点。没有后件的结点称为叶子结点。二叉树是一种特殊的树形结构,每个结点最多只有两棵子树,且有左右之分不能 互换。二叉树的特点:(1)非空二叉树只有一个根结点;(2)每一个结点最多有两棵 子树,且分别称为该结点的左子树与右子树。二叉树的基本性质:(1)在二叉树的第k层上,最多有2k-l(k1)个结点;(2)深度为m的二叉树最多有2m-i个结点;(3)度为0的结点(即叶子结点)总是比度为2的结点多一个;(4)具有n个结点的二叉树,其深度至少为log2n + l,其中Iog2n表小取 log2n的整数部分;(5)具有n个结点的完全二叉树的深度为log2n + 1;(6)设完全二叉树共有n个结点。如果从根结点开始,按层序(每一层从左到右)用自然数1,2, .n给结点进行编号(k=1,2.n),有以下结论: 若k=1,则该结点为根结点,它没有父结点;若k>1,则该结点的父结点编号为 INT(k/2); 若2k<n,则编号为k的结点的左子结点编号为2k;否则该结点无左子结点(也无右子结点); 若2k+1<n,则编号为k的结点的右子结点编号为2k+1;否则该结点无右 子结点。满二叉树是指除最后一层外,每一层上的所有结点有两个子结点,则k层上有 2k-1个结点深度为 m 的满二叉树有2m-1个结点。完全二叉树是指除最后一层外,每一层上的结点数均达到最大值,在最后一层上 只缺少右边的若十结点。二叉树存储结构采用链式存储结构,对于满二叉树与完全二叉树可以按层序进行 顺序存储。二叉树的遍历:(重点)前序遍历:先访问根结点、然后遍历左子树,最后遍历 右子树;并且,在遍历左、右子树时,仍然先访问根结 点,然后诚历左子树,最后诚历右子树-前序遍历图5可得:ABCDFHEGo中序遍历:先遍历左子树、然后访问根结点,最后遍历 右子树;并且,在遍历左、右子树时,仍然先遍历左子 树,然后访问根结点,最后遍历右子树。中序遍历圈5可得:BAFHDCGEo后序遍历:先遍历左子树、然后遍历右子树,最后访问 根结点;并且,在遍历左、右子树时,仍然先遍历左子 树,然后遍历右子树,最后访间根结点。后序遍历图5可得:BHFDGECAo1. 6查找技术顺序查找的使用情况:(1)线性表为无序表;(2)表采用链式存储结构。二分法查找只适用于顺序存储的有序表,对于长度为n的有序线性表,最坏情 况只需比较|log2n|次,而顺序查找需要比较n次。1. 8查找与排序技术顺序查找是从表的一端开始,依次扫描表中的各个元素,并与所要查找的数进行 比较。在下列两种情况下也只能采用顺序查找:(1) 如果线性表为无序表,则不管是顺序存储结构还是链式存储结构,只能用 顺序查找。(2) 即使是有序线性表,如果采用链式存储结构,也只能用顺序查找。二分查找的条件:(1)用顺序存储结构 (2)线性表是有序表。对于长度为n的有序线性表,在最坏情况下,二分法查找只需比较l og2n次,而顺 序查找需要比较n次。排序是指将一个无序序列整理成按值非递减顺序排列的有序序列。1、交换排序(1)冒泡排序法,在最坏的情况下,冒泡排序需要比较次数为而而2。(2)快速排序法,在最坏的情况下,快速排序需要比较次数为n(n-1)/2。2、插入类排序法:(1)简单插入排序法,最坏情况需要|n(n-1)/2|次比较; (2)希尔排序法,最坏情况需要|0(25)|次比较。(大写O是算法复杂度的表示方法)3、选择类排序法:(1)简单选择排序法,最坏情况需要|n(n-1)/2|次比较; (2)堆排序法,最坏情况需要omogz回次比较。相比以上几种(除希尔排序法外),堆排序法的时间复杂度最小。第二章程序设计基础2. 1程序设计设计方法和风格如何形成良好的程序设计风格1、源程序文档化;2、数据说明的方法;3、语句的结构;4、输入和输出。注释分序言性注释和功能性注释,语句结构清晰第一、效率第二2. 2结构化程序设计结构化程序设计方法的四条原则是:1.自顶向下;2.逐步求精;3.模块化4.限制使用goto语句结构化程序的基本结构和特点:(1)顺序结构:一种简单的程序设计,最基本、最常用的结构;(2)选择结构:又称分支结构,包括简单选择和多分支选择结构,可根据条件, 判断应该选择哪一条分支来执行相应的语句序列;(3)循环结构:又称重复结构,可根据给定条件,判断是否需要重复执行某一 相同程序段。结构化程序设计的特点:只有一个入口和出口。2. 3面向对象的程序设计面向对象的程序设计:以60年代末挪威奥斯陆大学和挪威计算机中心研制的 SIMULA语言为标志。面向对象的程序设计以对象为核心,强调对象的抽象性,封装性,继承性和多态 性。面向对象方法的优点:(1)与人类习惯的思维方法一致;(2)稳定性好;(3)可重用性好;(4)易于开发大型软件产品;(5)可维护性好。对象是面向对象方法中最基本的概念,可以用来表示客观世界中的任何实体,对象是实体的抽象。面向对象的程序设计方法中的对象是系统中用来描述客观事物的一个实体,是构 成系统的一个基本单位,由一组表示其静态特征的属性和它可执行的一组操作组 成。属性即对象所包含的信息,操作描述了对象执行的功能,是对象的动态属性,操作也称为方法或服务。对象的基本特点:(1)标识惟一性;(2)分类性;(3)多态性;(4)封装性;(5)模块独立性 好。类是指具有共同属性、共同方法的对象的集合。所以类是对象的抽象,对象是对应类的一个实例。消息是一个实例与另一个实例之间传递的信息。对象间的通信靠消息传递。它请求对象执行某一处理或回答某一要求的信息,它统一了数据流和控制流。消息的组成包括:(1)接收消息的对象的名称;(2)消息标识符,也称消息名;(3)零个或多个 参数。继承是指能够直接获得已有的性质和特征,而不必重复定义他们。继承分单继承和多重继承。单继承指一个类只允许有一个父类,多重继承指一个 类允许有多个父类。多态性是指同样的消息被不同的对象接受时可导致完全不同的行动的现象。第三章软件工程基础3. 1软件工程基本概念计算机软件是包括程序、数据及相关文档的完整集合。名称描述程序软件开发人员根据用户需求开发的、用程序设计语言描述的、适合计算机执行的指令序列数据使程序能正常操纵信息的数据结构文档与程序的开发、维护和使用有关的图文资料软件的特点包括:(1)软件是一种逻辑实体;(2)软件的生产与硬件不同,它没有明显的制作过程;(3)软件在运行、使用期间不存在磨损、老化问题;(4)软件的开发、运行对计算机系统具有依赖性,受计算机系统的限制,这导 致了软件移植的问题;(5)软件复杂性高,成本昂贵;(6)软件开发涉及诸多的社会因素。软件按功能分为应用软件、系统软件、支撑软件(或工具软件)。名称描述应用软件为解决特定领域的应用而开发的软件,如办公自动化软件系统软件计算机管理自身资源,提高计算机使用效率并为计算机用户提供各种服务的软件,如操作系统支撑软件(或工具软件)支撑软件是介于两者之间,协助用户开发软件的工具性软件。软件生命周期:软件产品从提出、实现、使用维护到停止使用退役的过程。软件生命周期的三个阶段:软件定义、软件开发、运行维护.主要活动阶段是:(1)可行性研究与计划制定;(2)需求分析;(3)软件设计;(4)软件实现;(5)软件测试;(6)运行和维护。软件生命周期中,能够准确确定软件系统必须做什么和必须具备哪些功能的阶段软件危机泛指在计算机软件的开发和维护过程中遇到的一系列严重的问题,集中 表现在成本,质量。生产效率等几个方面。软件工程是应用于计算机软件的定义、开发和维护的一整套方法、工具、文档、 实践标准和工序。是建立并使用完善的工程化原则,以较经济的手段获得,能在 实际机器上有效运行的可靠软件的一系列方法;软件工程的主要思想强调在软件 开发过程中需要应用工程化原则。软件工程的核心思想是把软件当作一个工程产 品来处理。方法方法是完成软件工程项目的技术手段工具工具支持软件的开发、管理、文档生成过程过程支持软件开发的各个环节的控制、管理软件工程过程是把软件转化为输出的一组彼此相关的资源和活动,包含4种基本 活动:(1)P(plan)软件规格说明;(2)D(do)软件开发;(3)C(check)软件确认;(4)A(action)软件演进。软件工程的目标和与原则:目标:在给定成本、进度的前提下,开发出具有有效性、可靠性、可理解性、可 维护性、可重用性、可适应性、可移植性、可追踪性和可互操作性且满足用户需 求的产品。基本目标:付出较低的开发成本;达到要求的软件功能;取得较好的软件性能; 开发软件易于移植;需要较低的费用;能按时完成开发,及时交付使用。软件工程的理论和技术性研究的内容主要包括:软件开发技术和软件工程管理 软件开发技术包括:|软件开发方法学、开发过程、开发工具和软件工程环境。软件工程管理包括:|软件管理学、软件工程经济学、软件心理学等内容,软件管理学包括人员组织、进度安排、质量保证、配置管理、项目计划等。软件工程原则包括抽象、信息隐蔽、模块化、局部化、确定性、一致性、完备性 和可验证性。3. 2结构化分析方法结构化分析方法是面向数据流自顶而下逐步求精进行需求分析的方法。结构化方 法的核心和基础是结构化程序设计理论I。需求分析方法有(1)结构化需求分析方法;(2)面向对象的分析的方法 从需求分析建立的模型的特性来分:静态分析和动态分析 结构化分析方法的实质:着眼于数据流,自顶向下,逐层分解,建立系统的处理 流程,以数据流图和数据字典为主要工具,建立系统的逻辑模型。结构化分析的常用工具(1)数据流图(DFD); (2)数据字典(DD); (3)判定树(4)|判定表|。数据流图:描述数据处理过程的工具,是需求理解的逻辑模型的图形表示,它直 接支持系统功能建模。数据字典:对所有与系统相关的数据元素的一个有组织的列表,以及精确的、严 格的定义,使得用户和系统分析员对于输入、输出、存储成分和中间计算结果有 共同的理解。数据字典是结构化分析的核心。数据字典由以下4类元素组成(1)数据流 (2)数据流分量(3)数据存储(4)处理 判定树:从问题定义的文字描述中分清哪些是判定的条件,哪些是判定的结论, 根据描述材料中的连接词找出判定条件之间的从属关系、并列关系、选择关系, 根据它们构造判定树。判定表:与判定树相似,当数据流图中的加工要依赖于多个逻辑条件的取值,即 完成该加工的一组动作是由于某一组条件取值的组合而引发的,使用判定表描述 比较适宜。软件需求规格说明书的特点:软件需求规格说明书(SRS,Software Requirement Specification)是需求分析阶 段得出的最主要的文档。软件需求规格说明书的特点:有正确性、无歧义性、完 整性、可验证性、一致性、可理解性、可修改性和可追踪性。其中最重要的是无 歧义性。3. 3结构化设计方法软件设计的基本目标是用比较抽象概括的方式确定目标系统如何完成预定的任 务,|软件设计是确定系统的物理模型|。软件设计是开发阶段最重要的步骤,是将需求准确地转化为完整的软件产品或系 统的唯一途径。从技术观点来看,软件设计包括软件结构设计、数据设计、接口设计、过程设计 结构设计:定义软件系统各主要部件之间的关系。数据设计:将分析时创建的模型转化为数据结构的定义。接口设计:描述软件内部、软件和协作系统之间以及软件与人之间如何通信。过程设计:把系统结构部件转换成软件的过程描述。从工程管理角度来看:概要设计和详细设计 软件设计的一般过程:软件设计是一个迭代的过程;先进行高层次的结构设计; 后进行低层次的过程设计;穿插进行数据设计和接口设计。衡量软件模块独立性使用耦合性和内聚性两个定性的度量标准。在程序结构中各模块的内聚性越强,则耦合性越弱。优秀软件应高内聚,低耦合。结构化分析方法是面向数据流自顶而下,逐步求精进行需求分析的方法,基本思 想将软件设计成由相对独立,单一功能的模块组成的结构,与结构分析方法衔接 使用,以数据流图为基础得到软件的模块结构,适用于变换型结构和事物型结构 的目标系统。软件概要设计的基本任务是:(1)设计软件系统结构;(2)数据结构及数据库设计;(3)编写概要设计文档;(4)概要设计文档评审。模块用一个矩形表示,箭头表示模块间的调用关系。在结构图中还可以用带注释的箭头表示模块调用过程中来回传递的信息。还可用 带实心圆的箭头表示传递的是控制信息,空心圆箭心表示传递的是数据。结构图的基本形式:基本形式、顺序形式、重复形式、选择形式。结构图有四种模块类型:传入模块、传出模块、变换模块和协调模块。典型的数据流类型有两种:变换型和事务型 变换型系统结构图由输入、中心变换、输出三部分组成。事务型数据流的特点是:接受一项事务,根据事务处理的特点和性质,选择分派 一个适当的处理单元,然后给出结果。详细设计:是为软件结构图中的每一个模块确定实现算法和局部数据结构,用某 种选定的表达工具表示算法和数据结构的细节。常见的详细设计工具有:图形工具、表格工具、语言工具。图形工具:程序流程图:箭头表示控制流,方框表示加工步骤,菱形表示逻辑条件。N-S图:有五种基本图形。PAD图:问题分析图,有五种基本图型。表格工具:判定表。语言工具:PDL 过程设计语言(结构化的英语和伪码)。3. 4软件测试软件测试定义:使用人工或自动手段来运行或测定某个系统的过程,其目的在于 检验它是否满足规定的需求或是弄清预期结果与实际结果之间的差别。软件测试的目的:发现程序中的错误。软件测试方法:静态测试和动态测试。静态测试包括代码检查、静态结构分析、代码质量度量。不实际运行软件,主要 通过人工进行。动态测试:是基本计算机的测试,主要包括白盒测试方法和黑盒测试方法。I白盒测试I:在程序内部进行,主要用于完成软件内部CAO作的验证。主要方法有逻辑覆盖、基本基路径测试。白盒测试的方法:逻辑覆盖,基本路经测试。黑盒测试I:主要诊断功能不对或遗漏、界面错误、数据结构或外部数据库访问错 误、性能错误、初始化和终止条件错,用于软件确认。主要方法有等价类划分法、 边界值分析法、错误推测法、因果图等。黑盒测试的方法:等价划分法,边界值分析法,错误推测法。软件测试过程一般按4个步骤进行:单元测试|、集成测试|、验收测试|(确认测试) 和系统测试I。3. 5程序的调试程序调试的任务是诊断和改正程序中的错误,主要在开发阶段进行。程序调试的基本步骤:(1)错误定位;(2)修改设计和代码,以排除错误;(3)进行回归测试,防止 引进新的错误。软件调试可分表静态调试和动态调试。静态调试主要是指通过人的思维来分析源 程序代码和排错,是主要的设计手段,而动态调试是辅助静态调试。主要调试方法有:(1)强行排错法;(2)回溯法;(3)原因排除法。第四章数据库设计基础4. 1数据库系统的基本概念数据:实际上就是描述事物的符号记录。数据的特点:有一定的结构,有型与值之分,如整型、实型、字符型等。而数据 的值给出了符合定型的值,如整型值15。数据库:是数据的集合,具有统一的结构形式并存放于统一的存储介质内,是多 种应用数据的集成,并可被各个应用程序共享。所以数据库技术的根本目标是解 决数据共享问题。数据库存放数据是按数据所提供的数据模式存放的,具有集成与共享的特点。数据库管理系统:一种系统软件,负责数据库中的数据组织、数据操纵、数据维 护、控制及保护和数据服务等,是数据库的核心。数据库系统包含数据库和数据 库管理系统。数据库管理系统功能:(1)数据模式定义:即为数据库构建其数据框架;(2)数据存取的物理构建:为数据模式的物理存取与构建提供有效的存取方法与手段;(3)数据操纵:为用户使用数据库的数据提供方便,如查询、插入、修改、删除等以及简单的算术运算及统计;(4)数据的完整性、安生性定义与检查;(5)数据库的并发控制与故障恢复;(6)数据的服务:如拷贝、转存、重组、性能监测、分析等。为完成以上六个功能,数据库管理系统提供以下的数据语言:(1)数据定义语言:负责数据的模式定义与数据的物理存取构建;(2)数据操纵语言:负责数据的操纵,如查询与增、删、改等;(3)数据控制语言:负责数据完整性、安全性的定义与检查以及并发控制、故 障恢复等。数据语言按其使用方式具有两种结构形式:交互式命令(又称自含型或自主型语 言)宿主型语言(一般可嵌入某些宿主语言中)。数据库管理员:对数据库进行规划、设计、维护、监视等的专业管理人员。数据库系统I:由数据库(数据)、数据库管理系统(软件)、数据库管理员(人员)、硬件平台(硬件)、软件平台(软件)五个部分构成的运行实体。数据库应用系统:由数据库系统、应用软件及应用界面三者组成。数据管理技术的发展阶段:人工管理阶段,文件系统阶段,数据库系统阶段,I 数据独立性最高的阶段是数据库系统阶段。文件系统阶段:提供了简单的数据共享与数据管理能力,但是它无法提供完整的、 统一的、管理和数据共享的能力。层次数据库与网状数据库系统阶段:为统一与共享数据提供了有力支撑。关系数据库系统阶段数据库系统的基本特点:数据的集成性、数据的高共享性与低冗余性、数据独 立性(物理独立性与逻辑独立性)、数据统一管理与控制。数据库系统的三级模式:(1)概念模式:数据库系统中全局数据逻辑结构的描述,全体用户公共数据视 图;一个数据库只有一个概念模式。(2)外模式:也称子模式与用户模式。是用户的数据视图,也就是用户所见到 的数据模式;一个概念模式可以有若十个外模式。(3)内模式:又称物理模式,处于最底层,它给出了数据库物理存储结构与物 理存取方法。一个数据库只有一个内模式。数据库系统的两级映射:(1)概念模式到内模式的映射;(2)外模式到概念模式的映射。4.2数据模型数据模型的概念:是数据特征的抽象,从抽象层次上描述了系统的静态特征、动 态行为和约束条件,为数据库系统的信息表与操作提供一个抽象的框架。描述了 数据结构、数据操作及数据约束。数据模型按不同的应用层次分为:概念数据模型:简称概念模型,是一种面向客观世界,面向用户的模型,不涉及 具体的硬件环境和平台也与具体的软件环境无关的模式,它是整个数据模型的基 础。逻辑数据模型:又称数据模型,它是一种面向数据库的模型。分为层次模型,网 状模型,关系模型和面向对象模型,其中层次模型和网状模型统称为非关系模型。 层次模型用树型结构表示实体之间联系的模型。物理数据模型:又称物理模型,它是一种面向计算机物理表示的模型。最常见的数据模型主要包括:|层次模型,网状模型,关系模型E-R模型(实体-联系模型)的基本概念(最著名的概念模型)(1)实体:用矩形表示,现实世界中的事物; (2)属性|:用椭圆表示,事物的特性;(3)联系:用菱形表示,现实世界中事物间的关系。实体集的关系有一对一、一对多、多对多的联系。E-R模型三个基本概念之间的联接关系:实体是概念世界中的基本单位,属性有 属性域,每个实体可取属性域内的值。一个实体的所有属性值叫元组E-R模型的图示法:(1)实体集表示法;(2)属性表法;(3)联系表示法。层次模型的基本结构是树形结构,具有以下特点:(1)每棵树有且仅有一个无双亲结点,称为根;(2)树中除根外所有结点有且仅有一个双亲。从图论上看,网状模型是一个不加任何条件限制的无向图。关系模型采用二维表来表示,简称表,由关系数据结构,关系操纵和关系完整性 约束3部分组成,在关系数据库中,用来表示实体间联系的是关系。一个关系对应一张二维表。一个关系就是一个二维表,但是一个二维表不一定是 一个关系。元组:表中的一行即为一个元组。属性:表中的一列即为一个属性,给每一个属性起一个名称即属性名。分量:元组中的一个属性值,是不可分割的基本数据项。域:属性的取值范围。在二维表中凡能唯一标识元组的最小属性称为键或码。从所有侯选健中选取一个 作为用户使用的键称主键。表A中的某属性是某表B的键,则称该属性集为A的外 键或外码。关系中的数据约束:(1)实体完整性约束:约束关系的主键中属性值不能为空值;(2)参照完全性约束:是关系之间的基本约束;(3)用户定义的完整性约束:它反映了具体应用中数据的语义要求。4.3关系代数关系数据库系统的特点之一是它建立在数据理论的基础之上,有很多数据理论可 以表示关系模型的数据操作,其中最为著名的是关系代数与关系演算。关系模型的基本运算:(1)插入(2)删除(3)修改(4)查询(包括投影、选择、笛卡尔积运算)关系模型的扩充运算:(1)交(2)除q连接(自然连接)关系代数的5个基本操作中并,差,交,笛卡尔积是二目运算。设关系R和S具有相同的关系模式1、并:R和S的并是由属于R或属于S的所有元组构成的集合。2、差:R和S的差是由属于R但是不属于S的元组构成的集合3、笛卡尔积:设R和S的元数分别为r和s,R和,的笛卡尔积是一个(r+s)元的元 组集合,每个元组的前r个分量来自R的一个元组,后s个分量来自,的一个元组。 运算后得到的新表的元组数是R*S,属性是r+s。4、交:属于R又属于S的元组构成的集合。5、投影:一元运算,对一个关系进行垂直切割,消去某些列,并重新按排列的 顺序。6、选择:一元运算,根据某些条件对关系进行水平分割。即选择符合条件的元 组。7、除:给定关系R(X,Y)和S(Y,Z),其中X,Y,Z是属性组,R中的Y和S 中Y可以有不同的属性名,但必须出自相同的域集。8、连接:也称0连接运算,是一种二元运算,它的操作是从两个关系的笛卡尔 积中选取属性间满足一定条件的元组,以合并成一个大关系。连接运算包括等值 连接和不等值连接。连接运算后得到的新表的属性是运算前表中属性相加。即多 于原来关系中属性的个数。9、自然连接:自然连接满足的条件是(1)两关系间有公共域(2)通过公共域 的相等值进行连接。4.4数据库设计与管理数据库设计是数据应用的核心 数据库设计的两种方法:(1)面向数据:以信息需求为主,兼顾处理需求;(2)面向过程:以处理需求为主,兼顾信息需求。数据库设计目前一般采用生命周期法,即将整个数据库应用系统的开发分解成目 标独立的若干阶段。它们是:需求分析阶段、概念设计阶段、逻辑设计阶段 物理设计阶段 需求分析常用结构析方法和面向对象的方法。结构化分析(简称SA)方法用自 顶向下、逐层分解的方式分析系统。用数据流图表达数据和处理过程的关系。对 数据库设计来讲,数据字典是进行详细的数据收集和数据分析所获得的主要结 果。数据字典是各类数据描述的集合,包括5个部分:数据项、数据结构、数据流(可 以是数据项,也可以是数据结构)、数据存储、处理过程。数据库概念设计的目的是分析数据内在语义关系。设计的方法有两种(1)集中式模式设计法(适用于小型或并不复杂的单位或部门);(2)视图集成设计法。设计方法:E-R模型与视图集成。视图设计一般有三种设计次序:自顶向下、由底向上、由内向外。视图集成的几种冲突:命名冲突、概念冲突、域冲突、约束冲突。关系视图设计:关系视图的设计又称外模式设计。关系视图的主要作用:(1)提供数据逻辑独立性;(2)能适应用户对数据的不同需求;(3)有一 定数据保密功能。从E-R图向关系模型转换E-R模型关系模型E-R模型关系模型实体元组属性属性实体集关系联系关系数据库物理设计主要目标是对数据内部物理结构作调整并选择合理的存取路径, 以提高数据库访问速度,有效利用存储空间.一般RDBMS中留给用户参与物理设 计的内容大致有索引设计,集成簇设计和分区设计。数据库管理的内容:(1)数据库的建立;(2)数据库的调整;(3)数据库的重组;(4)数据库安全性与完整性控制;(5)数据库的故障恢复;(6)数据库监控。本手册使用说明:本手册是对二级C语言考试公共基础知识的总结。公共基础知识的复习没有 技巧,就是背诵、背诵、再背诵!红色(即划线)字体是至关重要的部分,框 起来的字体为填空题的常考词汇,考试之前可以将本总结全部打印出来,这里面 有100分里30分的原题,希望它能够对大家的这次考试有所帮助。最后,衷心祝愿我们的每位学员都能顺利通过考试,并取得理想的成绩!