《数据资源管理》 习题及答案 第6--10章 数据分析与服务---数据资源管理机构.docx
《《数据资源管理》 习题及答案 第6--10章 数据分析与服务---数据资源管理机构.docx》由会员分享,可在线阅读,更多相关《《数据资源管理》 习题及答案 第6--10章 数据分析与服务---数据资源管理机构.docx(21页珍藏版)》请在三一办公上搜索。
1、数据资源管理配套习题第六章数据分析与服务一、单项选择题1.下列关于数据分析的说法错误的是()。A.数据融合将被存储的数据减少至可操作、可管理、有意义的数据量。B.数据分析包含数据清理、转换、建模、统计等操作,提取有用信息并形成结论。C.深度分析一般采用SQL查询语句对结构化数据进行多维度的聚集查询处理。D.对于细节层面信息的获取,数据分析缺乏如索引和访问控制等方面的技术。(答案:C;深度分析采用复杂度较高的数据挖掘和机错学习方法,可以处理结构化的和非结构化数据。参考:6.1.1数据分析定义)2 .下列关于数据可视化的说法错误的是()。A.企业的业务系统数据属于外部数据。B.数据可视化将抽象、冗
2、余甚至毫无联系的信息整合起来,并转换为图形、符号或者概念模型。C.数据可视化的流程闭环,从数据采集、数据清洗、数据库技术到可视化,再回到数据采集。D.数据采集的方式有传感器、爬虫、录入、导入、接口等。(答案:Ao参考:6.2.1数据可视化定义)3 .下列关于数据可视化方法的说法错误的是()。A.面积与尺寸可视化要用数学公式计算,来表达准确的尺度和比例。B.地域空间可视化以用地图为大背景,可以定位某一地区来查看详细数据。C.概念可视化将抽象的指标数据转换成用户熟悉的容易感知的数据。D.眼球热力图是图形可视化的一种应用。(答案:D:眼球热力图是颜色可视化的种应用。参考:6.2.3数据可视化方法)4
3、 .下列关于数据服务定义的说法错误的是()。A.数据服务通过网络实现数据的有效管理、精确访问、异构集成、相互共享、信息提取等功能。B.数据服务将数据管理平台、多数据源查询引擎和数据服务设计开发工具紧密联系起来。C.随着用户需求不断增加,数据服务的形式和内容呈现多样化趋势。D.数据服务对用户非唯一、非排他,降低了数据源的安全性。(答案:D:数据服务对用户具有唯性和排他性,大大增强了数据源本身的安全性。参考:6.3.1数据服务定义)5 .下列关于数据服务分类的说法错误的是()。A.企业的数据服务分为数据集服务和数据API服务两大类。B.基础数据服务面向的场景包括千人千面、画像分析等,通过实现数据中
4、台全域标签跨计算、统一查询分析,加快数据应用开发速度。C.智慧政府的工具类大数据服务利用产品化的工具产生或生产数据,面向应用的大数据服务针对已有的数据进行数据资源消费。D.智慧政府的工具类大数据服务包括元数据管理服务、数据仓库建模服务、数据共享交换服务等。(答案:B:B选项描述的是标签画像服务。参考:632数据服务分类)二、不定项选择题1.关于数据湖的数据分析,下列说法正确的是()。A.从数据湖获取的初始数据不能直接利用,需要进行数据融合。B.假设搜索是寻找搜索标准模糊的数据,相关技术有机器学习、概念检索等。C.数据缩减的技巧有消除重复数据、消除或修改异常值、数据压缩等。D.支持度、置信度和提
5、升度是对比分析常用的指标。E.上下文语义分析将文本数据转换成一致的数据库格式,并识别文本的语境。F.置信度是两种商品同时被购买的概率,或者某个商品组合的购买次数占总商品购买次数的比例。(答案:ACE:找搜索标准模糊的数据是针对数据分析两面性的检索;支持度、置信度和提升度是关联分析常用的指标;两种商品同时被购买的概率或者某个商品组合的购买次数占总商品购买次数的比例是指支持度。参考:”6.1.2数据湖的数据分析”、“6.1.3数据分析方法”分点1“关联分析”)2 .关于数据分析方法,下列说法正确的是()。A.A/Btest对用户流向进行监测,用来衡量网站优化的效果或营销推广的效果和了解用户行为偏好
6、。B.留存分析考查用户进行初始行为后的一段时间仍存在的客户行为,反映客户粘性以及产品对用户的吸引力。C.帕累托分析是在同一时间维度,将Web或APP界面或流程的两个或多个版本给类似访客群组来访问,收集各群组的用户体验数据和业务数据,最后分析评估出最好版本正式采用。D.正常情况下,留存率会随着时间周期的推移逐渐提升。E.海盗模型从获客、激活、留存、变现、自传播五个节点分析转化率,从而找到能够提升的环节。F.象限法通过两种及以上的维度,运用坐标的方式对数据进行划分,从而将数据转变为策略。(答案:BEF;C选项描述的是路径分析;C选项描述的是A/Blesi;正常情况下,留存率会随着时间周期的推移而逐
7、渐降低。参考:6.1.3数据分析方法)3 .关于数据可视化流程,下列说法正确的是()。A.缺失值的处理方式有删除存在缺失值的个案或者插补缺失值。B.绘制箱形图需要上边缘、上四分位数、下四分位数、下边缘,不需要中位数。C.直方图使用条形的高度或长度来表示频数,并通过频数大小进行排序。D.编写数据库查询的SQL语句时,明确查询响应时间是关键。E.数据可视化页面初步开发制作完成后,需要增加预览环节,观察页面整体效果和可承载并发数。F.缺失值插补法有均值插补、多重插补法两种。(答案:ADE;绘制箱形图需要中位数;直方图是用面积表示表示频数:缺失值插补法包括均值插补、利用同类均值插补、极大似然估计、多重
8、插补法。参考:6.2.2数据可视化流程)4.关于数据自助服务,下列说法正确的是()。A.数据分析师基于业务领域对象之类的语义层进行分析,无需了解实际数据操作的复杂性。B.自助服务元数据工具允许分析人员自行注释、查找和理解数据集。C.数据自助服务需要IT人员参与才能部署和使用。D.数据仓库主要用于支持关键的生产报告和分析,而不是为处理大量即时查询和分析而设计的。E.数据湖中实现数据自助服务需要预处理数据,可能涉及组合、过滤、聚合、修复数据质量问题等。E企业中数据湖的目的之一是创建可以自助向数据仓库添加内容的环境。(答案:ABDEF:数据自助服务不需要IT人员参与就能部署和使用。参考:6.3.3数
9、据自助服务)5.关于数据预置,下列说法正确的是()。A.数据预置是指获得使用数据的权限。B.许多行业需要处理大量敏感数据,数据预置面临的一大挑战是决定哪些分析师可以访问哪些数据。C.企业通过创建元数据目录,使分析人员无需访问数据本身即可查找数据集。D.目录是一种访问控制方法,数据管理员或所有者决定是否授限和权限有效期。E.通过目录,分析人员可以在数据库中找到任何数据,但无法访问它。E目录可以授予特定时间段内的访问权限,但无法对数据集的一部分进行授权。(答案:BCDE:数据预置包含了获得使用数据的权限、物理地获取到数据两个方面;目录可以授予特定时间段内的访问权限以及对数据集的一部分进行授权。参考
10、:“633数据自助服务”分点3“数据预置”)三、填空题1 .对比方式分为横向对比、四种类型。(答案:纵向对比:目标对比;时间对比。参考:”6.1.3数据分析方法”分点2“对比分析”)2 .常见的象限法应用有模型、矩阵。(答案:RFM:波士顿。参考:”6.1.3数据分析方法”分点6“象限分析”)3 .数据服务体系的数据服务分为基础数据服务、三大类。(答案:标签画像服务;算法模型服务。参考:“6.3.2数据服务分类”分点2“数据服务体系”)4 .数据分析师对数据建立信任通常基于、三个维度。(答案:数据质量;血缘:管理员。参考:”6.3.3数据自助服务”分点2“建立信任”)5 .分析一般采用SQL查
11、询语句对结构化数据进行多维度的聚集查询处理。(答案:在线联机。参考:6.1.1数据分析定义)四、判断题1 .数据排序、数据摘要、数据比较、异常分析都是数据分析的不同形式。()(答案:o参考:6.1.2数据湖的数据分析)2 .数据集服务为IT系统提供数据事件驱动的响应和执行结果。()(答案:X:数据API服务为IT系统提供数据事件驱动的响应和执行结果。参考:”6.3.2数据服务分类”分点1“企业”)3 .关于企业数据的知识保存在部分人的头脑里,也就是“部落知识”,包括数据含义、数据在哪里以及什么情况下用哪个数据集。()(答案:o参考:”6.3.3数据自助服务”分点I发现和理解数据”)4 .可视化
12、技术通常以关系型格式获取、整理和展示数据。()(答案:o参考:”6.3.3数据自助服务”分点5分析和可视化”)5 .横向对比是对同一层级不同对象的比较,比如某市在2022年各月份的茅台销量。()(答案:X:某市在2022年各月份的茅台销量属于纵向对比。参考:”6.1.3数据分析方法”分点2“对比分析”)第7章数据管理一、单项选择题1.下列关于元数据定义的说法错误的是()。A.元数据又叫“描述数据”,是对数据内容的描述,是关于数据的数据。B.传统的图书馆卡片、出版图书的版权说明、磁盘的标签等都属于元数据。C.计算机领域的管理元数据是应用系统的辅助信息,帮助用户查询信息、理解信息。D.地理学领域的
13、元数据已经基本实现了标准化。(答案:C:应用系统的辅助信息是用户元数据。参考:“7.Ll元数据定义与作用”分点1、2)2 .下列关于元数据标准的说法错误的是()。A.元数据标准是描述某类资源的具体对象时所有规则的集合,分为语义、结构、句法三个层次。B.机读编目格式标准是国际公认的用于确定最小信息资源描述的元数据格式。C.VRA是美国视觉资源协会数据标准委员会开发的核心类目录标准,用在网络环境中描述建筑、艺术等视频。DCDWA主要用于建筑、艺术品和其他文化资源。(答案:B:国际公认的用于确定最小信息资源描述的元数据格式是都柏林核心元数据。参考:7.2.3元数据标准)3 .下列关于元数据维护的说法
14、错误的是()。A.元数据维护是对信息对象的基本信息、属性、被依赖关系、依赖关系、组合关系等元数据的新增、修改、删除、查询、发布等操作。B.已经发布上线的元数据可以进行直接修改来调整、优化。C.数据仓库最根本的特点是物理地存放数据,且这些数据是来源于其他数据库的。D.当数据仓库的数据源运行环境、结构及目标数据的维护计划发生变化时,需要修改元数据。(答案:B;已经发布上线的元数据如需调整、优化,必须重新走元数据发布流程,不允许进行直接修改。参考:7.3.2元数据维护)4 .下列关于元数据查询的说法错误的是()。A.基于语义的元数据索引查询方法以树为数据模型,能应用于复杂的语义网络。B.本体和元数据
15、都能用来描述某一范围内的资源,这种本体称为领域本体,这种元数据称为元数据标准。C.大多数采用元数据组织信息的系统使用关键字匹配的查询方法,使同义不同形的词在查询时被漏掉,造成查全率不高。D.基于XML语言的元数据索引查询方法缺乏语义描述,因而难以应用于语义Web环境的智能处理。(答案:A:基于语义的元数据索引查询方法无法应用于复杂的语义网络。参考:7.3.3元数据查询)5 .下列关于血缘分析的说法错误的是()。A.血缘分析通过梳理系统、表、视图、字段等之间的关系,采用有向无环图进行可视化展现。B.血缘分析广泛应用于异常定位、监管报送、质量检验、数据价值评估等场景。C.数据的血缘关系有集群血缘、
16、系统血缘、表级血缘和字段血缘等,指向了数据的上游来源,向上游追根溯源。D.血缘分析中的自动解析方法效率最高,是根据一定规则,在数据加工流转过程中直接由加工主体完成血缘关系的映射。(答案:D:D选项描述的是系统跟踪方法。参考:”7.3.4元数据分析”分点1各类型元数据分析”)二、不定项选择题1.关于元数据的作用,下列说法正确的是()。A.元数据对数据对象的内容和属性进行描述,这是各组织、各部门之间达成共识的基础。B.元数据将信息对象中的重要信息抽出标引并加以组织,建立关系,帮助用户找到想要的信息。C.数据生命周期中各阶段的数据都能被元数据系统管理和使用。D.元数据使用户在不浏览具体数据对象的情况
17、下也能对数据对象有个直观的认识。E.数据仓库中的元数据是其当前映像,不包含历史版本映像。F.元数据确保了数据流转时的数据标准一致性。(答案:ABDF:数据生命周期中除了数据定义阶段的数据都能被元数据系统管理和使用;数据仓库中的元数据包含当前映像和历史版本映像。参考:“7.1.1元数据定义与作用”分点3“作用”)2 .关于元数据管理,下列说法正确的是()。A.元数据管理是元数据的定义、收集、管理和发布的方法、工具及流程的集合。B.元数据的版本管理是对元数据版本的差异比对及版本的更新审核管理。C.血缘分析是对数据流动情况的追溯,可以帮助发现数据开发链路变更所带来的影响。D.业务系统多次迭代或开发文
18、档不完善并不会影响元数据的质量。E.数据模型以图形化的方式精确表达和传递数据需求,本身也是一种描述业务的元数据。F.物理模型被实例化到数据库中,为数据库的表及字段提供业务元数据信息。(答案:ABCE:业务系统多次迭代、开发文档不完善都会降低元数据的质量:物理模型主要提供技术元数据信息。参考:”7.1.2元数据管理定义”)3 .关于元数据架构,下列说法正确的是()。A.为了更好发挥数据价值,需要对元数据标准化、集中整合化、统一化管理。B.元数据战略是关于元数据管理目标的说明,决定了元数据架构。C.混合式元数据架构的存储库设计只考虑高度标准化的元数据。D.集中式架构包含一个集中的元数据存储,有利于
19、元数据标准化统一管理与应用。E.分布式元数据架构的查询能力直接受限于相关元数据来源系统的可用性。F.分布式元数据架构对源系统的元数据进行了标准化或者附加元数据的整合。(答案:ABDE:混合式元数据架构的存储库设计考虑用户增加的元数据、高度标准化的元数据以及手工获取的元数据:分布式元数据架构中源系统的元数据没有经过标准化或附加元数据的整合。参考:7.2.2元数据架构)4 .关于元数据分析,下列说法正确的是()。A.元数据影响分析针对数据的上游来源,快速定位哪些上游系统、表和字段修改会影响到元数据。B.元数据关联度分析从某一实体关联的其他实体及其参与的处理过程两个角度来查看具体数据的使用情况,形成
20、一张实体和所参与处理过程的网络。C.元数据定义资源结构及其语义,为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具。D.元数据血缘分析能迅速定位会受到影响的数据元素,并驱动受影响的各个业务环节进行修改。E.元数据关联度分析能快速定位问题数据的来源和加工过程,减少数据问题排查分析的时间和难度。F.元数据分析能帮助了解数据与业务的关系以及数据具有哪些属性。(答案:BCF:元数据影响分析针对数据的下游流向,快速定位元数据修改会账响到哪些下游系统、表和字段:D选项描述的是元数据影响分析:E选项描述的是元数据血缘分析。参考:”7.1.1元数据定义与作用”分点2“不同领域定义”、7.3
21、.4元数据分析)5 .关于元数据的分类与创建,下列说法正确的是()。A.业务元数据是对数据的结构化,方便计算机或数据库对数据进行识别、存储、传输和交换。B.数据库表名称、列名称、字段长度都属于业务元数据。C.业务元数据提供了介于使用者和实际系统之间的语义层。D.元数据根据实际业务场景定义属性,有名称、类型等通用的属性,还有一些特定属性。E.通常选择业务数据做元数据管理,因为元数据管理主要是为了业务和开发人员快速掌握业务数据。F.数据所有者、使用者、访问方式都属于操作元数据。(答案:CDEF:A选项描述的是技术元数据;数据库表名称、列名称、字段长度都属于技术元数据。参考:“7.2.1元数据类型”
22、、“7.3.1元数据创建”)三、填空题1 .元数据的主要作用是对数据对象进行、定位、管理、和交互。(答案:描述;检索:评估。参考:”7.U元数据定义与作用”分点3“作用”)2 .数据生命周期主要包括数据、数据创建、数据、数据加工、数据、数据共享和数据阶段。(答案:定义;存储:利用;销毁。参考:”7.1.1元数据定义与作用”分点3“作用”)3 .元数据分析使数据活跃程度可视化,将常用数据和僵死数据区分开来。(答案:冷热度。参考:”7.3.4元数据分析”分点1各类型元数据分析”)4 .元数据主要通过元数据(如数据库表、字段)对数据质量管理进行支撑。(答案:技术。参考:”7.1.1元数据定义与作用”
23、分点3“作用”)5.W.H.Inmon在建立数据仓库书中提出,数据仓库是面向的、的、稳定的、随不断变化的数据集合,用以支持经营管理中的决策制定过程。(答案:主题;集成:时间。参考:“7.3.2元数据维护”分点2“数据仓库的元数据维护”)四、判断题1.元数据对数据结构、数据关系的描述方便了数据对象在不同部门和系统的流通。()(答案:=参考:“7.1元数据定义与作用”分点3“作用”)2 .物理模型由逻辑模型根据数据库实际部署环境落地生成,与实际数据库的数据表一一对应。()(答案:o参考:”7.1.3数据模型与元数据”分点3“数据模型与元数据的血缘分析”)3 .高级检索是指在检索结果中继续检索,有“
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据资源管理 数据资源管理 习题及答案 第6-10章 数据分析与服务-数据资源管理机构 数据 资源管理 习题 答案 10 分析 服务 机构
链接地址:https://www.31ppt.com/p-6929582.html