大数据技术导论期末复习题2023-5(附参考答案).docx
《大数据技术导论期末复习题2023-5(附参考答案).docx》由会员分享,可在线阅读,更多相关《大数据技术导论期末复习题2023-5(附参考答案).docx(92页珍藏版)》请在三一办公上搜索。
1、一、选择题1可视分析是一种O?A.交互式用户界面模型B.结构化用户界面模型cl非结构化用户界面模型D.1独立式用户界面模型【答案】A2数据科学的研究对象是O?A.药品成分B.1文学作品C.数据界的数据D.人类历史【答案】C3下面不是研究数据方法的是O?A.统计学B.机器学习C.心理分析D.数据挖掘【答案】C4下面是数据科学的主要研究内容的是O?A.数据泄露B.数据交易C数据盗窃D.数据分析【答案】D卜面不是数据产品开发的特征的是O?A.多样性B.无竞争性(Cl增值性D.层次性【答案】B下面不属于互联网大数据的是O?A.视频B.图片cl音频D.心情【答案】D下面不属于大数据的特性是O?A.数据量
2、大B.多样性1.c.真实性差D.具有价值【答案】C下面属于结构化数据的是O?A.表格数据B.图形C.1图像D.HTML文档【答案】A下面不属于大数据的处理过程的是O?A.数据获取、储存B.数据清洗c.1数据分析D.)数据安全【答案】D10下面不属于大数据离线处理特点的是O?A.数据保存时间短B.数据不会发生改变C.可进行复杂的批量计算D.方便查询计算结果【答案】A11下面不属于大数据处理模式的是O?A.离线处理B.在线处理cl手动计算D.1交互处理【答案】C12下面仅属于大数据在线处理模式的是O?A.批量计算【B.】流式计算cl手动计算D.交互处理【答案】B13下面不属于流式数据源的是O?A.
3、硬盘数据B.传感器数据1.c.图像数据D.流媒体传输【答案】A下面不属于流式数据的特点的是O?A.实时性B.1层次性cl易失性D.突发性【答案】B15下面不属于大数据计算模式的类型的是O?A.批量计算B.手动计算C.1流式计算D.交互式计算【答案】B16下面不属于数据流技术应用的方式是O?(A.指定查询B.模糊查询C.)即席计算D.中间计算【答案】B17下面不属于判断大数据应用成功的指标是O?A.创造价值B.具备高速度c.1在本质上提高【D.】低性能【答案】D18基于任务的定义和分类,下列不属于可视分析关注点的是O?A.以用户价值为关注点B.以用户意图为关注点(Cl以同户行为为关注点D.以软件
4、操作为关注点【答案】A19下面不属于企业大数据应用成功的考虑因素是O?A.成本B.客户满意度C.附加收益D.工人满意度【答案】D20下面不属于大数据在通讯行业的应用是O?A.预测客户行为B.1市场监控cl智能电表D.市场预警【答案】C21MaPRedUCe以什么方式进行分布式计算()?A.文本B.函数cl数据集D.矩阵【答案】B22在HadooP中,将每一次计算请求称为一个()?A.文本B.1函数cl数据集D.作业【答案】D23在HadOOP中,将每个作业拆分为若干个O?A.文本B.Map任务cl数据集D.RedUCe任务【答案】B24在Had。P中,作业服务器被称为()?A.JobB.Map
5、C.MasterD.Reduce【答案】C25下列不属于一个作业的计算流程的是O?A.作业开始【B.】作业修改C.Map任务分配D.RedUCe任务执行【答案】B26下列不属于MaP任务的执行的子步骤的是O?A.输入准备B.输入修改cl算法执行D.输出生成【答案】B在MaPRedUCe模型编程中,不属于其步骤的是O?A.遍历数据B.映射键值C.数据分组D.数据插补【答案】D28Hadoop的核心是()和MapReduce0A.NTFSB.GFSC.HDFSD.FS【答案】C29下列不属于单词计数的MaP过程的是O?A.按列分割文件B.分词处理cl按行分割文件D.排序与合并【答案】A30Word
6、Count完成的功能是统计()?A.按列分割文件数B.输入文件中单词频数cl按行分割文件数D.输入文件中单词频率【答案】B31HadooP开发环境部署内容不包括O?A.安装SSH协议B.HadooP系统部署【C.】伪分布式HadOOP环境部署(D.J电脑断网【答案】D32Reduce任务目标是()?A.输入文件B.输入数据cl输入图表【D.】将若干个M叩任务生成的中间文件汇总到最后的输出文件【答案】D33HadOOP作业服务器不负责O?A.接受用户提交的作业B.任务的分配cl执行具体的任务D.管理所有的任务服务器【答案】C34下列不属于文本数据语义特征的是O?A.词频B.逻辑结构C.1动态演化
7、规律D.数据结构【答案】D35文本数据是典型的O?A.结构化数据B.半结构化数据C.非结构化数据D.混合结构数据【答案】CMapReduce模型将数据集的大规模操作分发给网络上的各节点,每个节点将已完成的工作和状态更新,周期性地报告给()。A.作业B.任务C.)作业服务器D.任务服务器【答案】C37MaPRedUCe模型的最大优点体现在()?A.输入方便B.分布式处理cl各类型数据输入D.算法简单【答案】B38MapReduce模型适用场景的特点()?A.数据可实时处理B.1任务不可分解C.任务可分解D.任务需要顺序执行【答案】C39MapReduce将计算过程分解的最大好处是()?A.复杂化
8、B.快捷化cl并行化【D.】低成本【答案】CF列不属于MaPRedUCe模型的限制因素的是O?【A任务要求BJ数据不可无限分割(Cl通信开销D.集群规模【答案】A41下列不属于信息可视化的分类的是O?A.一维信息可视化B.三维信息可视化cl截面数据可视化D.1时序信息可视化【答案】C42下列属于传统数据获取的特点的是O?A.数据源多种多样B.1数据量巨大(C.)结构单一D.结构化、半结构化和非结构化数据【答案】C43下列不属于大数据获取的特点的是O?A.数据源多种多样B.数据量巨大(C.结构单一D.结构化、半结构化和非结构化数据【答案】C44下列属于大数据获取的特点的是O?A.数据源单一B.数
9、据量较小(Cl结构单一D.包括结构化、半结构化和非结构化数据【答案】D45气泡图由什么演化而来是O?A.直方图B.条形图cl散点图D.1折线图【答案】C46下列不属于文本数据的是O?A.广告B.1音频C杂志D.图书【答案】B47下列不属于文本数据的获取特点的是()?A.灵活度高B.速度快cl按需获取D.易处理【答案】D48下列属于意见建议类用户反馈的特点的是O?A.反馈量大B.反馈速度快C.针对性强D.传播快【答案】C卜列不属于空间数据的特性的是O?A.定位B.定量(cl定性D.时空关系【答案】B50下列不属于网站内部数据库中的数据的是O?A.用户信息数据B.野外实测数据C网站产品数据D.网站
10、运营数据【答案】B51下列不属于网站数据采集的数据的是()?A.非结构化数据B.半结构化数据cl结构化数据D.实验测试数据【答案】D52下列不属于网络爬虫工作过程的是O?A.获取网页【B.】修改网页C解析网页【D.】储存数据【答案】B卜.列不属于通用网络爬虫的特点及要求的是O?A.数量巨大B.范围较小(cl存储空间要大D.爬行速度要快【答案】B54下列不属于通用网络爬虫的结构的是O?A.页面爬行模块B.页面分析模块C.页面数据库D.页面修改模块【答案】D55下列不属于网页的爬虫策略的是O?A.深度优先搜索策略B.精确选择搜索策略cl广度优先搜索策略D.最佳优先搜索策略【答案】B56下列不属于通
11、用网络爬虫的局限性的是O?A.无用网页较多B.对非结构化数据获取相对容易C.难以支持基于语义信息的查询D.有限的网络爬虫服务器资源与无限的网络数据资源之间的冲突【答案】B57下列属于聚焦网络爬虫的特点的是O?A.数量巨大B.范围较大cl精准筛选D.爬行速度慢【答案】C58下列属于浅聚焦网络爬虫的核心特点的是O?A.数量巨大B.范围较大C.精准筛选D.选定URL种子【答案】D59下列不属于爬虫对抓取目标的定义原则的是O?A.目标网页特征B.目标数据量cl目标数据模式D.领域概念【答案】B60下列不属于网络爬虫的数据抓取方式的是O?A.预先给定的初始抓取种子样本B.预先给定的网页分类目录和与分类目
12、录对应的种子样本C.通过用户行为确定的抓取目标样例D.自行编写种子样本【答案】D61下列不属于NOSQL数据库的特点的是O?A.需预定义数据模型B.支持透明横向扩展cl将数据进行分区D.1保证最终一致性【答案】A下列不属于NOSQL数据库的存储方式的是O?A.行式存储B.键值式存储C.图形式存储D.文档式存储【答案】A63下列不属于NOSQL数据库的键值式存储的常见形式的是O?A.临时型【B.】附加型cl混合型D.永久型【答案】B64下列不属于数据库架构混合应用模式的是O?A.OldSQL+NewSQL混合模式B.OIdSQL+NoSQL+NeWSQL混合模式ClOIdSQL+NoSQL混合模
13、式D.NewSQL+NOSQL混合模式【答案】B65下列不属于大数据抽取方式的是O?A.同构同质数据抽取B.异构同质数据抽取cl同构异质数据抽取D.文件型数据抽取【答案】B下列不属于增量数据抽取特点的是O?A.抽取发生变化的数据B.快捷C.1处理量更多D.需要与数据装载时的更新策略相对应【答案】C67下列不属于地域空间可视化展现的功能的是O?A.认识功能B.模拟功能cl载负功能D.学习功能【答案】D68时间戳是能表示一份数据在某个特定时间之前已经存在的、完整的、可验证的一个数据,其通常是O?A.一个数据集B.一个字符序列C.一个日志文件D.一段储存代码【答案】B69下列不属于基于时间戳的增量数
14、据抽取方式的优点的是O?A.性能优异B.系统设计清晰cl数据抽取简单D.对业务系统无其他要求【答案】D70下列不属于MD5(消息摘要算法)的特点的O?A.对源系统的倾入性较小B.被动地进行全表数据的比对C.性能优异D.准确性不稳定【答案】C71下列不属于数据清洗的是O?A.检查数据的完整性B.1修改数据cl填补数据D.消除重复【答案】B72下列不属于数据质量的要素的是O?A.准确性B.J完整性cl异质性D.及时性【答案】C73下列不属于数据质量一致性的是()?A.数据编码一致性B.数据大小一致性1.c.指标统计一致性D.指标计算一致性【答案】B74【答案】D卜.列不属于数据清洗算法标准的是O?
15、A.返回率【B】错误返回率C.正确返回率(D.J精确度【答案】C76下列不会造成文本记录重复相似的是()?A.插入B.交换C.等价表述D.删除冗余【答案】D77下列不属于文本相似度计算的应用领域的是O?A.信息检索B.数据挖掘C.文档修改D.机器翻译【答案】C78下列不属于文本相似度计算流程的是()?A.文本排序B.文本分词cl统计词频D.写出词频向量【答案】A79增量数据抽取方式只抽取O?A.PB级数据B.不变数据C.变化数据D.有价值数据【答案】C数据清洗算法的衡量标准主要包含()、错误返回率和精确度。A.冗余度B.返回率C.1可用性D.一致性【答案】B卜.列不属于数据转换中适合对数转换的
16、数据是O?A.部分正偏态数据B等比数据(Cl等差数据D.数值相差不大的数据【答案】C卜.列不属于数据转换中适合平方根转换的数据是O?A.)泊松分布数据B.轻度偏态数据(Cl样本方差和平均数呈现正相关的数据D.数值相差不大的数据【答案】D噪声是指测量数据中的O?【A.】随机误差B均值Cl方差【D.】极差【答案】A卜列不属于地图的构成要素的是O?A.图形要素B.价格要素(cl数学要素D.辅助要素【答案】B85下列不属于数据平滑方法的是O?A.移动平均法B.最大最小值标准化C.指数平滑法D.分箱平滑法【答案】B86下列不属于移动平均法的是O?A.一次移动平均法B.二次移动平均法cl混合移动平均法D.
17、1多次移动平均法【答案】C87下列属于一次移动平均法的适用范围的是O?A.水平变动的时间序列数据B.长期变动趋势的时间序列数据C.循环性变动的时间序列数据D.季节变动趋势的时间序列数据【答案】A88下列属于二次移动平均法的适用范围的是O?A.水平变动的时间序列数据B.长期变动趋势的时间序列数据cl循环性变动的时间序列数据D.直线上升或下降趋势的时间序列数据【答案】D89下列不属于指数平滑法的适用范围的是O?A.稳定变化态势的时间序列数据B.不稳定变化的时间序列数据C.规则变化的时间序列数据D.直线上升或下降趋势的时间序列数据【答案】B90下列不属于指数平滑法的适用范围的是O?A.近期趋势预测B
18、.短期趋势预测C.中期趋势预测D.1长期趋势预测【答案】D91下列不属于分箱平滑法参照的是O?A.箱内数值的均值B.箱内数值的中值C.箱内数值的边界值D.箱内数值的方差【答案】D92数据规范化是将原来的度量值转换为O?A.无量纲的值B.原来度量值的均值cl原来度量值的方差D.1原来度量值的极差【答案】A卜.列不属于数据规范化的作用的是O?【A.】加快学习速度B规范事物概念(C.避免单位的影响D.呈现数据的集中程度【答案】D94假定某属性X的最小值、最大值分别为12000和98000,将属性X映射到0,1中,根据最小最大规范化方法,X的值73600(设定值)将转换为O?A.0,716B.0.61
19、6C.J0.516D.0.816【答案】A95Z分数规范化方法依据的是原始数据的O?A.均值和中位数B.1中位数和极差cl极差和方差D.均值和标准差【答案】D96如果X的平均值和标准差分别为54000和16000。使用z分数规范化方法,X的值73600被转换为O?A.1,125B.J1.025C.J1.225D.1325【答案】CZ分数规范化方法中对于离群点,均值绝对偏差相比标准差O?A.更有效B.更平稳cl更精确D.更鲁棒【答案】D98小数定标规范化方法中,其小数点移动的位数依赖于O?A.最大绝对值B.最小绝对值C.均值绝对值D.中位数绝对值【答案】A99数据平滑方法主要有指数平滑法、移动平
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 技术 导论 期末 复习题 2023 参考答案
链接地址:https://www.31ppt.com/p-6818292.html