第7章复杂数据可视化拓展课件.pptx
《第7章复杂数据可视化拓展课件.pptx》由会员分享,可在线阅读,更多相关《第7章复杂数据可视化拓展课件.pptx(29页珍藏版)》请在三一办公上搜索。
1、,第7章 复杂数据可视化,主要内容:,什么是数据可视化数据可视化流程数据的可视化呈现用户交互,什么是数据可视化,“可视化”或它的全称“科学计算可视化”(Visualization in ScientificComputing,ViSC)一词是在1987年根据美国国家科学基金会召开的“科学计算可视化研讨会”内容撰写的一份报告中正式提出的。在短短20余年历史中,科学计算可视化发展成为一个十分活跃的研究领域,新的研究分支不断涌现,如出现了用于表示海量数据不同类型及其逻辑关系的信息可视化技术,以及将可视化与分析相结合的可视分析学研究方向。现在又有了把“科学计算可视化”、“信息可视化”和“可视分析学”这
2、三个分支整合在一起的新学科“数据可视化”。 石教英 浙江大学计算机辅助设计与图形学国家重点实验室,在计算机学科的分类中,利用人眼的感知能力对数据进行交互的可视表达以增强认知的技术,称为可视化。它将不可见或难以直接显示的数据转化为可感知的图形、符号、颜色、纹理等,增强数据识别效率,传递有效信息。 唐泽圣、陈为.可视化条目.中国计算机大百科全书,2011年修订版,可视化通常被理解为一个生成图形图像的过程。更深刻的认识是,可视化是认知的过程,即形成某个物体的感知图像,强化认知理解。因此,可视化的终极目的是对事物规律的洞悉,而非所绘制的可视化结果本身。这包含多重含义:发现、决策、解释、分析、探索和学习
3、 。因此,可视化可简明地定义为“通过可视表达增强人们完成某些任务的效率”。Matthew Ward,Georges Grinstein,Daniel Keim.Interactive DataVisualization:Foundations,Techniques,and Applications.May,2010,什么是数据可视化,科学可视化、信息可视化和可视分析三者之间没有清晰边界。科学可视化的研究重点是带有空间坐标和几何信息的医学影像数据、三维空间信息测量数据、流体计算模拟数据等。信息可视化的核心问题主要有高维数据的可视化、数据间各种抽象关系的可视化、用户的敏捷交互和可视化有效性的评断等
4、。可视分析偏重于从各类数据综合、意会和推理出知识,其实质是可视地完成机器智能和人脑智能的双向转换,整个探索过程是迭代的、螺旋式上升的过程。,左图:诠释了可视分析学包含的研究内容右图:综合了图形学、数据挖掘和人机交互等技术,图3 欧洲学者Daniel Keim等人提出的可视分析学标准流程,数据可视化流程,数据可视化不仅是一门包含各种算法的技术,还是一个具有方法论的学科。因此,在实际应用中需要采用系统化的思维设计数据可视化方法与工具。,图1 科学可视化的早期可视化流水线,图2 由Card,Mackinlay和Shneiderman等人提出的信息可视化参考流程,数据可视化流程,数据可视化流程中的核心
5、要素包括三个方面。数据表示与变换数据可视化的基础是数据表示和变换。为了允许有效的可视化、分析和记录,输入数据必须从原始状态变换到一种便于计算机处理的结构化数据表示形式。数据的可视化呈现数据可视化向用户传播了信息,而同一个数据集可能对应多种视觉呈现形式,即视觉编码。数据可视化的核心内容是从巨大的呈现多样性空间中选择最合适的编码形式。大量的数据采集通常是以流的形式实时获取的,针对静态数据发展起来的可视化显示方法不能直接拓展到动态数据。这不仅要求可视化结果有一定的时间连贯性,还要求可视化方法达到高效以便给出实时反馈。因此不仅需要研究新的软件算法,还需要更强大的计算平台(如分布式计算或云计算)、显示平
6、台(如一亿像素显示器或大屏幕拼接)和交互模式(如体感交互、可穿戴式交互)。用户交互交互是通过可视的手段辅助分析决策的直接推动力。有关人机交互的探索已经持续很长时间,但智能、适用于海量数据可视化的交互技术,如任务导向的、基于假设的方法还是一个未解难题,其核心挑战是新型的可支持用户分析决策的交互方法。这些交互方法涵盖底层的交互方式与硬件、复杂的交互理念与流程,更需要克服不同类型的显示环境和不同任务带来的可扩充性难点。,数据可视化设计,数据可视化的设计简化为四个级联的层次(见图1)。简而言之,最外层(第一层)是刻画真实用户的问题,称为问题刻画层。第二层是抽象层,将特定领域的任务和数据映射到抽象且通用
7、的任务及数据类型。第三层是编码层,设计与数据类型相关的视觉编码及交互方法。最内层(第四层)的任务是创建正确完成系统设计的算法。,图1 可视化设计的层次嵌套模型,数据的可视化呈现(基本图表),统计图表是最早的数据可视化形式之一,作为基本的可视化元素仍然被非常广泛地使用。对于很多复杂的大型可视化系统来说,这类图表更是作为基本的组成元素而不可缺少。,图1 单变量数据轨迹。股票K线图,时间是自变量,股指是因变量,图2 左:标准的柱状图(Bar Chart) ;右:增强版柱状图(也称堆叠图),编码对比了几个国家不同年龄段人口数量。,图3 不同的直方图(Histogram)分布形态。直方图的各个部分之和等
8、于单位整体,而柱状图的各个部分之和没有限制,这是两者的主要区别。,图4 饼图(Pie Chart)实例,展示了某产品在各省的销售比例情况,数据的可视化呈现(基本图表),散点图(Scatter Plot)和散点图矩阵(Scatter Plot Matrix)散点图是表示二维数据的标准方法。在散点图中,所有数据以点的形式出现在笛卡尔坐标系中,每个点所对应的横纵坐标即代表该数据在坐标轴所表示维度上的属性值大小。散点图矩阵是散点图的高维扩展,用来展现高维(大于二维)数据属性分布。可以通过采用尺寸、形状和颜色等来编码数据点的其他信息。对不同属性进行两两组合,生成一组散点图,来紧凑地表达属性对之间的关系,
9、如图1所示。,图1 四维数据的散点图矩阵表示。左图为单个散点图区域的放大效果。,热力图(Heat Map)热力图使用颜色来表达位置相关的二维数值数据大小。这些数据常以矩阵或方格形式整齐排列,或在地图上按一定的位置关系排列,每个数据点的颜色编码数值大小,如图2所示。,图2 使用热力图展示出租车的繁忙程度,数据的可视化呈现(基本图表),多视图协调关联(Multiple Coordinated Views)将不同种类的绘图组合起来,每个绘图单元可以展现数据某个方面的属性,并且通常允许用户进行交互分析,提升用户对数据的模式识别能力。,图2 用于比较多尺度线粒体的基因数据的可视化系统MizBee的界面,
10、盒须图它的基本形式是用一个长方形盒子表示数据的大致范围(数据值范围的25%75%),并在盒子中用横线标明均值的位置。同时,在盒子上部和下部分别用两根横线标注最大值和最小值。,图1 盒须图的标准表示(左图)及其若干变种,数据的可视化呈现(时变数据可视化),线性和周期时间可视化不同类别的时变型数据需采用不同的可视方法来表达。标准的显示方法将时间数据作为二维的线图显示,x轴表示时间,y轴表示其他的变量,如图1。为了体现时变型数据的周期结构,可以采用环状表示某时间段内的时间结构,如图2所示。,图2 采用环状表示一周(左)和一天(右)中手机用户活动的时间分布,图1 时序数据的线性表达-标准的单轴序列图,
11、数据的可视化呈现(时变数据可视化),时变型数据中的其他属性可以采用不同的可视化通道表达。例如,图中华盛顿邮报发布的可视化作品展现了过去的30年里,电子产品的价格变化趋势。其中,使用圆点的大小和颜色来分别表示电子产品的价格和类别。,图 部分电子产品在19802010年价格和销量的变化趋势。横轴表示年份,纵轴表示销量。圆点的大小表示价格,颜色表示产品类别。,数据的可视化呈现(时变数据可视化),日历时间可视化对于日历时间的可视化,在表达维度上一般采用表格映射的方式对时间轴进行处理。图1和图2分别展示了三种日历视图。,图2 采用d3.js软件可视化20062009年美国道琼斯股票指数。可视化结果清晰地
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 复杂 数据 可视化 拓展 课件

链接地址:https://www.31ppt.com/p-1822946.html