Power BI数据分析与数据可视化课件.pptx
《Power BI数据分析与数据可视化课件.pptx》由会员分享,可在线阅读,更多相关《Power BI数据分析与数据可视化课件.pptx(227页珍藏版)》请在三一办公上搜索。
1、Power BI数据分析与数据可视化,第1章初识Power BI,本章主要内容:Power BI简介Power BI家族安装Power BI Desktop了解Power BI Desktop界面使用Power BI文档,1.1 Power BI简介,Power BI整合了Power Query、Power Pivot、Power View和Power Map等一系列工具。熟悉Excel的用户可以快速掌握Power BI,甚至可以在Power BI中直接使用Excel中的图表。,1.1.1 Power BI功能简介,1.连接到任意数据源Power BI可以连接到多种不同类型的数据源,包括Exc
2、el文件、文本(CSV)文件、XML文件、SQL Server数据库、Oracle数据库、Web数据等等,几乎囊括了所有类型的数据。,2.管理数据、数据建模在Power BI的数据视图、查询编辑器中,可对来自数据源的数据进行清理和更改。在查询编辑器中,可轻松完成如更改数据类型、删除列或合并来自多个源的数据等操作,3.创建视觉对象视觉对象是报表中展示数据的基本元素。可根据需要为报表创建各种视觉对象,,4.创建报表Power BI将一个文件中的视觉对象集合称为“报表”。报表可以有一个或多个页面,类似一个Excel文件可包含一个或多个工作表。报表文件扩展名为.pbix。,5.Power BI支持用户
3、共享报表。在Power BI的“开始”选项卡中,单击“发布”图标,可将报表发布到Power BI服务。选择“发布”命令后,Power BI要求使用Power BI服务账户登录。,1.1.2 Power BI家族,Power BI家族包括:Power BI DesktopPower BI ProPower BI PremiumPower BI MobilePower BI EmbeddedPower BI 报表服务器Power BI服务。,1.2安装Power BI Desktop,1.2.1安装需求Power BI Desktop可用于32位(x86)和64位(x64)平台,最低的系统需求如下
4、:操作系统:支持Windows 10、Windows 7、Windows 8、Windows 8.1、Windows Server 2008 R2、Windows Server 2012、Windows Server 2012 R2等。浏览器:Internet Explorer 10 或更高版本。内存:至少1GB。显示:建议分辨率至少为1440900或1600900。CPU:建议1GHz或更快的32或64位处理器,1.2.2下载安装程序在浏览器中打开https:/BI Desktop中文主页,浏览器演示1.2.3安装Power BI Desktop演示,1.3了解Power BI Deskto
5、p界面,1.3.1开始屏幕演示1.3.2主界面演示,1.4使用Power BI文档,Microsoft在https:/BI,1.4.1查看Power BI Desktop文档演示1.4.2使用Power BI示例Power BI示例有3种使用方式:内容包、Excel工作簿和.pbix文件。演示,第2章 获取数据,本章主要内容:数据连接模式连接到文件连接到数据库连接Web数据,2.1数据连接概要,本节主要内容:数据源类型连接模式,2.1.1数据源类型,Power BI可连接多种不同类型的数据源,包括:文件:Excel、文本/CSV、XML、JSON等类型的文件。数据库:SQL Server、SQ
6、L Server分析服务、Access、Oracle、MySQL等数据库。联机服务:Salesforce、Dynamics 365、Microsoft Exchange在线等联机服务。Azure:Azure SQL数据库、Azure SQL数据仓库、Azure分析服务数据库、Azure Blob存储等。其他数据源:Web页面、Microsoft Exchange、ODBC、OLE DB、Hadoop文件等等。另外,使用自定义的连接器还可连接特殊的数据源。所以,理论上没有Power BI不能连接的数据源。,2.1.2连接模式,在Power BI Desktop中“获取数据”时,有3种数据源连接模
7、式:导入实时连接DirectQuery,1.导入,导入模式具有如下特点。建立数据连接时,为数据源中的每个表创建一个查询。可在查询编辑器修改查询。编辑查询也可称为建立数据模型。加载数据时,查询返回的所有数据都将导入Power BI高速缓存起来。创建视觉对象时会查询导入的数据,“字段”窗格会列出已导入的所有表和字段。导入的数据在Power BI中高速缓存,所以在用户与视觉对象交互时,可以快速反映视觉对象的所有更改。视觉对象不能反映数据源中对基础数据发生的变化,除非通过“刷新”重新导入数据。将报表发布到Power BI服务时,会同时创建一个数据集上传,数据集包含报表中导入的数据。在Power BI服
8、务中打开现有报表或创作新报表时,会再次执行查询,导入数据源的数据。刷新数据源后,仪表板中的磁贴会自动刷新。,2.实时连接,实时连接模式不导入数据,报表直接查询数据源的基础数据,不对数据进行缓存。在实时连接模式下,不能定义数据模型,即无法定义新的计算列、层次结构、关系等。实时连接的好处就是视觉对象实时反映数据源中基础数据的变化。实时连接模式适用于SQL Server Analysis Services(SSAS)、Power BI数据集和Common Data Services等数据源。,3.DirectQuery连接,DirectQuery连接模式与实时连接有类似之处,即不导入任何数据,始终对
9、基础数据源进行查询以更新视觉对象DirectQuery连接模式具有如下特点。建立数据连接时,根据数据源类型执行不同操作。对关系数据源,为每个表建立一个查询。对多维数据源(如SAP BW)则只选择数据源。加载数据时,不会导入数据进行缓存。创建视觉对象时,会向数据源发送查询,检索所需数据。视觉对象不能及时反映数据源中对基础数据发生的变化,除非进行刷新。DirectQuery连接模式下,刷新意味着向数据源重新发送查询检索数据。将报表发布到Power BI服务时,会同时创建一个空的数据集上传。在Power BI服务中打开现有报表或创作新报表时,会向数据源发送查询检索数据。仪表板中的磁贴会按计划自动刷新
10、,以便快速打开仪表板。打开仪表板时,磁贴反映的是上一次刷新时数据源基础数据的变化,不一定是最新变化。要保证磁贴反映数据源基础数据的最新变化,可反复刷新仪表板。DirectQuery连接模式适用的数据源包括Amazon Redshift、Azure SQL数据库、Azure SQL数据仓库、Impala(版本 2.x)、Oracle 数据库(版本 12 及更高版本)、SAP HANA、Snowflake、SQL Server、Teradata数据库等等。,2.2连接到文件,本节主要内容:连接Excel文件连接CSV文本文件连接XML文件连接JSON文件连接文件夹,2.2.1连接Excel文件,E
11、xcel几乎可以看作是Power BI的前身,也是处理数据、进行图表分析的办公软件之一。Power BI可连接的Excel文件包括.xl、.xls、.xlsx、.xlsm、.xlsb和.xlw等。演示:连接Power BI财务示例工作簿,2.2.2 连接CSV文本文件,CSV文本文件通常使用固定的分隔符(如逗号、分号、制表符等)分隔数据。文件中每一行可作为一条记录,每条记录包含相同数量的数据项(数量也可不同)。演示:连接期末成绩CSV文件,2.2.3 连接XML文件,XML指Extensible Markup Language(可扩展标记语言)。XML文件是一种文本文件,采用自定义的标记来组织
12、数据。在下面的XML文件中,保存了期末成绩和半期成绩数据。10110103 吴忱 76 28 55 10110103吴忱 704835 演示:导入成绩XML文件,2.2.4 连接JSON文件,JSON文件通常包含一个JSON字符串。例如:考号:10110103,姓名:吴忱,语文:76,数学:28,外语:55,考号:010110114,姓名:杨九莲,语文:99,数学:19,外语:33,考号:010110701,姓名:安芸芸,语文:84,数学:30,外语:39,考号:010130101,姓名:刘洋,语文:70,数学:48,外语:35,这是一个JSON数组,其中的换行是为了方便阅读,不是必需的。下面
13、的实例说明如何在Power BI DeskTop中导入这个JSON文件。演示:连接期末成绩JSON文件,2.2.5 连接文件夹,文件夹可作为一种特殊的数据源,Power BI Desktop可将文件夹中所有文件的文件名、创建日期、访问日期、文件内容等相关信息作为记录导入数据表。演示:连接文件夹,2.3连接到数据库,本节主要内容:连接SQL Server数据库连接MySQL 数据库连接SQL Server分析服务数据库,2.3.1连接SQL Server数据库,本节实例资源文件“录取数据.bak”是SQL Server数据库备份文件。演示:用该文件在SQL Server服务器中执行数据库还原操作
14、还原数据库。演示:连接SQL Server中的“录取成绩”数据库,2.3.2 连接MySQL数据库,本节实例资源文件“录取数据.bak”是MySQL数据库导出文件。用该文件在MySQL中执行数据导入操作将数据导入新数据库或原有数据库演示:连接MySQL中的“录取2017”数据库,2.3.3 连接SQL Server分析服务数据库,本节实例资源文件“MySQLAnalysis.abf”是SQL Server分析服务数据库备份文件。用该文件在SQL Server分析服务器中执行数据库还原操作还原数据库,2.4连接Web数据,Web数据用URL来确定位置。可以是数据文件,如共享的Excel文件。也可
15、以是静态或动态的网页,如html文件或ASP文件等。本节主要内容:连接Web共享的数据文件获取网页中的数据,2.4.1连接Web共享的数据文件,在浏览器中单击下载链接可下载共享的数据文件,链接地址就是数据文件的URL。例如,在Power BI文档中,财务示例工作簿的URL地址为http:/Sample.xlsx。Power BI Desktop可将数据文件URL作为数据源来获取其中的数据。演示:Power BI在线文档中共享的财务示例工作簿,2.4.2 获取网页中的数据,在本地计算机中启用IIS服务器以及IIS中的ASP支持,然后将gettable.asp文件复制到IIS默认Web站点发布目录
16、C:inetpubwwwroot。演示:获取ASP文件输出的网页中的数据,第3章 查询编辑器,查询编辑器用于对查询进行定制,根据用户需要来获取数据。本章主要内容:查询编辑器打开方式查询编辑器界面简介,3.1 查询编辑器概述,本节主要内容:查询编辑器打开方式查询编辑器界面简介,3.1.1查询编辑器打开方式,查询编辑器的打开方式如下。在“开始”选项卡中单击“编辑查询”图标。在“获取数据”操作过程中,在“导航器”对话框中单击“编辑”图标。在数据视图中用鼠标右键单击视图中的数据表任意位置,然后在快捷菜单中选择“编辑查询”命令。在“字段”窗格中用鼠标右键单击数据表名称,然后在快捷菜单中选择“编辑查询”命
17、令。演示各种打开方式,3.1.2查询编辑器界面简介,执行“获取数据”连接“录取库.xls”,将其中的两个表“成绩数据”和“招生专业”导入Power BI Desktop,导入后打开查询编辑器。查询编辑器主要由功能区、查询窗格、中间窗格和查询设置窗格等组成。,1.功能区,功能区包含了“文件”菜单、“开始”选项卡、“转换”选项卡、“添加列”选项卡、“视图”选项卡和“帮助”选项卡等。,2.“查询”窗格,本节主要内容:“查询”窗格显示了Power BI Desktop当前获取数据时使用的所有查询。在Power BI Desktop中,一个查询导入的数据为一个数据表(简称为表)。在“查询”窗格列表中单击
18、查询名称,可在中间窗格中预览数据。鼠标右键单击查询名称,可在快捷菜单中可选择“复制”“粘贴”“删除”“重命名”等操作。注意:删除查询意味着从Power BI Desktop中删除已经加载的数据,会影响使用其数据的视觉对象。,3.中间窗格,中间窗格显示查询的预览数据是当前时间以前某个时刻从数据源获取的数据,在查询编辑器底部状态栏的右侧显示了数据加载的时间。如果想查看数据源的最新数据,可在“开始”选项卡中单击“刷新预览”图标执行刷新操作中间窗格的每个列的标题包含3部分内容:数据类型图标、字段名和下拉菜单图标。数据类型图标:显示字段数据类型,单击可打开快捷菜单更改数据类型。字段名:双击可进入编辑状态
19、,修改字段名。下拉菜单图标:单击图标可打开快捷菜单执行排序和筛选等操作。,4.“查询设置”窗格,管理查询属性“属性”栏的“名称”框显示了查询名称,可在此修改查询名称。在“查询属性”对话框的“名称”框中可更改查询名称,在“说明”框中可输入描述性的说明信息。“启用加载到报表”选项默认选中,表示始终将查询从数据源获取的数据加载到报表;如果取消选择,则会从报表删除查询对应的数据表。“包含在报表刷新中”选项默认选中,表示在报表执行刷新操作时,会执行所有查询从数据源获取最新的数据;如果取消选择,在报表执行刷新操作时不执行该查询,但可单独刷新数据表以获取最新数据。,管理查询应用的步骤“查询设置”窗格的“应用
20、的步骤”栏列出了查询包含的基本步骤。“应用的步骤”栏包括了4个步骤:源、导航、提升的标题和更改的类型。执行查询意味着按顺序执行应用的步骤。在“应用的步骤”栏中单击某一个步骤,中间窗格就显示该步骤对应的预览数据。“源”:示查询获得的数据源的源信息“导航”:预览数据通常为数据源的原始数据,没有做任何转换。所有字段都是字符型,列名为Column1、Column2等表示。“提升标题”:查询自动识别确认源数据中字段的标题,查询通常将源数据的第一行作为标题。“更改的类型”:显示更改了字段数据类型后的预览数据,3.2基础查询操作,本节主要内容:添加新的数据源复制查询引用查询用输入数据创建表,3.2.1添加新
21、的数据源,可在查询编辑器中执行下列操作添加新的数据源。在“开始”选项卡中单击“新建源”图标,打开“获取数据”对话框连接数据源。在“开始”选项卡中单击“新建源”下拉菜单,从子菜单选择连接常见类型的数据源或者打开“获取数据”对话框连接数据源。鼠标右键单击“查询”窗格空白位置打开快捷菜单,再从“新建查询”的子菜单中选择连接常见类型的数据源、最近使用的源或者打开“获取数据”对话框连接数据源。,3.2.2复制查询,通过对现有查询执行复制、粘贴操作来创建新的查询。实例3-1 复制招生专业查询。复制的查询与原查询执行相同的步骤,即复制的是查询的操作步骤,而不是数据。事实上,查询的操作步骤就是一系列命令,这些
22、命令从数据源获取数据,并将其转换为数据表。数据表是执行查询获得的结果。在“查询”窗格中用鼠标右键单击查询,在快捷菜单中选择第2个“复制”命令,可直接完成复制查询操作。,3.2.3引用查询,引用查询指查询直接使用被引查询获得的最终数据作为数据源,改变被引查询时,引用查询的数据同时发生改变。但是,调整引用查询中的数据,不会反过来影响被引查询。实例3-2 创建“成绩数据”查询的引用。,3.2.4用输入数据创建表,查询编辑器可用通过手动输入数据的方式来创建表。实例3-3 输入数据创建学费标准表。,3.3基础查询操作,数据转换是对查询中的数据执行进一步的加工,以获得需要的数据,如转换数据类型、数据分组、
23、拆分列等等。本节主要内容:修改数据类型数据分组拆分列算术运算,3.3.1修改数据类型,通常,查询自动识别基础数据以确定字段的数据类型,但这不一定准确。在查询编辑器中查看“录取成绩”查询数据,3.3.2 数据分组,数据分组指可在查询中执行分组统计,类似于SQL中的分组查询。实例3-5 创建分组统计专业报名人数。,3.3.3 拆分列,拆分列操作可以将现有的列分解成两个新的列。实例3-6 拆分专业代码列。,3.3.4 算术运算,查询编辑器支持对数值类型的列执行标准的算术运算,如加、减、乘、除等。实例3-7 为“成绩数据”查询的tzf字段加10,3.4添加列,查询编辑器提供了多种灵活的方法来添加新列,
24、如用示例创建列、按条件创建列、创建计算列等。本节主要内容:用示例创建列创建计算列按条件创建列,3.4.1用示例创建列,有时需要对查询获取的数据按规律进行部分修改,此时即可使用示例创建列功能,它可根据用户输入数据生成新列对应的值。实例3-8 在“招生专业(2)”查询中用输入示例创建列。,3.4.2创建计算列,在“转换”选项卡中,“标准”图标提供的加、减、乘、除等操作针对当前列执行计算,用计算结果代替原有字段值。在“添加列”选项卡中,“标准”图标提供的加、减、乘、除等操作针对选中的列。选中单个列时,会用输入值与字段值执行计算。选中多个列时,所有选中列的字段执行计算。计算结果作为新建列的值。实例3-
25、9 在“成绩数据”查询中添加“总分”列。,3.4.3按条件创建列,按条件创建列通过为现有数据指定条件来生成新列数据。实例3-10 在“成绩数据”列中创建“录取状态”列。,3.5 追加查询,追加查询可以将现有的查询追加到另一个查询中,甚至可以将追加后的查询创建为新查询。通常在两个查询具有相同字段时才使用追加查询。实例3-11 追加录取成绩数据。,3.6合并查询,追加查询是将一个查询的数据添加到另一个查询末尾。合并查询则是结构上的合并,并可按字段匹配记录。例如,将“招生专业”查询和“学费标准”查询合并,两个查询中专业代号相同的记录合并为一条记录。实例3-12 合并“招生专业”查询和“学费标准”查询
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Power BI数据分析与数据可视化课件 BI 数据 分析 可视化 课件
链接地址:https://www.31ppt.com/p-2137016.html