数据仓库与数据挖掘课程设计某超市数据集的OLAP分析及数据挖掘.doc
《数据仓库与数据挖掘课程设计某超市数据集的OLAP分析及数据挖掘.doc》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘课程设计某超市数据集的OLAP分析及数据挖掘.doc(23页珍藏版)》请在三一办公上搜索。
1、江西理工大学应用科学学院数据仓库与数据挖掘课程设计报告题目: 某超市数据集的OLAP分析及数据挖掘 系别: 经济管理系 班级: 信息管理与信息系统091班 姓名: 01号 陆叶萍 二一二年六月目 录一、建立数据仓库数据库结构和设置数据源31. 任务描述32. 建立数据仓库数据库33. 设置数据源3二、销售数据OLAP分析31. 任务描述32. 设计星型架构多维数据集(Sales)33. 设计存储和数据集处理54. OLAP分析6三、人力资源数据OLAP分析61. 任务描述62. 设计父子维度的多维数据集(HR)73. 修改多维数据集(HR)的结构74. 设计存储和数据集处理85. OLAP分析
2、8四、数据仓库及多维数据集其它操作81. 任务描述82. 设置数据仓库及多维数据集角色及权限83. 查看元数据94. 创建对策105. 钻取116. 建立远程 Internet 连接12五、数据仓库高级操作121. 任务描述122. 创建分区133. 创建虚拟多维数据集134. DTS调度多维数据集处理145. 备份/还原数据仓库 15六、数据挖掘151. 任务描述152. 创建揭示客户模式的决策树挖掘模型153. 决策树挖掘结果分析164. 创建聚类挖掘模型175. 聚类挖掘结果分析186. 创建基于关系数据表的决策树挖掘模型187. 浏览“相关性网络”视图19一、建立数据仓库数据库结构和设
3、置数据源1任务描述 数据仓库数据库是将要在其中存放多维数据集、角色、数据源、共享维度和挖掘模型的一种结构。然后跟预先设置好的ODBC数据源建立连接。2建立数据仓库数据库1) 右击计算机属性计算机名复制“dzsw129”,开始Microsoft SQL ServerAnalysis ServersAnalysis Manager;2) 右击Analysis Servers,“注册服务器”,粘贴服务器名“dzsw129”;3) 展开树视图的Analysis Servers下的dzsw129; 4) 单击服务器名或右击选择连接,与Analysis Servers建立连接; 5) 右击服务器名,然后单
4、击“新建数据库”命令; 6) 在“数据库”对话框中输入数据库名“Winnie”,单击;7) 展开刚创建的“Winnie”数据库,可看到如下项目:数据源、多维数据集、共享维度、挖掘模型、数据库角色.3. 设置数据源1) 右击“Winnie”数据库下的“数据源”文件夹,然后单击“新数据源”命令; 2) 在“数据链接属性”对话框中,单击“提供程序”选项卡,选择“Microsoft OLE DB Provider for ODBC Drivers”;3) 单击“连接”选项卡,选择建好的ODBC数据源“FoodMart 2000”;4) 单击按钮关闭“数据链接属性”对话框。OK! 二、销售数据OLAP分
5、析1任务描述 以多维方式建立数据模型可简化联机业务分析,提高查询性能。通过创建多维数据集,Analysis Manager 可将存储在关系数据库中的数据转换为具有实际含义并且易于查询的业务信息。星型架构的多维数据集由一个事实数据表和链接到该事实数据表的多个维度表组成。2设计星型架构多维数据集(Sales)下面针对FoodMart2000超市1998年的销售业务数据,建立一个多维数据集,以便按产品和顾客2个主题展开分析。具体操作如下:1) 展开树窗格的“winnie”,右击“多维数据集”,选择“新建多维数据集”“向导”菜单命令,打开如下“多维数据集向导”对话框。2) 向多维数据集添加度量值(事实
6、) :3) 单击,在“从数据源中选择事实数据表”步骤中,展开“FoodMart2000”数据源,然后单击“sales_fact_1998”; 4) 单击,设置多维数据集的度量值列: store_sales、store_cost、unit_sales;5) 单击,建立维度表。单击,打开“维度向导”对话框; 向多维数据集添加时间维:1) 选择维度类型为“星型架构:单个维度表”;2) 单击,选择维度表“time_by_day”;3) 单击,选择维度类型为“时间维度”;4) 单击,选择时间级别为“年、季度、月”;5) 单击,单击,输入时间维名称: Time,并设为“共享”方式,单击,OK! 向多维数据
7、集添加产品维:1) 再次单击,打开“维度向导”对话框;2) 选择创建维度的方式为“雪花架构:多个相关维度表”; 3) 单击,选择维度表“Product”和“product_class”;4) 单击,查看连接方式,在这里可删除不要的连接,添加需要的连接;5) 单击,依次选择product_category、product_subcategory和brand_name三个维度级别;6) 单击,指定成员键列步骤中,不需改变主键列;7) 单击,在“高级选项”步骤中,根据需要选择;8) 单击,输入产品维名称: Product,并设为“共享”方式,单击,OK! 向多维数据集添加客户维度:1) 再次单击,打
8、开“维度向导”对话框;2) 选择创建维度的方式为“星型架构:单个维度表”; 3) 单击,选择维度表“Customer”;4) 单击,选择维度类型为“标准维度”;5) 单击,依次选择Country、State_Province、City和lname四个维度级别;6) 单击,指定成员键列步骤中,不需改变主键列;7) 单击,在“高级选项”步骤中,根据需要选择;8) 单击,输入客户维名称: Customer,并设为“共享”方式,单击,OK! 向多维数据集添加商店维:1) 再次单击,打开“维度向导”对话框;2) 选择创建维度的方式为“星型架构:单个维度表”; 3) 单击,选择维度表“Store”;4)
9、单击,选择维度类型为“标准维度”;5) 单击,依次选择store_country、store_state、store_city和store_name四个维度级别;6) 单击,指定成员键列步骤中,不需改变主键列;7) 单击,在“高级选项”步骤中,根据需要选择;8) 单击,输入商店维名称: Store,并设为“共享”方式,单击,OK! 生成多维数据集:1) 回到多维数据集向导对话框,这里已到了新建的4个维度;2) 单击,在“是否计算事实数据表行数提问时,单击,开始计算。 3) 计算完成后,命名多维数据集为:Sales,单击,OK!4) 关闭向导,随之启动多维数据集编辑器,其中可看到刚刚创建的多维数
10、据集。单击蓝色或黄色的标题栏,对表进行排列,使其符合下图所示的样子: 向多维数据集Sales中添加维度:1) 选择“插入|表”菜单命令,弹出“选择表”对话框; 2) 选择“promotion”表,单击,然后单击“关闭”; 3) 右击“promotion”表中的“promotion_name”列,然后选择“作为维度插入”命令,一个 名为“promotion Name”的维度就建好了,该维度为非共享的。 4) 在树窗格中重命名刚插入的维度为“Promotion”。5) 关闭编辑器,保存修改。3设计存储和处理多维数据集 1) 展开树窗格,右击“Sales”多维数据集,选择“设计存储”菜单命令,弹出“
11、存储设计向导”对话框;也可在多维数据集编辑窗口中选择“工具|设计存储”菜单命令,打开“存储设计向导”对话框; 2) 单击,然后选择“MOLAP”作为数据存储类型 ;3) 单击,设置聚合选项为“性能提升达到”,并输入“40”作为指定百分比,以此优化能力平衡查询性能和存储空间大小。4) 单击,完成后可看到“性能与大小”图,从中可看出增加性能提升对使用额外磁盘空间的需求。5) 单击,选择“立即处理”,并单击,系统开始进行数据处理,处理聚合一般要花费较长一些时间。6) 处理完成后如图:7) 然后点击,回到Analysis Manager窗口。8) 接下来就可浏览多维数据集的数据了。 4OLAP分析浏览
12、“salary”多维数据集,通过浏览数据发现,所有的customer人数为1,079,147.47人,Canada人为98,045.46人,Mexico人为430,293.59,USA人为550,808.55。其中在高收入水平中,USA的比例比较大,其次是Mexico。三、人力资源数据OLAP分析1任务描述 以进行雇员工资分析。先把Employee维度创建为父子维度,然后使用该维度以及常规维度来生成HR多维数据集。父子维度的多维数据集单个维度表中相关的两列,其中一列确定维度的成员,另一列确定成员的父代。2设计父子维度的多维数据集(HR)1) 展开“winnie”,右击“共享维度”,选择“新建维
13、度|向导”菜单命令,打开“新建维度向导”对话框。2) 单击,选择维度结构为“父子:单个维度表中相关的两列”;3) 单击,选择维度表 employee;4) 单击,选择employee_id为成员键,选择supervisor_id为父键列,选择full_name为成员名。5) 单击,直到最后一步,输入维度名称: employee;6) 单击,回到维度编辑器。OK!3修改多维数据集(HR)的结构1) 展开“winnie”,右击“多维数据集”,选择“新建多维数据集|向导”菜单命令,打开多维数据集向导对话框。2) 点击,选择salary(工资)作事实数据表;3) 点击,选择salary_paid、va
14、cation_used为度量值列;4) 点击,选择Employee(雇员)、Store(商店)、Time(时间)作维度;5) 点击,在提示是否计算事实数据表行数时选“是”。最后输入人力资源多维数据集的名称NR,点击,OK!6) 回到编辑器窗口,手工建立time_by_day表到salary表的联接,再建立 store表到employee表中的联接,删除多余的联接。最后如下图所示。4设计存储和数据集处理1) 展开树窗格,右击“HR”多维数据集,选择“设计存储”菜单命令,弹出“存储设计向导”对话框;也可在多维数据集编辑窗口中选择“工具|设计存储”菜单命令,打开“存储设计向导”对话框;2) 单击,然
15、后选择“MOLAP”作为数据存储类型 ;3) 单击,设置聚合选项为“性能提升达到”,并输入“40”作为指定百分比,以此优化能力平衡查询性能和存储空间大小。4) 单击,完成后可看到“性能与大小”图,从中可看出增加性能提升对使用额外磁盘空间的需求。5) 单击,选择“立即处理”,并单击,系统开始进行数据处理,处理聚合一般要花费较长一些时间。6) 处理完成后点击,回到Analysis Manager窗口。5OLAP分析浏览“HR”多维数据集,通过浏览数据发现,所有部门的人员一共为616人,其中Store Temporary Check部门中的人数最多,占143人,其次是Store Temporary
16、Store部门,占140人。最少的为HQ Human Resources部门,只有一个人,其次是HQ Information System部门和HQ Marketing部门,都有3个人。在雇佣薪水中,总工资为39431.67美元。其中HQ General Management部门薪水最高,平均每人465美元,而最低的为Store Temporary Check部门,平均每人的薪水为40.由此说明,人数最多部门,都是底层收入水平。底层收入的人为多数。四、数据仓库及多维数据集其它操作1任务描述多维数据集角色用于定义可以访问和查询多维数据集的用户或组,指出其可以访问的对象,以及对这些对象的访问类型。
17、角色是保护多维数据集内对象和数据安全的主要方法,可以在多维数据集的不同粒度级别上设置安全性。要定义安全性必须先创建角色,然后向这些角色授予权限。我们要创建Sales和HR角色分别用于访问多维数据集Sales和HR。Management角色用于管理整个数据仓库。 2设置数据仓库及多维数据集角色及权限创建多维数据集角色:1) 展开“多维数据集”文件夹,右击“Sales”多维数据集,并选择“管理角色”命令,打开“多维数据集角色管理器”;2) 目前还没角色显示在角色列表中。点击,打开新建角色对话框,并输入角色名:Marketing,表示市场部;3) 在“成员资格”选项卡中单击按钮,接着在“添加用户和组
18、”对话框中,添加该角色的网络用户名(如:AdminIstrator),单击回到新建对话框框框;4) 其它选项可暂不设定,直接点,回到角色管理器窗口,角色Marketing就已在列表中了。在这里可以看到各个角色的权限,也可修改它们的权限。5) 角色管理器。然后用同样的方法创建多维数据集HR的角色HR。创建数据库角色: 1) 在“winnie”数据库下右击“数据库角色”,然后选择“管理角色”命令,打开“数据库角色管理器”窗口;2) 这里显示了“winnie”数据库中现有角色的列表(包括刚建的Marketing和HR多维数据集角色);3) 单击,在弹出的对话框中输入角色名:Management,然后
19、为该角色添加用户或组(如admin),并勾选多维数据集Sales和HR。最后点击退出。3查看元数据元数据是关于数据属性和数据结构的信息,此信息显示在 Analysis Manager 右窗格中。1) 查看多维数据集的元数据:展开“多维数据集”文件夹,单击某多维数据集(如:Sales),再单击右窗格的“元数据”;得到如图:2) 查看维度的元数据:展开“共享维度”文件夹,单击一个维度,再单击右窗格的“元数据”。 跟上面耳朵步骤一样。4创建对策1) 展开“winnie”数据库,右击“Sales”多维数据集,然后选择“编辑”命令,打开多维数据集编辑器;2) 右击“对策”文件夹,然后选择“新建对策”命令
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 课程设计 超市 OLAP 分析

链接地址:https://www.31ppt.com/p-2396198.html