Pentaho Data Inegration 5.0.3 使用教程初阶0328.ppt
《Pentaho Data Inegration 5.0.3 使用教程初阶0328.ppt》由会员分享,可在线阅读,更多相关《Pentaho Data Inegration 5.0.3 使用教程初阶0328.ppt(79页珍藏版)》请在三一办公上搜索。
1、Kettle使用教程初阶德昂信息技术(北京)有限公司,Kettle 简介,Kettle能做什么,Kettle实例Demo,提纲,参考资料,Kettle是什么,Kettle是一个开源的ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)项目。项目名很有意思,水壶。按项目负责人Matt的说法:把各种数据放到一个壶里,然后呢,以一种你希望的格式流出。,最新版已经被整合进Pentaho Open Source BI EE,改名Pentaho Data Integration。下载地址:http:/最新版5.0.4,Kettle安装与设定,首先要安装JDK并设定环境
2、变量path包含JDK_Path/bin。,运行安装文件,安装kettle到指定目录,例如:C:Program Filespentahodesign-toolsdata-integration。,三个可执行文件:Spoon 启动Kettle GUI Kitchen 命令行执行Kettle 作业 Pan 命令行执行Kettle 转换,单击安装后的桌面图标,将运行Spoon,启动Kettle GUI,Kettle简介,Kettle能做什么,Kettle实例Demo,提纲,参考资料,Kettle的主要功能,1.转换 Transformation.ktrETL的所有操作2.作业 Job.kjb定时执行
3、,可以包含多个转换3.模型 Model数据 建模,便于交流,Kettle的其他功能,Instaview用于从混合大数据集中发掘想法.,转换 Transformation 概览,DB 连接Steps(步骤)Hops(节点连接)数据库分区 schemas子服务器Kettle集群schemas,转换 Transformation 详细,Hops(节点连接):result 或 false,Transformation 核心对象,输入 Input,转换与应用,流程,脚本,查询,连接,数据仓库,检验,统计及Data Mining,Big Data,Agile,加密,Palo,OpenERP及作业,映射,批
4、量 加载,内联,实验,不推荐的及历史,作业Job,DB 连接,作业项目(转换),子服务器,Job 核心对象,文件管理及条件,脚本,批量加载,XML和Big Data,应用,资源库,文件传输及文件加密,其他,Kettle简介,Kettle能做什么,Kettle实例Demo,提纲,参考资料,Kettle实例Demo,Demo 1:数据库数据复制Demo 2:数据库数据转换输出到txtDemo 3:txt 文件输入到数据库Demo 4:设定Job定时执行Demo 5:整合Salesforce数据Demo 6:整合AWS S3 文件数据,Kettle实例Demo 1:准备工作,安装SQL Server
5、 2008 R2创建数据库 TestA-建立一个测试的用户表create table usersA(id int not null,userid varchar(50)not null,username varchar(200)null)-插入3条记录insert into usersA values(1,lisi,李四);insert into usersA values(2,zhangsan,张三);insert into usersA values(3,lisi,李四);,创建数据库TestB-建立一个测试的用户表create table usersB(id int not null,u
6、serid varchar(50)not null,username varchar(200)null)实例Demo 1 完成的功能是将数据从TestA数据库的usersA表以插入/更新的方式复制到TestB数据库的usersB表。,Demo 1:浏览数据库连接,新建转换,内置AgileBI的DB连接,Steps和Hops为空,在AgileBI上单击右键,数据库浏览,可以查看数据库中的对象,并进行操作,Demo 1:创建数据库连接,在DB连接上右键选择新建,直接打开数据库连接属性设置,或新建数据库连接向导,打开向导,一步一步填写属性,Demo 1:填写数据库属性,Demo 1:测试数据库连接,
7、Demo 1:创建表输入,核心对象输入中,选择表输入,鼠标拖至编辑区,编辑属性,Demo 1:创建插入/更新,核心对象输出中,选择插入/更新,鼠标拖至编辑区,编辑属性,Demo 1:连接表输入与插入/更新,在【表输入】上同时按住shift键和鼠标左键滑向【插入/更新】,这样建立两个步骤之间的连接,单击运行按钮,设置参数后,启动这个转换:,Demo 1:保存转换文件,转换执行前,如果有改变,会提示保存转换到文件,ktr或xml格式:,Demo 1:执行结果,如果出现错误,请检查相应步骤。可以点击执行历史,性能图,Metrics及Preview data查看其它数据。,Demo 1:创建Job,新
8、建Job,DB连接包含缺省DB,作业项目为空。,从核心对象通用中拖出Start到编辑区,可以设定此Job运行的属性。,Demo 1:加入转换(也可以加入作业),从核心对象通用中拖出转换到编辑区,将start和转换连接起来。,双击转换,可以选择保存的转换文件,并有高级,设置日志,位置参数,命名参数等多项属性设定。,Demo 1:选择转换,选择前面保存的ktr 转换文件:,Demo 1:执行Job,单击运行按钮,启动执行作业,填写相应参数后,点击执行:,Demo 1:保存Job,Job执行前,如果有改变,会提示保存Job到文件,kjb或xml格式:,保存的Job文件,可以在创建Job时以加入作业的
9、形式引入,形成Job的嵌套调用。,Demo 1:Job 执行结果,如果出现错误,请检查相应步骤。可以点击历史,Metrics查看其它数据。,Demo 2和Demo3:准备工作,创建或恢复SQL Server数据库etltest,包含如下源表及目标表:,Demo 2 功能:根据客户,帐户,交易表中的数据,生成对应的数据文件Demo 3 功能:将数据文件可以导入到对应表中,Demo 2:转换概览,可以从这里下载etltest的数据库备份文件以及这个转换的ktr文件:http:/,备注:直接导入的ktr文件如果无法运行,报错的话,重新创建一遍后就可以了。,Demo 2:表输入及表查询,Demo 2:
10、过滤记录,根据条件,执行后续不同的Step,Demo 2:根据过滤条件增加常量,根据条件,定义变量custype_cn,对其赋值,并将值传递给常量Value。True或FalseStep同理。,Demo 2:输出到文件,Demo 2:运行,输出到文本文件:,Demo 3:概览,两个步骤:文本文件输入表输出,Demo 3:文本输入,Demo 3:表输出,设定从文本字段到数据库表字段的映射。,Demo 3:运行,Demo 4:Job 概览,Demo 2实现了对数据库数据的处理,并输出到文本文件;Demo 3实现了从文本文件输入到数据库表。Demo 4建立一个Job把前面两个转换合并到一起执行。,D
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Pentaho Data Inegration 5.0.3 使用教程初阶0328 5.0 使用 教程 0328

链接地址:https://www.31ppt.com/p-2361767.html