[计算机软件及应用]SSIS 教程.doc
《[计算机软件及应用]SSIS 教程.doc》由会员分享,可在线阅读,更多相关《[计算机软件及应用]SSIS 教程.doc(55页珍藏版)》请在三一办公上搜索。
1、SSIS 教程:创建简单的 ETL 包MicrosoftIntegration Services 是一个可以生成高性能数据集成解决方案(包括为数据仓库提取、转换和加载 (ETL) 包)的平台。Integration Services 包括用于生成和调式包的图形工具和向导;用于执行工作流函数(如 FTP 操作)、执行 SQL 语句以及发送电子邮件的任务;用于提取和加载数据的数据源和目标;用于清除、聚合、合并和复制数据的转换;用于管理包执行和存储的管理服务,即 Integration Services;以及用于 Integration Services 对象模型编程的应用程序编程接口 (API)。
2、在本教程中,您将学习如何使用 SSIS 设计器创建一个简单的 MicrosoftSQL ServerIntegration Services 包。所创建的包将从平面文件提取数据,重新设置数据的格式,然后将已重新设置格式的数据插入到事实数据表中。在下列课程中,将扩展包以阐释循环、包配置、日志记录和错误流。在安装教程所用的示例数据的同时,也会安装将在教程的每一课中创建的完整的包版本。使用完整的包,您可以按需要跳过前面几课而从后面的课程开始学习教程。如果您是第一次使用包或新的开发环境,我们建议从第 1 课开始学习。您将在 SSIS 教程中学到的内容 熟悉 MicrosoftSQL ServerInt
3、egration Services 的新工具、控件和功能的最好方法,就是使用它们。本教程将引导您使用 SSIS 设计器创建一个简单的 ETL 包,其中包含循环、配置、错误流逻辑和日志记录。SSIS 教程的要求 本教程适用于熟悉基本数据库操作,但对 SQL ServerIntegration Services 中的新功能认识有限的用户。若要使用本教程,系统中必须安装有下列各项: 带有 AdventureWorksDW 数据库的 SQL Server。为了增强安全性,默认情况下不会安装示例数据库。若要安装示例数据库,请参阅安装 SQL Server 示例和示例数据库的注意事项。 本教程还需要示例数
4、据。示例数据与示例一起安装。如果无法找到示例数据,请返回以上过程,按说明完成安装。注意 阅读教程时,建议将“下一个主题”和“上一个主题”按钮添加到文档查看器工具栏中。有关详细信息,请参阅向帮助中添加“上一步”和“下一步”按钮。本教程假定没有将 SSIS 设计器重新配置为使用控制流元素或数据流元素的自动连接功能。如果 SSIS 设计器使用自动连接功能,则元素可能会在添加到设计图面时自动进行连接。控制流的自动连接功能还支持将“失败”和“完成”,而不是将“成功”用作默认的约束。如果 SSIS 设计器未使用“成功”作为默认的约束,则应当在执行教程时重置此配置。可以在“选项”对话框的“商业智能设计器”部
5、分中配置自动连接功能,该对话框可通过单击“工具”菜单中的“选项”获得。本 SSIS 教程中的课程 第 1 课(SSIS 教程):创建项目和基本包 在本课中,将创建一个简单的 ETL 包,从单个平面文件中提取数据,再使用查找转换转换数据,最后将所得结果加载到目标事实数据表中。第 2 课:添加循环 在本课中,将扩展第 1 课中创建的包,利用新增的循环功能,将多个平面文件提取到单个数据流进程中。第 3 课:添加包配置 在本课中,将扩展第 2 课中创建的包,利用新增的包配置选项。第 4 课:添加日志记录 在本课中,将扩展第 3 课中创建的包,利用新增的日志记录功能。第 5 课:添加错误流重定向 在本课
6、中,将扩展第 4 课中创建的包,以便利用新增的错误输出配置。第 1 课(SSIS 教程):创建项目和基本包在本课中,您将创建一个简单 ETL 包,该包可以从单个平面文件源提取数据,使用两个查找转换组件转换该数据,然后将该数据写入 AdventureWorksDW 中的 FactCurrencyRate 事实数据表。在本课中,您还将学习如何创建新包、添加和配置数据源和目标连接以及使用新的控制流和数据流组件。重要提示本教程需要 AdventureWorksDW 示例数据库。有关安装和部署 AdventureWorksDW 的详细信息,请参阅安装 SQL Server 示例和示例数据库的注意事项。了
7、解包要求 在创建包之前,需要充分了解在源数据和目标数据中使用的格式。了解了这些数据格式后,便可定义将源数据映射到目标数据所需的转换。查看源在本教程中,源数据是平面文件 SampleCurrencyData.txt 中包含的一组历史货币数据。源数据具有以下四列:货币的平均汇率、货币键、日期键和收盘汇率。下面是 SampleCurrencyData.txt 文件中所包含的源数据示例:1.00010001ARS9/3/2001 0:000.99960016 1.00010001ARS9/4/2001 0:001.001001001 1.00020004ARS9/5/2001 0:000.999900
8、01 1.00020004ARS9/6/2001 0:001.00040016 1.00050025ARS9/7/2001 0:000.99990001 1.00050025ARS9/8/2001 0:001.001001001 1.00050025ARS9/9/2001 0:001 1.00010001ARS9/10/2001 0:001.00040016 1.00020004ARS9/11/2001 0:000.99990001 1.00020004ARS9/12/2001 0:001.001101211 在使用平面文件源数据时,需要了解平面文件连接管理器如何解释平面文件数据,这一点很重要
9、。如果平面文件源是 Unicode 编码的,则平面文件连接管理将所有列定义为 DT_WSTR,默认列宽为 50。如果平面文件源是 ANSI 编码的,则将列定义为 DT_STR,默认列宽为 50。您可能必须更改这些默认设置,才能使字符串列类型与所使用的数据更相符。为此,您需要查看将写入数据的目标的数据类型,然后在平面文件连接管理器中选择正确的类型。查看目标源数据的最终目标是 AdventureWorksDW 中的 FactCurrencyRate 事实数据表。FactCurrencyRate 事实数据表有四列,并且与两个维度表有关系,如下表所示。列名称数据类型查找表查找列AverageRatef
10、loat无无CurrencyKeyint (FK)DimCurrencyCurrencyKey (PK)TimeKeyInt (FK)DimTimeTimeKey (PK)EndOfDayRatefloat无无将源数据映射为与目标兼容对源数据和目标数据的分析指出需要查找 CurrencyKey 和 TimeKey 值。将执行这些查找的转换通过使用 DimCurrency 和 DimTime 维度表中的备用键来获取 CurrencyKey 和 TimeKey 值。平面文件列表名列名称数据类型0FactCurrencyRateAverageRateFloat1DimCurrencyCurrency
11、AlternateKeynchar(3)2DimTimeFullDateAlternateKeyDatetime3FactCurrencyRateEndOfDayRateFloatSSIS 教程:课程任务 本课程包含以下任务: 任务 1:创建新的 Integration Services 项目 任务 2:添加并配置平面文件连接管理器 任务 3:添加并配置 OLE DB 连接管理器 任务 4:将数据流任务添加到包 任务 5:添加并配置平面文件源 任务 6:添加并配置查找转换 任务 7:添加和配置 OLE DB 目标 任务 8:使 Lesson 1 包更易于理解 任务 9:测试 Lesson 1
12、教程包 任务 1:创建新的 Integration Services 项目在 Integration Services 中创建包的第一步就是创建一个 Integration Services 项目。此项目包含在数据转换解决方案中使用的数据源、数据源视图和包等对象的模板。将在本 Integration Services 教程中创建的包用于解释受区域设置影响的数据的值。如果您的计算机未配置为使用区域选项“英语(美国)”,则需要在包中设置其他属性。第 2 课到第 5 课中使用的包是从第 1 课中创建的包复制而来的,因此不需要更新复制的包中受区域设置影响的属性。创建新的 Integration Ser
13、vices 项目1. 在“开始”菜单上,依次指向“所有程序”和 Microsoft SQL Server,再单击 SQL Server、Business Intelligence Development Studio。2. 在“文件”菜单中,指向“新建”,再单击“项目”,以创建一个新的 Integration Services 项目。3. 在“新建项目”对话框的“模板”窗格中,选择“Integration Services 项目”。4. 在“名称”框中,将默认名称更改为 SSIS Tutorial。或者,清除“创建解决方案的目录”复选框。5. 接受默认位置,或单击“浏览”,以浏览并找到要使用的
14、文件夹。6. 在“项目位置”对话框中,单击文件夹,再单击“打开”。7. 单击“确定”。默认情况下,将创建一个名为 Package.dtsx 的空包,并将该包添加到项目中。8. 在解决方案资源管理器工具栏中,右键单击 Package.dtsx,再单击“重命名”,将默认包重命名为 Lesson 1.dtsx。9. 当系统提示重命名包对象时,单击“是”。设置受区域设置影响的属性1. 在“视图”菜单上,单击“属性窗口”。2. 在“属性”窗口中,将 LocaleID 属性设置为“英语(美国)“。任务 2:添加并配置平面文件连接管理器在本任务中,将在刚创建的包中添加一个平面文件连接管理器。通过平面文件连接
15、管理器,包可从平面文件中提取数据。使用平面文件连接管理器,可以指定包从平面文件中提取数据时要应用的文件的名称与位置、区域设置与代码页以及文件格式,其中包括列分隔符。另外,还可以为各个列手动指定数据类型;也可以使用“提供列类型建议”对话框,自动将提取出来的数据列映射到 Integration Services 数据类型。必须为要使用的每种文件格式创建一个新的平面文件连接管理器。因为本教程从多个数据格式完全相同的平面文件提取数据,所以只需为您的包添加和配置一个平面文件连接管理器。在本教程中,将在平面文件连接管理器中配置以下属性: Column names 因为平面文件没有列名,因此平面文件连接管理
16、器将创建默认的列名。这些默认名称不能用于标识每个列代表的内容。若要使这些默认名称更有用,需要将默认名称改为要加载平面文件数据的事实数据表匹配的名称。 Data mappings 为平面文件连接管理器指定的数据类型映射,将由所有引用该连接管理器的平面文件数据源组件使用。可以使用平面文件连接管理器,或者使用“提供列类型建议”对话框来手动映射数据类型。在本教程中,将查看“提供列类型建议”对话框中建议的映射,然后在“平面文件连接管理器编辑器”对话框中手动设置必要的映射。平面文件连接管理器提供了有关数据文件的区域设置信息。如果未将您的计算机配置为使用区域设置选项“英语(美国)”,则必须在“平面文件连接管
17、理器编辑器”对话框中设置其他属性。添加一个平面文件连接管理器1. 右键单击“连接管理器”区域中的任意位置,再单击“新建平面文件连接”。2. 在“平面文件连接管理器编辑器”对话框的“连接管理器名称”字段中,键入 Sample Flat File Source Data。3. 单击“浏览”。4. 在“打开”对话框中,找到示例数据文件夹,再打开 SampleCurrencyData.txt 文件。默认情况下,教程示例数据安装在 c:Program FilesMicrosoft SQL Server100SamplesIntegration ServicesTutorialCreating a Sim
18、ple ETL PackageSample Data 文件夹中。设置受区域设置影响的属性1. 在“平面文件连接管理器编辑器”对话框中,单击“常规”。2. 将“区域设置”设置为“英语(美国)”,并将“代码页”设置为 1252。重命名平面文件连接管理器中的列1. 在“平面文件连接管理器编辑器”对话框中,单击“高级”。2. 在“属性”窗格中,进行如下更改:o 将 Column 0 名称属性改为 AverageRate。o 将 Column 1 名称属性改为 CurrencyID。o 将 Column 2 名称属性改为 CurrencyDate。o 将 Column 3 名称属性改为 EndOfDay
19、Rate。注意默认情况下,所有四个列最初都设置为字符串数据类型 DT_STR,其 OutputColumnWidth 为 50。重新映射列数据类型1. 在“平面文件连接管理器编辑器”对话框中,单击“建议类型”。Integration Services 将根据前 100 行数据自动建议最合适的数据类型。您还可以将这些建议选项改为增加或减少取样数据,以便指定整数数据或布尔数据的默认数据类型,或添加作为填充量添加到字符串列中的空格。现在,请不要对“提供列类型建议”对话框中的选项进行任何更改,单击“确定”可使 Integration Services 提供列数据类型的建议。这样,您将转到“平面文件连接
20、管理器编辑器”对话框的“高级”窗格,在此可以查看 Integration Services 建议使用的列数据类型。(如果单击“取消”,则不对列元数据提供任何建议,并使用默认字符串 (DT_STR) 数据类型。)在本教程中,Integration Services 为 SampleCurrencyData.txt 文件中的数据建议了下表第二列中显示的数据类型。但是,目标中的列要求的数据类型(将在以后的步骤中定义)显示在下表的最后一列。平面文件列建议的类型目标列目标类型AverageRateFloat DT_R4FactCurrencyRate.AverageRateFloatCurrencyID
21、String DT_STRDimCurrency.CurrencyAlternateKeynchar(3)CurrencyDateDate DT_DATEDimTime.FullDateAlternateKeydatetimeEndOfDayRateFloat DT_R4FactCurrencyRate.EndOfDayRateFloat为 CurrencyID 和 CurrencyDate 列建议的数据类型与目标表中的字段的数据类型不兼容。由于 DimCurrency.CurrencyAlternateKey 的数据类型为 nchar (3),CurrencyID 必须从字符串类型 DT_S
22、TR 改为字符串类型 DT_WSTR。另外,字段 DimTime.FullDateAlternateKey 被定义为 DataTime 数据类型,因此 CurrencyDate 需要从日期类型 DT_Date 改为数据库时间戳类型 DT_DBTIMESTAMP。2. 在“属性”窗格中,将列 CurrencyID 的数据类型从字符串类型 DT_STR 改为 Unicode 字符串类型 DT_WSTR。3. 在“属性”窗格中,将列 CurrencyDate 的数据类型从日期类型 DT_DATE 改为数据库时间戳类型 DT_DBTIMESTAMP。4. 单击“确定”。任务 3:添加并配置 OLE D
23、B 连接管理器添加了用于连接到数据源的平面文件连接管理器以后,下一个任务是添加用于连接到目标的 OLE DB 连接管理器。通过 OLE DB 连接管理器,包可以在任何 OLE DB 兼容的数据源中提取数据或加载数据。使用 OLE DB 连接管理器,可以为连接指定服务器、身份验证方法和默认数据库。在本课中,将创建使用 Windows 身份验证的 OLE DB 连接管理器,以连接到 AdventureWorksDB 的本地实例。本教程以后要创建的其他组件(如查找转换和 OLE DB 目标)也将引用此处创建的 OLE DB 连接管理器。添加和配置 OLE DB 连接管理器1. 右键单击连接管理器区域
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机软件及应用 计算机软件及应用SSIS 教程 计算机软件 应用 SSIS
文档标签
- 计算机软件及应用SKETCHUP
- 计算机软件及应用
- 计算机软件及应用CAXA上机指导
- 计算机软件及应用Mathematica
- 计算机软件及应用Jaa
- 计算机软件及应用Lifekeeper
- 计算机软件及应用DELPHI
- 计算机软件及应用SSIS
- 计算机软件及应用Primavera
- 计算机软件及应用ZigBee协议栈TI
- 计算机软件及应用图像预处理技术概述
- 计算机软件及应用安卓经典游戏推荐
- 计算机软件及应用A3Windows
- 计算机软件及应用Oracle
- 计算机软件及应用第2章
- 计算机软件及应用PGP教程
- 计算机软件及应用热泵运行规程第一版
- 计算机软件及应用CorelDRAW
- 计算机软件可靠性和可维护性管理
- 计算机软件及应用ESRI软件介绍
链接地址:https://www.31ppt.com/p-4561659.html