发布时间:2015-10-24 00:00 来源:未知
SSIS 超越 ETL 工具之处不仅在于它可以使用非传统的应用场景,而且在于它是一个可以进行数据集成的真正平台。SSIS 是 SQL Server Business Intelligence(BI)平台(开发端到端的双向应用)的一部分。
集成的开发平台
SQL Server Integration Services、Analysis Services 和 Reporting Services 都使用一个共同的基于 Microsoft Visual Studio ® 的开发环境,即 SQL Server Business Intelligence (BI) Development Studio。BI Development Studio 为 BI 应用程序的开发提供了一个集成的开发环境(IDE)。这个共享的基础结构支持在各种开发项目(集成、分析和报告)之间进行元数据级的集成。这种共享构造的一个示例是数据源视图(DSV),DSV 是数据源的脱机架构/视图定义,可应用于所有这三种项目类型。
IDE 提供与版本控制软件(如 VSS)等进行集成的设施,也支持基于团队的功能(如“签入/签出”),因此,它能够满足商业智能应用程序对企业级的、面向团队的、开发环境的需求。图 9 显示了一个包含集成、分析和报告项目的 BI Development Studio 解决方案。
这不仅提供了一个开发 BI 应用程序的单一位置,还可用于开发其他 Visual Studio 项目(使用Visual C#®、Visual Basic® .NET 等),从而为开发人员提供了一种真正的端到端的开发体验。
除了提供一种集成的 BI 开发环境以外,BI Development Studio 还具有对 SSIS 包进行准确的运行时调试的功能,包括设置断点的能力及对标准开发构造(如观察变量)的支持。一个真正独特的功能是数据查看器,当 Integration Services 处理数据流管道中的数据时,可以使用数据查看器查看多行数据。这种数据的可视化可以以常规文本网格的形式表示,也可以以图形(如散点图或条形图)表示。实际上,可以连接多个查看器,以便同时以多种格式显示数据。图 10 显示了使用散点图和文本网格表示可视化地理数据的一个示例。
可编程性
除了提供专业的开发环境以外,SSIS 还通过一套 API 展示了其所有功能。这些 API 既有托管的(.NET Framework),也有本机的(Win32),允许开发人员通过以任何 .NET Framework 支持的语言(如 Visual C#、Visual Basic .NET 等)和 Visual C++ 支持的语言开发自定义组件来扩展 SSIS 的功能。这些自定义组件可以是工作流任务和数据流转换(包括源适配器和目标适配器)。这样,在 SSIS 集成进程中就能轻松地包含早期的数据和功能,从而能够使过去投资的传统技术仍然发挥作用。SSIS也能容易地包含第三方组件。
脚本
本文前面提到的可扩展性并非只能从可以再度使用的自定义组件获得,还可以获得基于脚本的可扩展性。SSIS 既有针对任务流的脚本组件,也有针对数据流的脚本组件。它们都允许用户用 Visual Basic. NET 语言编写脚本以添加即席功能(包括数据源和目标)以及重新使用封装为 .NET Framework 程序集的任何现有功能。
SQL Server 2008 包含用于应用程序的 Visual Studio 工具,该工具提供一种脚本环境,可以使用Visual Basic .NET 或 C# 执行脚本组件。
具有可扩展性的模型使 SSIS 不仅是一个数据集成工具,还是一个集成总线,可以容易地集成像数据挖掘、文本挖掘和统一维度模型(UDM)这样的技术,以实现包含非常任意的数据操纵和结构的复杂集成应用场景。
使数据集成更容易完成
SSIS 体系结构的灵活性和可扩展性,使它可以解决在本文前面提及的数据集成所面临的大部分技术挑战。如图 12 所示,SSIS 消除了不必要的分段处理(或者至少使之最小化)。因为是在单一管道操作中执行复杂的数据操纵,现在它能对数据的变化和模式迅速作出反应,而且使用一种对关闭循环和执行操作适用的时间框架。相比之下,就关闭循环和对数据执行适当的操作而言,依赖于数据分段处理的传统体系结构就显得不切实际。
SSIS 的可扩展特性使组织能够通过将自定代码作为可以再度使用的扩展封装到 SSIS 中,并在此基础上充分利用日志记录、调试和 BI 集成等功能,从而将他们在自定义代码方面的现有投资用于数据集成。这非常有助于克服本文前面提及的某些组织挑战。
与其他高端数据集成工具相比,SQL Server 产品中包含的 SSIS 的购置成本显得非常合理。不仅初次购置成本下降,而且通过与 Visual Studio 和其他 SQL Server BI 工具的紧密集成,SSIS的应用程序开发和维护的成本相对其他类似的工具而言也显著下降。SSIS(以及 SQL Server 的其他组件)极为合理的总体拥有成本(TCO),使企业级的数据集成能够适用于所有的细分市场,而不再是专用于最大(和最富有的)的公司。同时,SSIS 的体系结构适合利用新式的硬件,其提供的性能和规模能够满足最高端客户的需求。SSIS 能够使所有客户(从最高端的企业到小型和中型企业)实现丰富的、可扩展的数据集成。由于与 SQL Server 中的其他功能和Microsoft 的客户支持基础结构(从广泛的、长期的 beta 测试到丰富的联机社区,再到主要支持合同)的结合使用,以及与其他 Microsoft 产品的集成,使 SSIS 真正成为一个独特的工具包,它为数据集成开辟了新的领域。
结束语
在当今的商业世界中,许多企业都依赖于数据集成技术来提供有意义的、可靠的信息以维持其竞争优势。SQL Server 2008 Integration Services (SSIS)能够帮助信息技术部门满足企业进行数据集成的需要。SQL Server 2008 Integration Services 能够清理、转换,以及将海量的多种数据源映射成为有用的格式。新增功能在改善其扩展能力和提高性能的同时,加快了开发速度并降低了 TCO。