業界領先的資料整合工具,支援各種 ETL 與 ELT 作業
現今企業投入大量資訊預算建置企業資源規劃 (ERP)、客戶關係管理 (CRM)、供應鏈管理 (SCM)、商業智慧 (BI) 和資料倉儲 (DW) 等應用系統,然而,許多企業仍舊存在著不連貫、低品質資料的困擾。要成為一個現代化資料驅動型企業,需要將散落各地的寶貴資料整合在一起,才能掌握深入見解,進而協助提振公司營收,實現獲利最大化。
IBM InfoSphere DataStage 是一套業界領先的資料整合工具,用於設計、開發及執行各種異質來源系統的資料轉換級整合工作。運用多重處理器硬體平台的平行處理能力,協助企業管理不斷增長的資料量,確保企業擁有可靠、即時的資訊。
功能優勢
廣泛的異質資料來源連線能力
成功的企業級資訊整合,需要存取各種結構化、半結構化或未結構化,並且位在企業內外部的各種資料來源。IBM InfoSphere DataStage 支援的來源、目標和應用系統包括:
- 文字檔,包含大型主機的檔案。
- 複雜的 XML 資料結構。
- 企業級應用系統,例如 SAP ERP、SAP BW、Salesforce.com。
- 幾乎所有的資料庫系統,例如 ODBC/JDBC、IBM Db2、IBM Informix、Microsoft SQL Server、Oracle、Snowflake、Sybase。
- 大型資料倉儲系統,例如 IBM Db2 Warehouse、Greenplum、Netezza、Teradata。
- 即時串流與訊息佇列,例如 IBM MQ、Kafka。
- 雲端服務資料來源,例如 Amazon S3、Azure Storage、BigQuery、Cassandra、Hbase、Hive。

直覺式的資料整合流設計模式
IBM InfoSphere DataStage 採用隨想隨做的設計介面,開發人員可使用由上而下的應用程式設計,從而建立虛擬的資料流。產品內建超過 50 種預先建構的元件以及數百種資料的轉換工具,透過直覺式的 GUI 式的拖放設計,能夠縮短學習曲線、簡化管理,並將開發資源的使用最佳化。

支援 SMP、MPP 和網格部署
藉由內建的 IBM InfoSphere Information Server,企業能購輕鬆地從單一處理器 (SMP) 系統擴展到擁有上百顆處理器的大量平行處理 (MPP) 伺服器叢集。這種彈性化的架構擴充能力,也能使用在低成本伺服器的網格部署上,增強對平行處理運算能力的支援,確保企業關鍵資訊整合工作能隨著企業的需求而擴展。

視覺化介面降低維運複雜度
透過 Operations Console 的強大功能,可以同時監控多個業務場景中的 DataStage 引擎,一站式提供所有 ETL 作業運行狀態、系統資源使用情況和引擎健康狀態等資訊,並在發生問題時收到警報,能系統維運人員更好地平衡系統工作負載、對引擎問題進行故障診斷以及更有效地調度 ETL 作業運行。

預期效益
有效提升資料整合工作負載能力
IBM InfoSphere DataStage 具備同業最佳的平行引擎和動態工作負載平衡功能,可動態分配可用運算資源以平衡工作量。具體來說,與傳統的對稱多處理 (SMP) 環境相比,容器化 DataStage 系統可以將資料整合工作負載吞吐量提升約 30%。
優化工作效率節省開發人員成本
IBM InfoSphere DataStage 直覺式的 ETL 流程開發與設計介面,相較傳統的程式開發模式,可以大幅優化開發人員的開發效率。經實證統計使用視覺和機器學習輔助設計時,資料整合開發團隊可以節省高達 87% 的開發成本。
確保資料品質和安全性落實治理
IBM InfoSphere DataStage 為資料整合提供單一使用者體驗,在資料交付時可以同步執行標準化規則的資料驗證,以防止未經授權的使用者存取敏感性資料,避免產生潛在的品質與安全問題,全面落實資料治理的精神。