新聞中心
kettle按一列分組并把另一列合并為一條記錄怎么做?
首先:使用Sort rows控件,根據(jù)需要分組的字段AA排序下;

其次:使用Group by控件,分組字段為:AA,Aggredates部分Name為新字段名,Subjest為BB,Type選擇Concatenate strings separated by ,
ETL工具的典型代表主要有什么?
Extraction-Transformation-Loading的縮寫,中文名稱為數(shù)據(jù)提取、轉換和加載。 ETL工具有:OWB(Oracle Warehouse Builder)、ODI(Oracle Data Integrator)、Informatic PowerCenter、Trinity、AICloudETL、DataStage、Repository Explorer、Beeload、Kettle、DataSpider
目前,ETL工具的典型代表有:Informatica、Datastage、OWB、微軟DTS、Beeload、Kettle……
開源的工具有eclipse的etl插件。cloveretl.
數(shù)據(jù)集成:快速實現(xiàn)ETL
ETL的質(zhì)量問題具體表現(xiàn)為正確性、完整性、一致性、完備性、有效性、時效性和可獲取性等幾個特性。而影響質(zhì)量問題的原因有很多,由系統(tǒng)集成和歷史數(shù)據(jù)造成的原因主要包括:業(yè)務系統(tǒng)不同時期系統(tǒng)之間數(shù)據(jù)模型不一致;業(yè)務系統(tǒng)不同時期業(yè)務過程有變化;舊系統(tǒng)模塊在運營、人事、財務、辦公系統(tǒng)等相關信息的不一致;遺留系統(tǒng)和新業(yè)務、管理系統(tǒng)數(shù)據(jù)集成不完備帶來的不一致性。
實現(xiàn)ETL,首先要實現(xiàn)ETL轉換的過程。它可以集中地體現(xiàn)為以下幾個方面:
1、空值處理:可捕獲字段空值,進行加載或替換為其他含義數(shù)據(jù),并可根據(jù)字段空值實現(xiàn)分流加載到不同目標庫。
2、規(guī)范化數(shù)據(jù)格式:可實現(xiàn)字段格式約束定義,對于數(shù)據(jù)源中時間、數(shù)值、字符等數(shù)據(jù),可自定義加載格式。
3、拆分數(shù)據(jù):依據(jù)業(yè)務需求對字段可進行分解。例,主叫號 861082585313-8148,可進行區(qū)域碼和電話號碼分解。
4、驗證數(shù)據(jù)正確性:可利用Lookup及拆分功能進行數(shù)據(jù)驗證。例如,主叫號861082585313-8148,進行區(qū)域碼和電話號碼分解后,可利用Lookup返回主叫網(wǎng)關或交換機記載的主叫地區(qū),進行數(shù)據(jù)驗證。
到此,以上就是小編對于kettle表輸出報錯的問題就介紹到這了,希望這2點解答對大家有用。
本文名稱:kettle表輸出獲取不到字段怎么解決
文章網(wǎng)址:http://www.dlmjj.cn/article/dhgsess.html


咨詢
建站咨詢
