幾種?ETL?工具的比較(DataPipeline,Kettle,Talend,Informatica等)
四種工具的比較主要從以下幾方面進行比對:
1、成本:軟件成本包括多方面,主要包括軟件產品,?售前培訓,?售後咨詢,?技術支持等。
開源產品本身是免費的,成本主要是培訓和咨詢,所以成本會壹直維持在壹個較低水平。
商業產品本身價格很高,但是壹般會提供幾次免費的咨詢或支持,所以采用商用軟件最初成本很高,但是逐漸下降。
手工編碼最初成本不高,主要是人力成本,但後期維護的工作量會越來越大。
2、易用性:DataPipeline:?有非常容易使用的?GUI,具有豐富的可視化監控;
Kettle:?GUI+Coding;
Informatica:?GUI+Coding,有GUI,但是要專門的訓練;
Talend:GUI+Coding,有?GUI?圖形界面但是以?Eclipse?的插件方式提供;
3、技能要求:DataPipeline:操作簡單,無技術要求;
Kettle:?ETL設計,?SQL,?數據建模?;
Informatica:?ETL設計,?SQL,?數據建模;
Talend:需要寫Java;
4、底層架構:DataPipeline:分布式,可水平擴展;
Kettle:主從結構非高可用;
Informatica:分布式;
Talend:分布式;
5、數據實時性:DataPipeline:支持異構數據源的實時同步,速度非常快;
Kettle:不支持實時數據同步;
Informatica:支持實時,效率較低;
Talend:支持實時處理,需要購買高級版本,價格貴;
6、技術支持:DataPipeline:本地化原廠技術支持;
Kettle:無;
Informatica:主要在美國;
Talend:主要在美國;
7、自動斷點續傳:DataPipeline:支持;
Kettle:不支持;
Informatica:不支持;
Talend:不支持;