一、什么是kettle
Kettle最早是一个开源的ETL工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment。在2006年,Pentaho公司收购了Kettle项目,原Kettle项目发起人Matt Casters加入了Pentaho团队,成为Pentaho套件数据集成架构师 ;从此,Kettle成为企业级数据集成商业智能套件Pentaho的主要组成部分,Kettle亦重命名为Pentaho Data Integration。
Pentaho Data Integration以Java开发,支持跨平台运行,其特性包括:支持100%无编码、拖拽方式开发ETL数据管道;可对接包括传统数据库、文件、大数据平台、接口、流数据等数据源;支持ETL数据管道加入机器学习算法。
Pentaho Data Integration分为商业版与开源版,开源版的截止2021年1月的累计下载量达836万,其中19%来自中国。在中国,一般人仍习惯把Pentaho Data Integration的开源版称为Kettle。
二、主要功能
Pentaho Data Integration作为一个端对端的数据集成平台,可以对多种数据源进行抽取(Extraction)、加载(Loading)、数据落湖(Data Lake Injection)、对数据进行各种清洗(Cleasing)、转换(Transformation)、混合(Blending),并支持多维联机分析处理OLAP和数据挖掘(Data mining)。
三、Kettle的安装
1、安装准备
必须要安装jdk以及配置环境变量,jdk的安装请参照百度jdk环境变量配置。
2、kettle的安装
1)下载data-integration压缩文件(此文件为kettle的主目录,解压即可用)
具体文件,笔者已放入百度网盘,需要下载的可以扫描下方二维码关注公众号,回复【kettle】关键词获取
2)下载完解压,打开文件夹进入kettle的主目录,双击spoon.bat
3)进入kettle的主页面
双击spoon.bat进入主界面没有提示java环境变量没有配置的情况下,则安装完毕;如果提示java环境变量需要配置,则安装失败
欢迎转载,转载请标注出处。关注公众号: JAVA大师, 后台回复 资源,既可获取资源链接 !!!