Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
Kettle运行时对内存要求较高,单表每秒种处理3000多条数据。
Kettle 优点如下:
- 免费开源:基于java的免费开源的软件,对商业用户也没有限制
- 易配置:可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定
- 不同数据库:ETL工具集,它允许你管理来自不同数据库的数据
- 两种脚本文件: transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制
- 图形界面设计:通过图形界面设计实现做什么业务,无需写代码去实现
- 定时功能:在Job下的start模块,有一个定时功能,可以每日,每周等方式进行定时
Kettle家族目前包括4个产品:Spoon、Pan、CHEF、Kitchen。
- SPOON 允许你通过图形界面来设计ETL转换过程(Transformation)。
- PAN 允许你批量运行由Spoon设计的ETL转换 (例如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。
- CHEF 允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。
- KITCHEN 允许你批量使用由Chef设计的任务 (例如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。