Kettle软件主要提供了4种数据库连接方式,分别是JDBC、ODBC、OCI、JNDI,其中 OCI 只适用于Oracle。本文重点对使用比较普遍的 JDBC 和 JNDI 连接方式进行探讨,后面会有单独文章对 ODBC 连接方式进行说明。
数据仓库是很大的数据存储的集合,它主要是为了给企业出分析报告或者提供决策而创建的,它和数据库的区别主要还是概念上的,数据库是面向业务的,如果业务的数据库出现问题了,那么软件就无法使用了,而数据仓库是面向分析的,是为了企业做决策使用,比如通过分析企业的利润,来调整企业的业务发展和规划。
[来自IT168]【IT168 技术】在当前大数据环境下,我们处理数据迁移、转换的工作会越来越多,数据仓库的概念也越来越被熟知,现在有很多成熟的工具提供ETL 功能,即将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。
在Kettle中变量一共可以分为3类,分别是系统变量、自定义变量和环境变量,其中系统变量是全局变量,自定义变量是局部变量,而环境变量指的是当前脚本文件中出现的所有变量,包括系统变量、自定义变量以及环境变量自身定义的变量。
#大数据#简介 Smart Kettle是针对上述企业的痛点,对kettle的使用做了一些包装、优化,使其在web端也能具备基础的kettle作业、转换的配置、调度、监控,能在很大一定程度上协助企业完成不同业务场景下数据的ETL(抽取、转换、加工)的能力。