数据清洗/ETL日志处理过程中一个假设是:数据并不是完美的。在原始数据与最终结果之间有Gap,需要通过ETL(Extract Transformation Load)等手段进行清洗、转换与整理。案例“我要点外卖“是一个平台型电商网站,用户、餐厅、配送员等。
创业邦消息,医疗数据ETL服务商深圳市人仁医科技有限公司宣布完成近千万的天使轮融资,前阿里巴巴集团高管所创立的众海投资为其投资方,以太资本担任财务顾问。人仁医每周都有1-2家医院的接入,有望在今年底就拥有超过200家医院的增量。
大数据文摘作品,转载需授权选文:薛菲翻译:薛菲,小丛,Aileen,冯丽丽◆ ◆ ◆译者注ETL - Extract Transform Load 抽取 转换加载,代表从源数据清洗加工到数据仓库的过程。
概述ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少。
数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。