《ETL数据整合与处理》即将上架,敬请期待!

发布时间:2020-06-16 11:40:13来源:本站原创

本书以实现ETL流程中的各类操作步骤为导向,通过任务的方式,深入浅出地介绍了通过Kettle实现ETL所需的步骤与流程。本书所有章节均采用总分结构,先总起陈述本章涉及的内容,而后将相关知识点一一道出。设计思路以应用为导向,让读者明确如何利用所学知识来解决问题。同时配套课后练习,帮助读者巩固所学知识,使读者真正理解并能够应用所学知识。

本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例,深入浅出地介绍了ETL数据整合与处理相关内容。全书共8章,第1章介绍了ETL的基本概念、常用ETL工具、Kettle运行环境配置,以及Kettle基本操作;第2章介绍了源数据获取相关的组件,包括创建数据库连接、表输入、CSV文件输入、Excel输入等;第3章介绍了记录处理相关组件,包括记录排序、去除重复记录、替换NULL值等;第4章字段处理相关组件,包括字段选择、增加常量、将字段值设置为常量等;第5章介绍了高级转换相关组件,包括记录集连接、多路数据合并、单变量统计等;第6章介绍了迁移和装载相关组件,包括表输出、插入/更新、Excel输出等;第7章介绍了任务及其相关组件,包括开始、转换、添加文件到结果文件中等;第8章介绍了无人售货机零售项目实战,包括了解无人售货机项目背景与目标、分组聚合客户订单、计算各商品销售金额、统计各售货机日销售金额、整理各售货机情况等。每章都配套有对应的习题,包括选择题和操作题,通过练习和操作实践,帮助读者巩固所学的内容。

本书可以作为高校数据科学或数据分析相关专业的教材,也可作为ETL爱好者的自学用书。


 


公众号
返回
顶部
请关注“官方公众号”
Copyright © 2013-2020   广东泰迪智能科技股份有限公司   技术支持   粤ICP备14098620号