《Hadoop与大数据挖掘》——图书配套资料下载

发布时间：2016-01-29 作者：泰迪大数据挖掘创新创业工作室乐部浏览量：1384

1.图书简介

继推出《Hadoop数据分析与挖掘实战》之后，应广大高校师生要求，由泰迪科技与高校联合倾力打造的巅峰之作《Hadoop与大数据挖掘》，已与2017年1月由机械出版社出版。

本书主要分为两个部分，基础篇和挖掘实践篇。基础篇介绍了大数据相关技术：Hadoop、Hive、HBase、Pig、Spark、Oozie等。针对每个技术有每个模块与之对应，首先会对该技术的概述、内部原理等进行介绍，使读者对该技术有一个由浅入深的理解。在对原理的介绍中会进行相应的动手实践，加深对原理的理解。在每个模块的最后，会有一到两个企业案例，对这些企业案例的介绍只限于部分介绍，主要还是使用当前模块的技术来解决其中的一到两个问题，这样读者不仅对技术的原理、架构有了较深入的了解，同时，对于如何应用该技术有一定认识，为以后的工作、学习打下良好基础。挖掘实践篇通过一个大型的企业应用案例的介绍，充分应用基本篇讲解的大数据技术来解决企业应用中遇到的各种问题。图书配套提供了程序代码及数据，读者可通过上机实验，快速掌握书中所介绍的大数据相关技术，具备使用大数据相关技术进行数据挖掘的基本能力。

第一部分是基础篇（1~7章），第1章主要介绍了大数据相关概念以及大数据相关技术的简单介绍，第2章对Hadoop进行了介绍，包括概念、原理、架构等，并且通过动手实践加深对原理的理解及企业应用。第3章对Hive进行了介绍，重点分析了Hive的架构、如何和Hadoop相结合，同时，引入一个企业案例来分析Hive在企业应用中的位置。第4章对HBase进行了介绍，分析了HDFS和HBase的异同点、HBase架构原理、HBase如何做到支持随机读写等。第5章介绍了Pig，详细分析了Pig的实现原理及应用场景，介绍了Pig Latin，并且包含一个Pig Latin的动手实践，加深读者对该脚本的熟练。第6章介绍了Spark的基本原理、RDD实现等，并且对Scala进行了简单介绍，使用Scala创建Wordcount程序。在模块的最后使用Spark MLlib解决引入的企业案例中的模型建立环节。第7章介绍了Hadoop 工作流Oozie，通过动手实践建立包含Hadoop MR、Spark、Hive、Pig的工作流，方便理解企业工作流应用。

第二部分是挖掘实践篇（第8章），主要是一个企业级大数据应用项目—电子商务智能推荐系统。通过分析应用背景、如何构建系统、针对系统的每一层使用什么大数据技术来解决问题。涉及到的流程有数据采集、数据预处理、模型构建等等，在每一个流程中会进行大数据相关技术实践，运用实际数据来进行分析，使读者切身感受到大数据技术解决大数据企业应用的魅力。

此外，泰迪云课堂提供相关的学习视频，详见：https://edu.tipdm.org。

2. 图书配套资料下载说明

方法：打开云教材（https://book.tipdm.org/）,下载对应的图书资源。