《PySpark大数据分析与应用》即将上架,敬请期待!

发布时间:2021-09-23 作者:本站原创 浏览量:172

本书内容定位于使用PySpark中的数据类型(DataFrame),构建机器学习模型,实现大数据分析。全书将理论与实战结合,用典型示例演示PySpark核心知识应用,用实际案例展示PySpark在大数据分析中应用。本书设计思路以应用为导向,从PySpark开发环境搭建到大数据分析核心知识点,再到应用案例,不堆积知识点,从应用实践出发让读者明确如何利用所学知识来解决大数据分析问题,并通过实训和课后习题巩固所学知识,真正理解并能够应用所学知识。

本书以Python作为开发语言,基于PySpark进行大数据的分析,系统介绍了PySpark开发环境搭建及大数据分析相关知识。全书共7章,内容包括PySpark大数据分析概述、PySpark安装配置、DataFrame操作、流式数据处理、机器学习库,以及通过招聘网站信息的职业类型划分和信用贷款分析两个完整的案例实战,结合所学PySpark编程知识,实现一个完整的大数据分析过程。本书大部分章节包含了实训和课后习题,通过练习和操作实践,帮助读者巩固所学的内容。

本书可以作为高校数据科学或大数据相关专业教材,也可作为机器学习爱好者的自学用书。