本书由资深大数据专家倾力打造
以Hadoop 3.x及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。
涵盖Hadoop 3.x生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过实际案例加深对各个框架的理解与应用。
全书深入浅出,使用了大量直观的易于理解的图示,代码可读性强,即使没有任何大数据基础的读者,也可以对照书中的步骤成功搭建属于自己的大数据集群,通过对本书的学习,读者能够对大数据相关框架迅速理解并掌握,可以熟练使用Hadoop 3.x集成环境进行大数据项目的开发。
为方便读者使用本书,书中还提供了源代码和PPT课件,扫描本书前言中的二维码即可下载,作者还为本书录制了138集教学视频,读者扫描各章的二维码即可直接观看,大幅提高学习效率。
本书适合Hadoop初学者、大数据开发人员、数据分析人员、大数据运维人员以及培训机构和大专院校的学生使用。