图书推荐

本书介绍了目前大数据处理的两套主流框架Hadoop和Spark,包括Hadoop分布式文件系统、MapReduce计算框架、HBase数据库、Hive结构化数据处理模块、Spark计算框架和Spark SQL 结构化数据处理模块。书中按照顺序由浅入深地介绍了各模块的系统原理、部署方法、配置方法、基本操作等内容。本书侧重于实践操作,通过实践学习大数据技术,在使用大数据工具的过程中使读者逐步了解大数据处理的基本概念、方法和步骤,强化实际操作能力。可以作为大数据初学者的自学教材和参考手册。