清华大学出版社--图书推荐

图书推荐

《Hadoop + Spark大数据巨量分析与机器学习整合开发实战》的博客已开通，作者会在博客里为大家提供服务与交流。
博客网址：http://blog.sina.com.cn/hadoopsparkbook

《Hadoop + Spark大数据巨量分析与机器学习整合开发实战》书中的范例程序免费送给读者：
网址：

https://pan.baidu.com/s/1rap5f7A

我们建立了本书的Facebook粉丝团，欢迎读者们加入。粉丝团会不定期贴文，分享最新的Hadoop或Spark信息，你也可以提问并参与交流。
粉丝团网址：http://www.weibo.com/hadoopsparkbook

在《Hadoop + Spark大数据巨量分析与机器学习整合开发实战》中，不是对这些原理进行纯理论的阐述，而是提供了丰富的上机实践操作和范例程序，这样极大地降低了读者学习大数据技术的门槛，对于需要直接上机实践的学习者而言，本书更像是一本大数据学习的实践上机手册。书中首先展示了如何在单台 Windows 系统上通过 Virtual Box 虚拟机安装多台Linux虚拟机，而后建立 Hadoop 集群，再建立 Spark 开发环境。搭建这个上机实践的平台并不限制于单台实体计算机，主要是考虑个人读者上机实践的实际条件和环境。对于有条件的公司和学校，参照这个搭建过程，同样可以将实践平台搭建在多台实体计算机上。
在搭建好大数据上机实践的软硬件环境之后，就可以在各个章节的学习中结合本书提供的范例程序逐一设置、修改、调试和运行，从中学到大数据实践应用中核心技术的真谛——对大数据进行高效的“加工”，萃取大数据中蕴含的“智能和知识”，实现数据的“增值”，并最终将其应用于实际工作或者商业中。
大数据与云计算的关系密不可分，涉及众多关键技术，如分布式处理、分布式数据库和云存储、虚拟化技术等，本书并未在这些方面深入讲解，因为它们不是本书的重点，建议需要深入学习这方面内容的读者去寻找相关出版物，结合《Hadoop + Spark大数据巨量分析与机器学习整合开发实战》的实践来丰富和完善自己的大数据知识体系。

关于我们

新闻资讯

服务支持

关于我们

新闻资讯

服务支持

图书推荐