图书推荐

《Hadoop + Spark大数据巨量分析与机器学习整合开发实战》的博客已开通,作者会在博客里为大家提供服务与交流。
博客网址:http://blog.sina.com.cn/hadoopsparkbook

《Hadoop + Spark大数据巨量分析与机器学习整合开发实战》书中的范例程序免费送给读者:
网址:

 https://pan.baidu.com/s/1rap5f7A 



我们建立了本书的Facebook粉丝团,欢迎读者们加入。粉丝团会不定期贴文,分享最新的Hadoop或Spark信息,你也可以提问并参与交流。
粉丝团网址:http://www.weibo.com/hadoopsparkbook


在《Hadoop + Spark大数据巨量分析与机器学习整合开发实战》中,不是对这些原理进行纯理论的阐述,而是提供了丰富的上机实践操作和范例程序,这样极大地降低了读者学习大数据技术的门槛,对于需要直接上机实践的学习者而言,本书更像是一本大数据学习的实践上机手册。书中首先展示了如何在单台 Windows 系统上通过 Virtual Box 虚拟机安装多台Linux虚拟机,而后建立 Hadoop 集群,再建立 Spark 开发环境。搭建这个上机实践的平台并不限制于单台实体计算机,主要是考虑个人读者上机实践的实际条件和环境。对于有条件的公司和学校,参照这个搭建过程,同样可以将实践平台搭建在多台实体计算机上。
在搭建好大数据上机实践的软硬件环境之后,就可以在各个章节的学习中结合本书提供的范例程序逐一设置、修改、调试和运行,从中学到大数据实践应用中核心技术的真谛——对大数据进行高效的“加工”,萃取大数据中蕴含的“智能和知识”,实现数据的“增值”,并最终将其应用于实际工作或者商业中。
大数据与云计算的关系密不可分,涉及众多关键技术,如分布式处理、分布式数据库和云存储、虚拟化技术等,本书并未在这些方面深入讲解,因为它们不是本书的重点,建议需要深入学习这方面内容的读者去寻找相关出版物,结合《Hadoop + Spark大数据巨量分析与机器学习整合开发实战》的实践来丰富和完善自己的大数据知识体系。