图书前言

前    言

为什么要写这本书

  大数据是现代社会高科技发展的产物。相对于传统数据库,大数据是海量数据的集合,它以采集、整理、清洗、存储、挖掘、共享、分析、应用、可视化等功能为核心,正广泛地应用于电商、金融、医疗、政务等各个领域。

  当前,发展大数据已经成为国家战略,大数据在引领经济社会发展中的新引擎作用更加明显。2014年,“大数据”首次出现在我国政府工作报告中,并提到要设立新兴产业创业创新平台,在大数据等方面赶超先进,引领未来产业发展。“大数据”一词逐渐在国内成为热议的词汇。2015年国务院正式印发《促进大数据发展行动纲要》,明确指出要不断地推动大数据发展和应用,在未来打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济新机制,建立以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。

本书主要内容

  本书以项目一体化的方式深入地讲解了大数据环境搭建、大数据采集、大数据清洗、大数据分析、大数据可视化的基本知识及实现的基本技术和方法,在内容设计上,既有详细的基础知识,又有大量的实践环节,理论与实践相结合,可极大地激发学生在课堂上的学习积极性与主动创造性,让学生在课堂上跟上老师的思维,从而学到更多有用的知识和技能。

  全书共有七个项目,主要内容包括大数据集群环境搭建、数据仓库构建、Java访问Hadoop实践、大数据采集实践、大数据清洗实践、大数据分析实践及大数据可视化实践。通过这七个项目开发案例可以使学生强化和巩固对应的知识。

本书主要特点

  (1) 采用“项目一体化”的教学方式,既有教师的讲述,又有学生独立思考、上机操作等内容。

  (2) 配套资源丰富。本书提供教学大纲、教学课件、电子教案、程序源码等多种教学资源,对重要的知识点和操作方法提供视频讲解,扫描书中对应的二维码可以在线观看、学习。

  (3) 紧跟时代潮流,注重技术变化。书中包含了最新的大数据采集、清洗、分析、可视化等新知识和新技术,并引入了一些主流大数据开源组件,以便学生掌握的知识点更贴近毕业后的就业岗位。

  (4) 编写本书的教师都具有多年的教学经验,将重点、难点突出,能够激发学生的学习热情。

读者对象

  本书既可以作为大数据专业、软件技术专业、计算机网络专业的教材,也可作为大数据爱好者的参考书。同时笔者作为全国职业院校大数据技能竞赛和全国大学生大数据技能竞赛的指导教师,在编写本教材时充分参阅了最近几届全国职业院校大数据技能竞赛项目和全国大学生大数据技能竞赛的竞赛大纲,将竞赛项目的主要考点融入了本书,使本书对参加大数据技能竞赛的学生也有很好的指导和借鉴作用。

  本书由黄天春、刘振栋主编。其中,黄天春编写了第1~3章,刘振栋编写了第4、5章,阳攀编写了第6、7章,宋建华、周希宸和曹勇对全书进行了审阅和校稿工作。

  本书是校企合作共同编写的结果,在编写过程中得到了科大讯飞股份有限公司高教人才事业群和大数据研究院的大力支持,对他们提供的试验案例和数据表示衷心的感谢。

  在编写过程中,我们参阅了大量的相关资料,在此表示感谢!

勘误和支持

  由于编者水平有限,书中难免会出现一些错误或者表述不准确、不严谨的地方,恳请读者批评、指正。

  

  编  者