





定价:48元
印次:1-3
ISBN:9787302581475
出版日期:2021.07.01
印刷日期:2022.03.24
图书责编:袁勤勇
图书分类:教材
本书运用Spark计算框架的核心组件对电商数据进行分析,以项目形式呈现,其内容涵盖环境搭建、数据分析、数据持久化和数据可视化, 涉及JavaEE、ECharts、Hadoop、HBase、Spark、Kafka和ZooKeeper等技术点的综合应用。针对项目开发过程的每个环节都进行了深入讲解,使读者由浅入深地了解每个环节的知识内容。 本书共分为7章。第1章主要介绍项目开发的基本情况;第2章主要介绍大数据集群环境的搭建;第3章主要介绍通过Spark实现热门品类Top10分析,并对分析结果进行持久化操作;第4章主要介绍通过Spark实现各区域热门商品Top3分析,并对分析结果进行持久化操作;第5章主要介绍通过Spark SQL实现网站转化率统计,并对分析结果进行持久化操作;第6章主要介绍通过Spark Streaming实现广告点击流实时统计,并实时持久化统计结果;第7章主要介绍通过可视化技术将第3~6章的分析与统计结果进行图形化展示。 本书配有视频、源代码、教学设计、教学PPT、教学大纲等资源。同时,为了帮助初学者更好地学习书中的内容,还提供了在线答疑,欢迎读者关注。 本书适合拥有Spark基础的读者阅读,也可以作为高等院校相关课程的教学参考书。读者不仅能够通过项目实战巩固基础知识的学习效果,还能学习商业智能系统的开发过程。
江苏传智播客教育科技股份有限公司(简称传智播客)是一家致力于培养高素质软件开发人才的科技公司,“黑马程序员”是传智播客旗下高端IT教育品牌。
前言 大数据是信息化发展的新阶段,随着全球数据储量的不断提高,大数据正进入发展加速时期。近年来,随着5G、AI、云计算、区块链等新一代信息技术的蓬勃发展,大数据技术走向融合发展的关键阶段。同时,我国大数据产业保持良好发展势头,“大数据+行业”渗透融合全面展开,融合生态加速构建,新技术、新业态、新模式不断涌现,政策支持、战略引领、标准规范、产业创新的良性互动局面正在形成。 目前市面上已经有很多大数据技术相关书籍,然而大部分书籍是基于理论或基础操作讲解单个技术点,这些书籍虽然可以使初学者掌握单个技术点的基础技能,不过对于多技术点整合使用存在一定局限性,需要读者自己去摸索,并且针对技术点的实际应用方面,欠缺带领读者体验在多技术点融合的基础上实现真实项目的操作与讲解。 作为Spark实训项目的教程,最重要且最难的一件事情就是将一些复杂、难以理解的思想和问题简单化,让初学者能够轻松理解并快速掌握Spark项目的开发流程。本书对Spark项目开发过程的每个环节都进行了深入讲解,使读者由浅入深地了解每个环节的知识内容。 本书共分为7章,接下来分别对每章内容进行简单介绍,具体如下。 第1章主要介绍项目开发的基本情况,包括项目需求、项目目标、项目预备知识、项目架构设计、技术选取、开发环境、开发工具、开发流程以及硬件要求。通过本章的学习,读者能够明确项目需求,了解项目开发相关环境以及流程,后续将基于本章介绍的项目情况进行项目的开发。 第2章主要介绍大数据集群环境的搭建,包括Linux虚拟机的安装与配置、ZooKeeper、Hadoop、Spark、HBase和Kafka集群...
第1章项目概述1
1.1项目需求和目标1
1.2预备知识2
1.3项目架构设计及技术选取2
1.4开发环境和开发工具介绍3
1.5项目开发流程4
1.6硬件要求5
1.7本章小结6
第2章搭建大数据集群环境7
2.1安装准备7
2.1.1认识Linux操作系统 7
2.1.2创建虚拟机8
2.1.3启动虚拟机并安装Linux操作
系统14
2.1.4克隆虚拟机22
2.1.5配置Linux操作系统网络及主
机名25
2.1.6SSH配置29
2.1.7配置时间同步36
2.2安装JDK41
2.3ZooKeeper集群部署42
2.3.1ZooKeeper集群的安装与配置…42
2.3.2ZooKeeper集群的启动与关闭…44
2.4Hadoop集群部署46
2.4.1Hadoop高可用集群规划46
2.4.2安装Hadoop47
2.4.3Hadoop高可用集群配置48
2.4.4启动Hadoop高可用集群55
2.5Spark集群部署60
2.5.1Spark集群部署模式60
2.5.2Spark集群安装配置61
2.5.3Spark集群测试62
2.6HBase集群部署64
2.6.1HBase集群规划64
2.6.2HBase集群安装配置65
2.6.3启动HBase集群67
2.7Kafka集群部署69
2.7.1Kafka集群的安装与配置69
2.7.2启动Kafka集群70
2.8本章小结72
第3章热门品类Top10分析73
3.1数据集分析73
3.2实现思路... 查看详情
作为Spark实训项目的教程,最重要且最难的一件事情就是将一些复杂、难以理解的思想和问题简单化,让初学者能够轻松理解并快速掌握Spark项目的开发流程。本教材对Spark项目开发过程的每个环节都进行了深入讲解,使读者由浅入深的了解每个环节知识内容。
查看详情