





定价:39元
印次:2-1
ISBN:9787302684947
出版日期:2025.03.01
印刷日期:2025.03.12
图书责编:袁勤勇
图书分类:教材
"本书以电商网站中的用户行为数据作为数据源,系统地介绍了如何使用 Spark生态系统进行大数据离线分析和实时分析的方法。全书共7章,分别讲解了项目需求、项目架构、项目实现流程、大数据集群环境搭建、热门品类Top10分析、各区域热门商品Top3分析、网站转化率统计、广告点击流实时统计和使用FineBI实现数据可视化。 本书附有配套视频、教学PPT、教学设计等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。 本书适合作为高等教育本科和专科的数据科学与大数据技术及相关专业的教材,也适合数据分析、数据可视化等领域的从业者阅读。 "
张明强,担任江苏传智播客教育科技股份有限公司教材研发中心教材编辑一职,负责编写大数据技术相关教材和制作教材的配套资源,有多年教育领域相关工作经验,曾编写《大数据项目实战》《Spark项目实战》《Hive数据仓库》《NoSQL数据库技术与应用》等大数据技术教材。
前言 党的二十大报告强调了“加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群”的重要性。随着云时代的来临,移动互联网、电子商务、物联网以及社交媒体快速发展,全球的数据正在以几何级速度呈爆发性增长,大数据吸引了越来越多人的关注,现在数据已经成为与物质资产和人力资本同样重要的基础生产要素。然而,数据的价值不仅与数据的数量有关,更与数据的质量和分析有关。为了从海量的数据中提取有价值的信息,我们需要有效地收集、存储、处理和分析数据,以支持商业决策和社会发展。 本书基于第1版进行改版, 优化原书内容,并进行以下调整。 将项目实现语言更换为Scala,更好地发挥Spark的优势; 调整了部分需求的实现方式,增强了教学的实用性; 调整了知识讲解的结构,更符合循序渐进的学习思路; 添加素质教育的内容,将素质教育的内容与专业知识有机结合。 本书以电商网站中的用户行为数据作为数据源,系统地介绍了如何使用 Spark生态系统进行大数据离线分析和实时分析的方法,适合具备一定数据分析和大数据知识的读者学习。全书共7章内容,具体如下。 第1章旨在带领读者初步了解项目,包括项目需求、架构、开发流程等; 第2章详细介绍大数据集群环境的搭建; 第3章讲解使用Spark Core进行热门品类Top10分析的方法; 第4章讲解使用Spark Core进行各区域热门商品Top3分析的方法; 第5章讲解使用Spark SQL进行网站转化率统计的方法; 第6章讲解使用Structured Streaming进行广告...
第1章项目概述1
1.1项目需求和目标1
1.2预备知识2
1.3项目架构2
1.4开发环境和工具3
1.5项目开发流程4
1.6硬件要求6
1.7本章小结6
第2章搭建大数据集群环境7
2.1基础环境搭建7
2.1.1创建虚拟机7
2.1.2安装Linux操作系统16
2.1.3克隆虚拟机22
2.1.4配置虚拟机25
2.2安装JDK39
2.3部署ZooKeeper集群41
2.4部署Hadoop集群46
2.5部署Spark52
2.6部署HBase集群55
2.7部署Kafka集群59
2.8本章小结61
第3章热门品类Top10分析62
3.1数据集分析62
3.2实现思路分析63
3.3实现热门品类Top10分析64
3.3.1环境准备64
3.3.2实现Spark程序72
3.3.3数据持久化76
3.4运行Spark程序80
3.5本章小结84
第4章各区域热门商品Top3分析85
4.1实现思路分析85
4.2实现各区域热门商品Top3分析86
4.2.1实现Spark程序86
4.2.2数据持久化89
4.3运行Spark程序90
4.4本章小结92
第5章网站转化率统计93
5.1数据集分析93
5.2实现思路分析94
5.3实现网站转化率统计95
5.3.1生成用户行为数据95
5.3.2实现Spark程序96
5.3.3数据持久化102
5.4运行Spark程序103
5.5本章小结104
第6章广告点击流实时统计105
6.1数据集分析105 ... 查看详情
本书附有配套视频、教学PPT、教学设计等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。
本书以项目驱动方式引导读者学习并动手操作以提升大数据技能;从零到一,逐步引导读者完成项目的开发;通俗易懂,让读者能够清楚地理解每个步骤的原理;融合了教材、资源、服务,方便教与学。
本书适用于高等教育本科和专科的数据科学与大数据技术及相关专业的教材,也适用于数据分析、数据可视化领域的从业者阅读。
"