Spark大数据分析与实战(第2版)
"内涵真实项目,使读者掌握Spark在实际应用场景的使用 代码内容详细讲解,使读者更易理解 从理论到环境搭建再到操作,使读者更加全面的掌握Spark相关知识 教材、资源、服务三合一 "

作者:黑马程序员

丛书名:大数据技术与应用丛书

定价:58元

印次:2-2

ISBN:9787302683131

出版日期:2025.02.01

印刷日期:2025.06.19

图书责编:袁勤勇

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

"本书以Spark 3.x和Scala 2.x为主线,全面介绍了Spark及其生态体系中常用大数据项目的安装和使用。全书共10章,分别讲解了Scala语言基础、Spark基础、Spark RDD、Spark SQL、HBase、Kafka、Spark Streaming、Structured Streaming和Spark MLlib,并在最后完整开发了一个在线教育学生学习情况分析系统,帮助读者巩固前面所学的内容。 本书附有配套视频、教学PPT、教学设计、测试题等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。 本书可以作为高等院校数据科学与大数据技术及相关专业的教材,并适合大数据开发初学者、大数据分析与挖掘的从业者阅读。"

张明强,担任江苏传智播客教育科技股份有限公司教材研发中心教材编辑一职,负责编写大数据技术相关教材和制作教材的配套资源,有多年教育领域相关工作经验,曾编写《大数据项目实战》《Spark项目实战》《Hive数据仓库》《NoSQL数据库技术与应用》等大数据技术教材。

前言 党的二十大指出“实践没有止境,理论创新也没有止境”。随着互联网技术的快速发展,各种数字设备、传感器、物联网设备等在全球范围内产生了海量数据。这些数据以几何速度爆发性增长,给传统的数据处理方式带来了前所未有的挑战。如何满足大规模数据处理的需求,成了一个热门的研究课题,基于这种需求,人们需要新的技术来处理海量数据。 Spark提供了快速、通用、可扩展的大数据处理分析引擎,有效解决了海量数据的分析、处理问题,因此基于Spark的各种大数据技术得到了广泛应用和普及。自Spark项目问世以来,Spark生态系统不断壮大,越来越多的大数据技术基于Spark进行开发和应用,在国内外各企业中得到了广泛应用,对于要往大数据方向发展的读者而言,学习Spark是一个不错的选择。 本书在《Spark大数据分析与实战》基础上进行了改版,优化了原书内容,并进行了以下调整。 ●新增了Spark流式计算引擎Structured Streaming的讲解。 ●调整了项目实现和背景,使项目的内容更加丰富。 ●调整了部分需求的实现方式,增强了教学的实用性。 ●调整了知识讲解的结构,更符合循序渐进的学习规律。 ●添加素质教育的内容,将素质教育的内容与专业知识有机结合。 本书基于Spark 3.x和Scala 2.x,循序渐进地介绍了Spark的相关知识以及Spark生态体系一些常用的组件和开源大数据项目。本书共10章,具体内容如下。 ●第1章主要讲解什么是Scala以及Scala编程相关知识。 ●第2章主要介绍什么是Spark,以及部署Spark的方式,并通过Spark Shell...

目录
荐语
查看详情 查看详情
目录

第1章Scala语言基础1

1.1Scala概述1

1.1.1初识Scala1

1.1.2Scala的安装2

1.1.3在IntelliJ IDEA中安装Scala插件6

1.1.4Scala初体验8

1.2Scala的基础语法12

1.2.1变量12

1.2.2常量12

1.2.3数据类型13

1.2.4运算符15

1.2.5控制结构语句16

1.2.6方法和函数26

1.3Scala数据结构29

1.3.1数组29

1.3.2元组35

1.3.3集合36

1.4Scala面向对象43

1.4.1类和对象43

1.4.2单例对象46

1.4.3继承47

1.4.4特质49

1.5本章小结51

1.6课后习题51

第2章Spark基础53

2.1初识Spark53

2.1.1Spark概述53

2.1.2Spark的特点54

2.1.3Spark应用场景55

2.1.4Spark与MapReduce的区别55

2.2Spark基本架构及运行流程56

2.2.1基本概念56

2.2.2Spark基本架构57

2.2.3Spark运行流程58

2.3Spark的部署模式59

2.4部署Spark59

2.4.1基于Local模式部署Spark59

2.4.2基于Standalone模式部署Spark61

2.4.3基于High Availability模式部署Spark66

2.4.4基于Spark on YARN模式部署Spark70

2.5Spark初体验71

2.6Spark S... 查看详情

"加入综合项目案例,帮助读者了解Spark在实际应用场景中的使用。
详细解释代码内容,以便读者更容易理解。
知识点结构清晰,由浅入深地讲解Spark的原理、架构和应用。
整合教材、资源和服务,提供一体化的学习平台。
强调实战导向,注重应用型人才培养。
"

查看详情