





作者:邓杰
定价:98元
印次:1-1
ISBN:9787302684800
出版日期:2025.04.01
印刷日期:2025.03.31
图书责编:赵军
图书分类:零售
"《Hadoop与Spark大数据全景解析:视频教学版》结合作者多年在大数据领域的开发实践经验,采用“理论+实战”的形式,以大量实例全面介绍Hadoop和Spark的基础知识及其高级应用。作者将丰富的教学经验,融入为读者精心录制的配套教学视频中,并提供了书中所有实例的源码,方便读者学习和实践。 《Hadoop与Spark大数据全景解析:视频教学版》分为4篇,共12章。第1篇(第1、2章)准备篇,主要介绍Hadoop和Spark的基本概念,以及如何快速搭建Hadoop和Spark的学习环境。第2篇(第3~6章)入门篇,涵盖Hadoop的高级特性、Spark的基础知识与高级特性,以及大数据安全。第3篇(第7~10章)进阶篇,深入讲解数据采集与清洗、数据存储与管理、数据分析与挖掘以及实时数据处理。第4篇(第11、12章)项目实战篇,通过Hadoop和Spark实现一站式数据分析系统设计,以及ChatGPT赋能Hadoop与Spark大数据分析的项目实战。 《Hadoop与Spark大数据全景解析:视频教学版》内容全面、结构清晰、案例丰富,既适合初学者自学,也适合开发者阅读,还可作为培训机构和高校相关课程的教学参考书。"
"邓 杰计算机科学与技术专业学士,目前就职于vivo移动互联网公司,负责平台方向及A1大模型应用方向的开发。对Hadoop、Spark、Hive、Flink、Kafka等大数据生态组件有着深入的研究。AI大模型技术的实践者和研究者,撰写过多篇高质量Al和Hadoop与Spark相关技术的文章,著有《深入理解Hive:从基础到高阶》《Kafka并不难学》和《Hadoop大数据挖掘从入门到进阶实战》等书籍。"
前 言 在当今数据驱动的时代,随着大数据分析和人工智能技术的快速发展,企业和研究人员面临着前所未有的机遇与挑战。Hadoop和Spark作为大数据生态系统中的核心工具,分别为数据存储、处理与计算提供了强大且灵活的基础。同时,AI大模型作为智能分析的前沿技术,展现出卓越的预测、分类和模式识别能力。将Hadoop和Spark的分布式处理优势与AI的智能分析能力相结合,能够为企业和研究机构带来高效的数据分析方法,开辟全新的应用场景。 目前,企业和研究机构对大规模数据处理和实时分析的需求与日俱增。Hadoop和Spark的协同使用,为用户提供了高效、可扩展的数据处理和计算解决方案;AI技术则为数据挖掘和模式发现带来了智能化的交互方式。通过三者的结合应用,用户不仅能够高效处理海量数据,还能挖掘更深层次的数据洞察,从而显著提升决策的精准度和业务价值。 本书旨在帮助读者提升Hadoop和Spark在大数据领域的实战应用,并探索结合AI技术进行智能分析的多样化应用场景。通过丰富的实战案例和详尽的技术指南,读者将能深入理解如何有效融合大数据处理与智能分析技术,为业务创新和研究提供更强大的技术支持。 本书特色 1. 专业的教学视频 为帮助读者更好地掌握本书内容,作者为每个实战案例录制了教学视频。通过这些视频,读者可以更加轻松地学习和理解Hadoop与Spark的核心技术。作者曾在极客学院制作了多期大数据专题视频,广受好评。 2. 来自一线的开发经验与实战案例 本书的大部分代码和实例均源于作者多年积累的一线开发实践和技术分享经验。作为一名活跃的技术博主,作者在博客园等平台上发表...
第1篇 准 备
第1章 了解Hadoop和Spark 2
1.1 什么是大数据处理 2
1.1.1 大数据概述 2
1.1.2 数据处理的挑战 4
1.2 为什么选择Hadoop和Spark 5
1.2.1 Hadoop的优势 5
1.2.2 Spark的优势 6
1.3 典型的大数据应用案例 8
1.3.1 行业应用案例 8
1.3.2 成功案例分析 10
1.4 Hadoop和Spark的设计理念 12
1.4.1 设计初衷 12
1.4.2 解读Hadoop和Spark的特性 13
1.5 本章小结 15
第2章 快速搭建Hadoop和Spark学习环境 16
2.1 Hadoop简介 16
2.1.1 起源与发展 16
2.1.2 核心组件介绍 17
2.2 基础环境的安装与配置 19
2.2.1 基础软件下载 19
2.2.2 实例:Linux操作系统的安装与配置 20
2.2.3 实例:SSH的安装与配置 22
2.2.4 实例:Java运行环境的安装与配置 24
2.2.5 实例:安装与配置Zookeeper 26
2.3 Hadoop和Spark环境搭建 30
2.3.1 实例:Hadoop环境搭建 31
2.3.2 实例:Spark环境搭建 46
2.4 Hadoop MapReduce基础 48
2.4.1 MapReduce编程模型之Map阶段 48
2.4.2 MapReduce编程模型之Reduce阶段 49 ... 查看详情