Hadoop大数据技术原理与应用(第2版)
配套资源请扫描前言里二维码获取。"内涵真实项目,使读者掌握Hadoop在实际应用场景的使用 代码内容详细讲解,使读者更易理解 从理论到环境搭建再到操作,使读者更加全面的掌握Hadoop相关知识 教材、资源、服务三合一 "

作者:黑马程序员

丛书名:大数据技术与应用丛书

定价:59.8元

印次:2-8

ISBN:9787302633969

出版日期:2023.07.01

印刷日期:2025.06.24

图书责编:郭赛

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书以Hadoop 3.x为主线,全面介绍Hadoop及其生态体系中常用的大数据开源项目的安装和使用。全书共11章,分别讲解大数据概念、Hadoop基础知识、Hadoop集群部署、HDFS、MapReduce、YARN、ZooKeeper、Hive、Flume、Azkaban和Sqoop,并在最后开发一个完整的网站流量日志分析系统,帮助读者巩固前面所学的内容。 本书附有配套视频、教学课件、教学设计、测试题等资源;同时,为了帮助初学者更好地学习本书的内容,还提供在线答疑,欢迎读者关注。 本书可作为高等教育本科院校数据科学与大数据技术及相关专业的教材,并适合大数据开发初学者、大数据运维人员以及大数据分析与挖掘领域的从业者阅读。

张明强,担任江苏传智播客教育科技股份有限公司教材研发中心教材编辑一职,负责编写大数据技术相关教材和制作教材的配套资源,有多年教育领域相关工作经验,曾编写《大数据项目实战》《Spark项目实战》《Hive数据仓库》《NoSQL数据库技术与应用》等大数据技术教材。

前言 党的二十大报告提出“加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群”。随着云时代的来临,移动互联网、电子商务、物联网以及社交媒体快速发展,全球的数据正在呈几何速度爆发性地增长。为了健全网络综合治理体系,推动形成良好的网络生态,统筹网络信息体系的建设和运用,大数据吸引了越来越多的人关注。此时,数据已成为与物质资产和人力资本同样重要的基础生产要素,如何对这些海量的数据进行存储、分析和处理成为热门的研究课题。基于这种需求,众多分布式系统应运而生。 Hadoop提供了分布式存储系统和分布式计算框架,有效解决了海量数据的存储和分析处理问题,因此基于Hadoop的各种大数据技术得到了广泛应用和普及。自2006年问世以来,Hadoop作为大数据技术的核心和事实标准,在国内外各个企业中得到了广泛应用,对于要向大数据方向发展的读者而言,学习Hadoop是一个不错的选择。 本书基于Hadoop 3.x,循序渐进地介绍Hadoop的相关知识以及Hadoop生态体系中常用的开源大数据项目。本书共11章,其中,第1章主要带领读者了解大数据和Hadoop的基本理论知识;第2章主要演示如何在VMware Workstation安装操作系统为CentOS Stream 9的虚拟机,分别基于伪分布式模式和完全分布式模式部署Hadoop,并通过一个简单的案例介绍Hadoop的使用;第3~4章主要讲解Hadoop的3个核心组件HDFS、MapReduce和YARN的原理,并利用这3个核心组件实现分布式存储和分布式计算;第5~10章主要讲解Hadoop生态体...

目录
荐语
查看详情 查看详情
目录

第1章初识Hadoop1

1.1大数据概述1

1.1.1什么是大数据1

1.1.2大数据的数据类型2

1.1.3大数据的特征2

1.1.4研究大数据的意义3

1.2大数据的应用场景3

1.2.1医疗行业的应用3

1.2.2金融行业的应用4

1.2.3零售行业的应用4

1.3Hadoop概述5

1.3.1Hadoop的前世今生5

1.3.2Hadoop的优点6

1.3.3Hadoop的缺点6

1.3.4Hadoop的生态体系6

1.3.5Hadoop架构变迁8

1.4本章小结10

1.5课后习题10

第2章部署Hadoop11

2.1安装准备11

2.1.1创建虚拟机11

2.1.2克隆虚拟机21

2.1.3配置虚拟机23

2.1.4安装JDK31

2.2Hadoop集群部署模式33

2.3基于伪分布式模式部署

Hadoop34

2.4基于完全分布式模式部署

Hadoop40

2.5案例——词频统计47

2.6本章小结50

2.7课后习题51

第3章HDFS分布式文件系统52

3.1文件系统的分类52

3.2HDFS简介54

3.2.1HDFS架构54

3.2.2HDFS的特点56

3.3HDFS的文件读写流程57

3.4HDFS的健壮性59

3.5HDFS的Shell操作60

3.5.1HDFS Shell介绍60

3.5.2案例——通过Shell脚本定

时采集数据到HDFS …68

3.6HDFS的Java API操作72

3.6.1HDFS的Java API

介绍7... 查看详情

本书附有配套视频、教学PPT、教学设计、测试题等资源,同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。

查看详情