Hadoop大数据开发技术
较为全面地介绍大数据开发技术平台Hadoop 及其生态系统的相关知识。提供课件、大纲、咨询QQ:2301891038(仅限教师)。

作者:申时全、陈强、杨胜利、黎学军、姜荣正、邱林润

丛书名:大数据系列丛书

定价:59.8元

印次:1-2

ISBN:9787302579700

出版日期:2021.07.01

印刷日期:2022.07.05

图书责编:郭赛

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书较为全面地介绍了大数据开发技术平台Hadoop及其生态系统的相关知识。全书共12章,包括Hadoop概述、大数据开发平台Hadoop环境的搭建、Hadoop通用命令与编程原理、Hadoop分布式文件存储HDFS、作业调度与集群资源管理框架YARN、Hadoop分布式计算框架MapReduce、Hadoop数据库HBase、Hadoop数据仓库Hive、Hadoop数据的快速通用计算引擎Spark,以及大数据应用开发综合实例。本书从应用角度出发,重点培养学生应用大数据技术平台Hadoop解决实际问题的能力。 本书内容新颖,简明易懂,可操作性强,可作为普通高等学校、高职高专院校数据科学与大数据、软件工程等计算机相关专业和信息管理类专业“大数据开发技术”课程的教材,也可作为大数据技术培训的教材,还适合大数据技术研发人员和广大计算机爱好者自学使用。

申时全,1953年6月生,贵州毕节人,本科学历,学士学位,教授, CNCIW认证软件开发高级工程师。广东科技学院计算机系网络工程专业负责人。讲授课程:计算机网络、Linux原理与应用、C语言程序设计、操作系统原理、统一建模语言UML、Linux编程、Java语言程序设计。

前言 随着大数据时代的到来,许多企业和组织都越来越重视大数据技术,尤其是我国已将大数据技术上升到国家战略层面,更多的企业都在大数据技术的平台建设、解决方案等领域花费了很多精力开展研究,并加大人才培养的力度。 广东轩辕网络科技股份有限公司近几年致力于云计算、大数据领域的服务研究,并在云计算、大数据等领域积极与高校开展产学研合作,进行协同育人工作,并取得了较好的成效。该公司在充分调研市场的基础上组织专家进行充分论证,提出了“数据科学与大数据技术”应用型本科人才培养方案,并将培养目标明确定位为: 掌握数据科学的基础知识、理论及技术,包括面向大数据应用的数学、统计、计算机等学科基础知识,数据建模、高效分析与处理,统计学推断的基本理论、基本方法和基本技能。重点培养具有以下三方面素质的人才: 一是工具的掌握,掌握数据采集和数据分析的基本工具的使用;二是数据分析能力,拥有实用数据分析和初步数据建模能力;三是应用性,主要是利用大数据的方法解决实际问题的能力。 在此基础上设计了专业课程体系,将“Hadoop大数据开发技术”定位为一门重要的专业选修课。本课程的目标是: 依据业务或产品应用需求,运用大数据平台及相关组件进行技术开发,搭建大数据应用平台以及开发应用程序。学习本书的内容后,读者应掌握Hadoop数据操作的API(主要是Java API),熟悉大数据的分析和使用方法(Spark和MapReduce技术),搭建大数据应用平台以及开发应用程序,熟悉工具、算法、编程、优化以及部署不同的MapReduce,研发各种基于大数据技术的应用程序及行业解决方案。 编者在研究了现有大数据...

课件下载

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目录

第1篇大数据开发技术平台Hadoop

第1章Hadoop概述3

1.1大数据与Hadoop3

1.1.1大数据概述4

1.1.2什么是Hadoop6

1.1.3大数据与Hadoop的关系6

1.2Hadoop的发展历史7

1.2.1Hadoop的产生7

1.2.2Hadoop的发展阶段7

1.3Hadoop的体系结构8

1.3.1Hadoop的Common8

1.3.2Hadoop的HDFS9

1.3.3Hadoop的YARN10

1.3.4Hadoop的MapReduce10

1.3.5Hadoop家族的其他成员11

1.4本章小结12

习题12第2章大数据开发平台Hadoop环境的搭建13

2.1Linux系统下的参数配置13

2.1.1Linux系统的网络配置13

2.1.2为Hadoop设置专门用户15

2.1.3设置无密码登录用户16

2.2基于Linux系统的JDK安装与配置17

2.2.1Java开发工具JDK的下载与安装17

2.2.2配置与Java有关的环境参数17

2.2.3基于Linux系统下Eclipse的安装与配置19

2.2.4Eclipse集成环境——Java程序开发实例23

2.3Hadoop环境的搭建24

2.3.1单机模式25

2.3.2伪集群模式26

2.3.3集群模式32

2.4Hadoop服务的启动与测试38

2.5本章小结38

习题38第3章Hadoop通用命令与应用编程原理39

3.1Hadoop命令概述39

3.2Hadoop管理命令41

3... 查看详情

本书分为三大部分,第一部分主要介绍大数据开发技术平台Hadoop,分为6章,介绍Hadoop各部分的主要技术及其应用,包括Hadoop架构及组成、平台搭建、HDFS、YARN、MapReduce等内容;第二部分介绍Hadoop 家族的其他几个重要项目,这些都与基本的大数据开发应用紧密相关,包括数据库HBase、数据仓库Hive、Spark;第三部分介绍大数据应用开发综合实例,介绍了编程环境与数据准备、大数据分析与数据可视化、一个具体大数据应用领域“电影推荐”的具体实施方法。 查看详情