首页 > 图书中心 >图书详情

大数据基础教程

配套课件、操作演示视频和源码,咨询QQ:2301891038(仅限教师)

作者:王成良 廖军
定价:59
印次:1-2
ISBN:9787302559665
出版日期:2020.11.01
印刷日期:2021.12.08

本书是理论与实践相结合的教材,以Centos 7、Eclipse等为实验开发工具,搭建了Hadoop、HBase、ZooKeeper、Spark等相应的实验集群,通过相关经典实验案例,使学生由浅入深、由点到面的逐步提高和巩固大数据基础理论知识和综合实践能力。

more >

前言 随着云时代的到来,大数据(Big Data)引起了人们越来越多的关注。大数据作为IT领域最热门的技术之一,正在不断渗透到人们的生活中,具有广阔的应用空间和发展前景,社会对大数据人才的需求也日益迫切。了解和学习大数据相关知识,不仅是对数据科学和大数据技术、计算机等相关专业学生的要求,也是学生未来职业发展的一种重要途径。 本书与实践相结合介绍大数据基础理论,以Centos 7、Eclipse等作为实验开发环境和工具,搭建了包括Hadoop、HBase、ZooKeeper、Spark等Hadoop生态圈的实验集群,通过典型的实验案例,学生可以由浅入深、由点到面地逐步学习、掌握大数据基础理论知识,并能结合具体实验熟悉大数据基础技术,培养综合实践能力。 本书内容充实、丰富,覆盖面广,共分为10章。第1章介绍大数据相关定义及概念,包括大数据的历史与发展、大数据的特点和应用场景以及大数据的挑战和机遇等;第2章介绍Apache架构与Apache Hadoop的基本概念、Hadoop的安全性、Hadoop的搭建及相关实验案例;第3章介绍Hadoop分布式文件系统(HDFS)的概念、原理、常用命令及简单的实验案例;第4章介绍YARN的基本架构,描述YARN的工作流程,详细分析YARN协议及优点;第5章介绍MapReduce的基本知识,详细描述Map框架流程、应用MapReduce所需的环境搭建及相关实验;第6章介绍Hive的相关定义、Hive安装配置过程及典型实验;第7章介绍HBase的基础、数据模型以及访问接口,详细讲解HBase伪分布式和完全分布式的安装与配置;第8章介绍ZooKeeper的发展背景及主要特点,详细说明ZooKeeper的体系结构与关键算法ZAB,同时还介绍ZooKeeper的四字命令及集群搭建操作,并讲解相应的实验案例;第9章介绍Spark的基本概念、组件以及Spark的特性,着重描述Spark的主要架构,并对Spark的计算模型、集群搭建、相关技术及实验进行详细讲解;第10章主要介绍Apache Kafka分布式消息系统相关的消息队列、中间件,详细描述Kafka的结构、Producer和Consumer的消息状态、Kafka的相应消息与日志、Kafka的特性及Kafka的消息发送与接收。本书在多数章章末提供了必要的基础实验,便于读者全面、深入地掌握大数据基础技术的知识点。 本书的编写得到了重庆大学大数据与软件学院领导的关心和支持,邓惠尹、王子梁、张钧洋、王丹、谭杨等参与了本书部分内容的编写工作,在此一并表示感谢。 由于作者水平有限,加之时间仓促,书中难免存在疏漏和不妥之处,恳请同行专家和读者给予批评和指正。对于本书中的实验操作视频,读者可扫描相应章节的二维码直接观看。 本书的配套课件、完整的案例源代码等资源可以从清华大学出版社网站www.tup.com.cn或微信公众号“书圈”下载,本书及课件等资源的使用中如有问题,请联系404905510@qq.com。 编者2020年8月

more >
扫描二维码
下载APP了解更多

同系列产品more >

信息技术前沿

张凯 张雯婷
定 价:49元

查看详情
Web前端设计基础入门——HTML5、CS...

谢从华、高蕴梅
定 价:59.90元

查看详情
人工智能概论与Python编程基础信息...

杨国燕、马晓明、陈宇环
定 价:59.90元

查看详情
计算机导论(第3版·题库·微课视频...

吕云翔 李沛伦
定 价:59.80元

查看详情
机器学习

肖汉光 夏清玲 主编 黄
定 价:59.80元

查看详情
图书分类全部图书
more >
  • 王成良,男,已从事教学和科研工作近30年。一直在重庆大学计算机学院和软件学院从事多媒体技术、计算机网络、数据库技术等课程的教学工作。
    曾经编写过的教材(教材名称、出版时间、字数、出版社、获奖情况等)
    1) 多媒体技术与网页设计, 2006.8,完成10万字,清华大学出版社
    2) Web开发技术及其应用,2007.10,完成65万字,清华大学出版社
    3)  JAVA EE 5开发基础与实践, 2008.11, 完成15万字,清华大学出版社
    4) 数据库技术及应用,2011,清华大学出版社
    5)Web开发技术(第2版),2013,清华大学出版社
  • 本书以Centos 7、Eclipse等为实验开发工具,搭建了Hadoop、HBase、ZooKeeper、Spark等相应的实验集群,通过相关经典实验案例,使学生能较快掌握大数据基础理论知识和综合实践能力。本书配套实验演示视频,增强学习效果。
more >
  • 目录

    第1章大数据概述

    1.1大数据发展背景

    1.1.1引言

    1.1.2发展历程

    1.2大数据相关概念及特点

    1.2.1大数据特点

    1.2.2相关概念介绍

    1.3大数据应用过程

    1.3.1数据采集

    1.3.2预处理

    1.3.3数据存储管理

    1.3.4数据挖掘分析

    1.4大数据技术

    1.4.1大数据集群

    1.4.2大数据技术架构

    1.5大数据行业应用

    1.5.1互联网与电子商务行业

    1.5.2医疗健康行业

    1.5.3交通行业大数据应用

    1.5.4金融行业

    1.5.5政府机构

    1.5.6零售业

    1.5.7其他应用领域

    1.6大数据的挑战和机遇

    1.6.1大数据的挑战

    1.6.2大数据的机遇

    1.7本书内容结构介绍

    第2章Hadoop基础

    2.1概念介绍

    2.1.1架构

    2.1.2Apache Hadoop概述

    2.2Hadoop的安全性

    2.2.1安全问题

    2.2.2Simple机制

    2.2.3Kerberos机制

    2.2.4委托令牌

    2.3实验环境准备

    2.3.1虚拟机安装

    2.3.2CentOS 7 系统安装

    2.3.3其他软件安装

    2.4搭建Hadoop

    2.4.1CentOS 7系统配置

    2.4.2SSH免密码登录

    2.4.3配置JDK

    2.4.4解压Hadoop 

    ...

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘