分布式数据库HBase案例教程
本书通过案例讲解分布式数据库HBase,内容系统全面、通俗易懂、注重操作

作者:陈建平 陈岸青 李金湖

丛书名:大数据技术丛书

定价:49元

印次:1-6

ISBN:9787302602149

出版日期:2022.04.01

印刷日期:2024.12.24

图书责编:夏毓彦

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书定位是HBase从入门到应用的简明教程,特色是以实战案例为主,内容系统全面,讲解深入浅出,操作步骤清晰明了。本书配套示例源码、PPT课件、开发环境、教学视频、习题及答案以及其他丰富的教学 资源。 本书共分为8章,内容包括NoSQL数据库、HBase体系架构、HBase的接口、MapReduce与HBase、HBase表设计、HBase和Hive、HBase深入剖析、论坛日志分析实战。 本书既适合HBase初学者、大数据分析与挖掘初学者阅读,也适合作为高等院校和培训机构人工智能、大数据等相关专业师生的教学参考书。

陈建平,福州德明科技有限公司,大数据专家讲师。2006年从事大数据相关的工作,2010年开始从事大数据培训工作。15人以上的大数据团队带队经验。曾承担过BI工程师、数据挖掘工程师、大数据架构师、数据科学家、大数据技术总监、合伙人等职位。曾参与和组织过个性化推荐大数据和图像处理的人工智能等20多个项目。曾在上海IBM公司担任过高级数据挖掘工程师。多次受邀参加学校大数据实验室专家和高校专业论证会。

前 言 大数据(Big Data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。现在的各个行业都依赖于大量数据的支撑,数据量也越来越庞大,关系型数据库海量数据读写性能差、灵活度欠缺等缺点也暴露出来。因此,大量NewSQL数据库在这个背景下诞生并被广泛应用,其中HBase就是这样的一个分布式、可扩展的数据存储系统。HBase于2006年年底由PowerSet的Chad Walters和Jim Kellerman发起,2008年成为Apache Hadoop的一个子项目,现在已作为成熟产品应用在淘宝、百度、天猫、菜鸟、阿里云、高德、优酷等多家知名互联网企业,满足业务对于大数据分布式存储的基本需求。它不同于关系型数据库着重于增、删、改,而转向着重于查询,使数据读取更加高效、安全。基于Hadoop生态,HBase使用HDFS分布式存储系统作为共享文件存储系统。 HBase技术来源于Fay Chang所撰写的论文Google BigTable,是BigTable的开源实现。HBase在Hadoop上提供了BigTable的功能,现已成为Apache开源项目的一个顶级项目。 在Hadoop生态圈中,HBase位于结构化存储层,HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,ZooKeeper为HBase提供了稳定的failover(故障转移)机制。此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变得非常简单,Sq...

暂无课件

暂无样章

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目    录

 

第1章  NoSQL数据库 1

1.1  分布式存储系统 1

1.1.1  分布式文件系统 1

1.1.2  GFS 2

1.1.3  BigTable介绍 3

1.2  NoSQL数据库 5

1.2.1  NoSQL概述 5

1.2.2  NoSQL相关的基本概念 7

1.2.3  NoSQL分类 9

1.2.4  为什么选择HBase 10

1.3  与其他数据库的区别 11

1.3.1  NoSQL数据库与SQL数据库的

区别 11

1.3.2  NoSQL数据库与NewSQL的

区别 12

1.4  习题 12

第2章  HBase体系架构 14

2.1  HBase的基本概念 14

2.1.1  HBase的基础概述 14

2.1.2  技术架构 14

2.1.3  系统架构 15

2.1.4  HBase读取过程 15

2.1.5  HBase与关系型数据库的区别 15

2.1.6  HBase与NewSQL的区别 16

2.1.7  HBase的应用场景 16

2.2  HBase的各个组件 17

2.2.1  HMaster 17

2.2.2  HBase Client 17

2.2.3  ZooKeeper 17

2.2.4  HRegionServer 17

2.2.5  存储单元Cell与数据写入流程 19

2.3  案例01:HBase安装部署与存储 20

2.3.1  案例背景 20

2.3.2  案例预备知识点 20

2.3.3  案例环境要求 20

2.3.... 查看详情

本书通过案例讲解分布式数据库HBase,体系结构清晰,内容系统全面、通俗易懂、注重操作。本书配套丰富的教学资源,适合大数据分析与开发的初学者以及对大数据感兴趣的技术人员,也适合作为高等院校大数据专业课的前导课程。 查看详情