





定价:59.8元
印次:1-4
ISBN:9787302589594
出版日期:2021.09.01
印刷日期:2022.06.14
图书责编:袁勤勇
图书分类:教材
本书从理论知识入手,结合数据仓库的概念帮助读者更好地理解Hive,在掌握Hive相关理论知识的基础上,逐步深入地学习Hive。“工欲善其事,必先利其器”,首先从创建虚拟机并安装Linux操作系统开始逐步完成Hive的部署,然后在部署完成的Hive环境基础上,学习Hive数据定义语言、Hive数据操作语言和Hive数据查询语言的相关操作,在学习了上述三种语言之后,接下来深入学习Hive的其他功能,包括Hive内置函数、Hive自定义函数、Hive的新特性事务以及Hive的相关优化,从而帮助读者掌握Hive的强大功能和特性。最后,本书通过一个综合项目——教育大数据分析平台,使读者对Hive数据仓库在实际应用中涉及的相关知识内容具有更深入的理解,在此项目中不仅会涉及使用Hive实现数据仓库分层、数据转换和数据分析的相关操作,而且还涉及使用Sqoop将数据仓库中的数据进行导出和导入,以及使用FineBI工具实现数据可视化功能。 本书附有配套视频、源代码、习题、教学设计、教学课件等资源。同时,为了帮助初学者更好地学习本书的内容,还提供了在线答疑,欢迎读者关注。 本书可以作为高等学校本、专科计算机相关专业,信息管理等相关专业的大数据课程教材,也可以供相关技术人员参考,是一本适合广大计算机编程爱好者的优秀读物。
江苏传智播客教育科技股份有限公司(简称“传智教育”)是一家致力于培养高素质软件开发人才的科技公司,“黑马程序员”是传智教育旗下高端IT教育品牌。高美云是本书创作团队核心成员,编写过多本教材,均畅销多年,深受读者喜爱。
前言 大数据是信息化发展的新阶段,随着全球数据存储量的不断提高,大数据正进入发展加速时期。近年来,随着5G、AI、云计算、区块链等新一代信息技术的蓬勃发展,大数据技术走向融合发展的关键阶段。同时,我国大数据产业保持良好发展势头,“大数据+行业”渗透融合全面展开,融合生态加速构建,新技术、新业态、新模式不断涌现,政策支持、战略引领、标准规范、产业创新的良性互动局面正在形成。 随着大数据时代的到来,各企业都积累了大量的数据,随着数据量的不断增长,企业不仅需要花费巨大的硬件成本来存储这些数据,而且还需要人员成本来维护这些数据。对于一个企业来说,如果只是单纯地存储和维护这些数据,那么这些数据将变得毫无价值,只是一种单纯的消耗品,于是企业开始利用这些持续不断增长的数据,从中挖掘出具有潜在商业价值的信息,帮助企业从数据中获取经验,从而为企业创造有效价值。对于这些积累下来的大量数据,通常称为离线数据。常见的离线计算框架有MapReduce和Spark,然而使用这些框架需要开发人员至少拥有Java语言的基础,对于那些熟悉使用SQL的传统数据分析人员来说并不能得心应手,于是一个全新的技术——Hive离线处理工具进入了大众的视野。 Hive提出海量数据可以继续沿用传统数据分析方法——SQL语句来处理的思想,开发人员不需要学习新的计算机语言而继续使用熟悉的SQL结构化查询语句来处理大规模的数据,Hive中的SQL语句称为HiveQL查询语句,HiveQL查询语句的语法结构与传统SQL语句的语法结构几乎一样。Hive运行在Hadoop分布式系统中,这使得Hive不仅可以使用HDFS进行分...
第1章Hive简介1
1.1认识数据仓库1
1.1.1数据仓库简介1
1.1.2数据仓库分层3
1.1.3数据仓库的数据模型5
1.2Hive概述6
1.3Hive架构7
1.4Hive工作原理8
1.5Hive数据类型9
1.6本章小结10
1.7课后习题11
第2章Hive部署12
2.1Linux环境的搭建12
2.1.1创建虚拟机12
2.1.2启动虚拟机并安装Linux操作
系统19
2.1.3克隆虚拟机26
2.1.4配置Linux系统网络及主机名30
2.1.5配置SSH服务34
2.2JDK的部署42
2.3Zookeeper的部署43
2.3.1Zookeeper集群的安装与配置43
2.3.2Zookeeper集群的启动与关闭46
2.4Hadoop的部署48
2.4.1Hadoop高可用集群的规划48
2.4.2安装Hadoop49
2.4.3配置Hadoop高可用集群51
2.4.4启动Hadoop高可用集群58
2.5Hive的部署622.5.1Hive部署之嵌入模式62
2.5.2Hive部署之本地模式64
2.5.3Hive部署之远程模式70
2.6本章小结74
2.7课后习题74
目录Hive数据仓库应用第3章Hive的数据定义语言76
3.1数据库的基本操作76
3.1.1创建数据库76
3.1.2查询数据库77
3.1.3查看数据库信息78
3.1.4切换数据库79
3.1.5修改数据库79
3.1.6删除数据库80
3.2数据表的基本操作81 ... 查看详情
本书将带领大家认识Hive的相关技术。通过学习本书,使读者对Hive有一个深刻的认识,本书共分为9章。
查看详情