Hive入门与大数据分析实战
" 详解解Hive部署、操作与调优,剖析网站流量分析、旅游酒店评价大数据分析实战项目 "

作者:迟殿委

丛书名:大数据技术丛书

定价:69元

印次:1-2

ISBN:9787302634218

出版日期:2023.06.01

印刷日期:2024.01.24

图书责编:夏毓彦

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

Hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转换、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive能将结构化的数据文件映射为一张数据库表,并能提供SQL查询分析功能,将SQL语句转换成MapReduce任务来执行,从而实现对数据进行分析的目的。本书配套示例源码、PPT课件、教学大纲。本书可作为Hive数据仓库初学者的入门书,也可作为Hive大数据分析与大数据应用开发工程师的指导手册,还可作为高等院校或者高职高专计算机技术、人工智能、大数据技术及相关专业的教材或教学参考书。 《Hive入门与大数据分析实战》共分11章,内容包括数据仓库与Hive、Hive部署与基本操作、Hive语法基础、Hive数据定义、Hive数据操作、Hive查询、Hive函数、Hive数据压缩、Hive调优、基于Hive的网站流量分析项目实战、旅游酒店评价大数据分析项目实战。最后的两个项目实战(均包括SQL和Java编程两种解决方法)帮助读者提高Hive大数据分析的综合实战能力。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学用书,也可以作为高等学校相关专业的本科生、研究生的教学用书。

"迟殿委,计算机软件与理论专业硕士,系统架构设计师。有多年企业软件研发经验和丰富的JavaEE、大数据技术培训经验,熟练掌握JavaEE与大数据全栈技术框架,擅长JavaEE系统架构设计、大数据分析与挖掘。著有图书《Hive入门与大数据分析实战》《Hadoop大数据分析技术》《Hadoop+Spark大数据分析实战》《Spring Boot企业级开发实战(视频教学版)》《深入浅出Java编程》《Spring Boot+Spring Cloud微服务开发》。"

前 言   如今各个行业都积累了海量的历史数据,并不断产生大量的新数据,数据计量已经发展到PB、EB、ZB、YB,甚至BB、NB、DB级别。由此催生了一门全新的技术—Hive离线计算。Hive是Hadoop生态体系的关键组件之一,它的出现使得海量数据可以继续使用传统的数据分析方法SQL语句来处理,降低了数据分析人员的学习成本。数据分析人员不需要学习新的脚本语言,可以继续使用熟悉的SQL结构化查询语句来分析大规模数据。但是,Hive的SQL语句不再运行在传统的数据库或者数据仓库中,而是运行在大数据分布式并行计算处理平台上。 本书内容   本书内容按照从易到难、理论与实战相结合的思路来组织。俗话说“工欲善其事,必先利其器”,本书在介绍数据仓库和Hive的基本概念之后,马上开始讲解从创建虚拟机、安装Linux操作系统到逐步完成Hive部署的详细过程;然后在部署完成的Hive环境基础上,学习Hive语法基础、Hive数据定义语言、Hive数据操纵语言、Hive数据基本查询等相关操作;接下来深入介绍Hive的其他功能,包括Hive函数、Hive数据压缩、Hive调优等;最后,本书通过网站流量分析项目实战、旅游酒店评价大数据分析项目实战这两个开发案例,帮助读者提升大数据分析的综合实战能力。这两个实战项目都给出了SQL实现和Java编程实现这两种解决方法,为读者做大数据开发起到抛砖引玉的作用。 本书目的   本书目的是带领读者系统掌握Hive大数据分析工具的使用与开发方法,并通过两个综合项目案例帮助读者提高Hive大数据分析的实战能力。 配套示例源码、PPT课件   本书...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目    录

第1章  数据仓库与Hive1

1.1  数据仓库概述1

1.1.1  数据仓库特征与重要概念1

1.1.2  数据仓库的数据存储方式2

1.2  Hive数据仓库简介5

1.3  Hive版本和MapReduce版本的WordCount比较6

1.4  Hive和Hadoop的关系7

1.5  Hive和关系数据库的异同8

1.6  Hive数据存储简介9

第2章  Hive部署与基本操作11

2.1  Linux环境的搭建11

2.1.1  VirtualBox虚拟机安装11

2.1.2  安装Linux操作系统13

2.1.3  SSH工具与使用19

2.1.4  Linux统一设置21

2.2  Hadoop伪分布式环境的搭建23

2.2.1  安装本地模式运行的Hadoop23

2.2.2  Hadoop伪分布式环境的准备25

2.2.3  Hadoop伪分布式的安装29

2.3  Hadoop完全分布式环境的搭建35

2.3.1  Hadoop完全分布式集群的搭建35

2.3.2  ZooKeeper高可靠集群的搭建40

2.3.3  Hadoop高可靠集群的搭建44

2.4  Hive的安装与配置53

2.4.1  Hive的安装与启动53

2.4.2  基本的SQL操作命令54

2.5  Hive的一些命令56

2.5.1  显示Hive的帮助56

2.5.2  显示Hive某个命令的帮助56

2.5.3  变量与属性56

2.5.4  指定SQL语句或文件57

2.5.5  显示... 查看详情

"《Hive入门与大数据分析实战》本系统讲解数据仓库和Hive的基本概念、Hive部署过程、Hive语法基础、Hive数据定义、Hive数据操纵、Hive数据查询、Hive函数、Hive数据压缩、Hive调优,并通过网站流量分析大数据、旅游酒店评价大数据分析两个综合项目,帮助读者提升大数据分析的实战能力。
配套全书示例源码、PPT课件、作者答疑服务。"

查看详情