Hive提出海量数据可以继续沿用传统数据分析方法SQL语句来处理的思想,开发人员不需要学习新的计算机语言而继续使用熟悉的SQL结构化查询语句来处理大规模的数据,Hive中的SQL语句我们称之为HiveQL查询语句,HiveQL查询语句的语法结构与传统SQL语句的语法结构几乎是一模一样的。Hive运行在Hadoop分布式系统中,这使得Hive不仅可以使用HDFS进行分布式存储,而且还可以通过MapReduce分布式计算框架来查询数据,相比于传统数据仓库来说,Hive在存储性能和查询效率上都得到了很好的提升。
本书将带领大家认识Hive的相关技术。通过学习本书,使读者对Hive有一个深刻的认识,本书共分为9章。