Hadoop权威指南(中文版)

作者:Tom White、曾大聃、周敖英译

定价:79元

印次:1-1

ISBN:9787302224242

出版日期:2010.05.01

印刷日期:2010.04.21

图书责编:文开琪

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题包括:Haddoop简介;MapReduce简介;Hadoop分布式文件系统;Hadoop的I/O、MapReduce应用程序开发;MapReduce的工作机制;MapReduce的类型和格式;MapReduce的特性;如何安装Hadoop集群,如何管理Hadoop;Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。 本书是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群。

前 言 马丁·加德纳(数学家和科学作家),曾经在一次采访中说道: “没有微积分,我的生命就失去了意义。这是我成功的秘诀。我花了如此长的时间了解我在写什么,所以我知道如何写作才能让大多数读者明白我的意思。” 在许多方面,这就是我对Hadoop的感觉。它的内部工作机制是复杂的、相互依赖的,因为它运行在分布式系统的理论、实用技术和技术常识这些复杂的基础之上。对于门外汉来说,Hadoop就像是异形一样难以理解。 但事实上并不是这样的。剥离其核心,Hadoop提供给组件分布式系统的工具——如数据存储、数据分析和协调——是十分简单的。如果有一个共同的主题,那么它将与提高抽象水平相关的——为程序员创建用于处理这些事情的基础架构,这些程序员中,或者正好有大量数据需要存储,或者有大量数据需要分析,或者有大量机器需要协调,或者没有时间、技能或兴趣成为分布式系统专家。 借由这样一个简单的、普遍适用的功能组合,在开始使用这个理当被广泛普及的Hadoop的时候,我的想法逐渐清晰起来。然而,在当时(2006年初),设置、配置和编写程序来使用Hadoop称得上是一门艺术。幸运的是,此后有了明显的进步,因为有更多的文件,更多的例子,一旦有疑问,还有那么多邮件地址可以发过去帮助你解惑。但对大多数新手来说,最大的障碍是理解这项技术能做什么,它的长处何在,如何使用它。这就是我写这...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
YH7  

                                                                                                

目    录

第1章  初识Hadoop 1

1.1  数据!数据 1

1.2  数据的存储和分析 3

1.3  相较于其他系统 4

1.3.1  关系型数据库管理系统 5

1.3.2  网格计算 6

1.3.3  志愿计算 8

1.4  Hadoop发展简史 9

1.5  Apache Hadoop项目 12

第2章  MapReduce简介 15

2.1  一个气象数据集 15

2.2  使用Unix Tools来分析数据 17

2.3  使用Hadoop进行数据分析 19

2.3.1  map和reduce 19

2.3.2  Java MapReduce 20

2.4  分布化 30

2.4.1  数据流 30

2.4.2  具体定义一个combiner 34

2.4.3  运行分布式MapReduce作业 35

2.5  Hadoop流 35

2.5.1  Ruby语言 36

2.5.2  Python 38

2.6  Hadoop管道 40

第3章  Hadoop分布式文件系统 44

3.1  HDFS的设计 44

3.2  HDFS的概念 45

3.2.1  块 45

3.2.2  名称节点与数据节点 47

3.3  命令行接口 48

3.4  Hadoop文件系统 50

3.5  Java接...