首页 > 图书中心 >图书详情

Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统

Hadoop 数据分析理论和生物、电信资源勘查等行业真实案例相结合,掌握Hadoop高级数据分析技术。

作者:[美] Kerry Koitzsch 著 王建峰 王瑛琦 于金峰 译
定价:59.80
印次:1-1
ISBN:9787302487302
出版日期:2018.01.01
印刷日期:2017.11.23

掌握Hadoop高级数据分析技术   学习高级分析技术,并利用现有工具包使分析应用更加强大、精确和高效!《Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统》将架构、设计及实现信息恰当地融为一体,将指导你创建超越基础方法(SF分类、聚类、推荐)的分析系统。   在《Hadoop 高级数据分析 使用Hadoop 生态系统设计和构建大数据系统》中,最佳实践强调“确保连贯、高效的开发”。将使用包含工具箱、库、可视化组件和报表代码在内的标准第三方组件,借助集成“组合件”开发一个可运行的、可扩展的、端到端的完整示例系统。 《Hadoop 高级数据分析 使用Hadoop 生态系统设计和构建大数据系统》强调以下四点: ● 具有分析组件及合理可视化结果的完整、灵活、可配置、高性能数据管道系统的重要性。深入探讨的主题包括Spark、H2O、Vopal Wabbit(NLP)、Stanford NLP、Apache Mahout,以及其他适用的工具包、库和插件。 ● 最佳实践和结构化设计原则。包括重要主题及示例部分。 ● 用混合搭配或混合系统实现应用目标的重要性。你在学习深度示例时可体会到混合方法的重要性。 ● 使用现有第三方库是有效开发的关键。在开发示例系统时,深度示例将展示一些第三方工具包的功能。

more >

前 言 Apache Hadoop软件库逐渐受到重视。它是许多公司、政府机构、科研设施进行高级分布式开发的基础。Hadoop生态系统现在包含几十个组件用于搜索引擎、数据库和数据仓库进行图像处理、深度学习及自然语言处理。随着Hadoop2的出现,不同的资源管理器可用于提供更高级别的复杂性和控制力。竞争对手、替代品以及Hadoop技术和架构的继承/变种比比皆是,包括Apache Flink、Apache Spark等。软件专家和评论员多次宣布“Hadoop的死亡”。 我们必须正视一个问题:Hadoop死了吗?这取决于Hadoop本身的感知界限。我们是否认为Apache Spark是Hadoop批处理文件方法的内存继承者,是Hadoop家族的一部分,仅仅因为Apache Spark也使用了Hadoop文件系统HDFS?存在很多“灰色区域”的其他例子,其中较新的技术取代或增强了原有的“Hadoop经典”功能。分布式计算是一个不断移动的目标,是Hadoop和Hadoop生态系统的分界线,在短短几年间已经发生了显著变化。在本书中,我们试图展示Hadoop及其相关生态系统的一些多样的、动态的方面,并试图说服你,尽管Hadoop发生变化,但它依然非常活跃、与当前的软件开发相关并且使数据分析程序员特别感兴趣。

more >
扫描二维码
下载APP了解更多

同系列产品more >

Python贝叶斯建模与计算

[阿根廷] 奥斯瓦尔多·A.
定 价:98元

查看详情
漫画算法与数据结构(大规模数据集)...

[波黑]黛拉·梅杰多维奇
定 价:79.80元

查看详情
不学编程做R统计分析:图形界面R C...

[加]约翰·福克斯(John
定 价:59.80元

查看详情
Python和PySpark数据分析

[加] 乔纳森·里乌 (Jon
定 价:118元

查看详情
Effective数据科学基础设施

[芬] 维莱·图洛斯(Vill
定 价:98元

查看详情
图书分类全部图书
more >
  • Kerry Koitzsch在计算机科学、图像处理和软件工程等领域拥有超过二十年的工作经验,致力于研究Apache Hadoop和Apache Spark技术。Kerry擅长软件咨询,精通一些定制的大数据应用,包括分布式搜索、图像分析、立体视觉和智能图像检索系统。Kerry目前就职于Kildane软件技术股份有限公司,该公司是加州桑尼维尔市的一个机器人系统和图像分析软件提供商。
  • 大数据类型多样、数量庞大、变化快速,这些特征对大数据分析师提出了新挑战。作为一种应对方案,大数据分析技术广泛应用于物联网、云计算等新兴领域,能够帮助企业用户在合理时间内处理海量数据,并为改善经营决策提供有效帮助。目前,存在多种大数据分析工具,相关技术正在不断走向成熟。Hadoop 作为一种优秀的开源框架,基于该架构的数据分析应用具有显著技术优势和应用前景,目前与Hadoop 大数据分析相关的出版物中,大多偏重于理论和技术介绍,有关具体应用实践方面的书籍相对偏少。
    为了满足应用需求,《Hadoop 高级数据分析  使用Hadoop 生态系统设计和构建大数据系统》以设计并实现用于获取、分析、可视化大数据集的软件系统为目标,以应用案例为背景,系统地介绍利用Hadoop 及其生态系统进行大数据分析的各种工具和方法;本书讲述Hadoop 大数据分析的基本原理,呈现构建分析系统时所使用的标准架构、算法和技术,对应用案例进行了深入浅出的剖析,为读者掌握大数据分析基础架构及实施方法提供了详明实用的方案。
    《Hadoop 高级数据分析  使用Hadoop 生态系统设计和构建大数据系统》在注重Hadoop 数据分析理论的同时,与大数据分析案例实践相结合,以生物、电信、资源勘查等行业真实案例为主线,详细讲解Hadoop 高级数据分析的过程。使读者可以自己动手实践,亲自体会开发的乐趣及大数据分析的强大魅力。通过本书的学习,读者能够更加快速且有效地掌握Hadoop 数据分析方法并积累实践经验。阅读《Hadoop 高级数据分析  使用Hadoop 生态系统设计和构建大数据系统》,可以帮助读者了解并掌握Hadoop 高级数据分析技术的具体操作方法,让读者真正理解其核心概念和基本原理。

more >
  • 目    录

    第Ⅰ部分 概念

     

    第1章 概述:用Hadoop构建数据分析系统     3

    1.1 构建DAS的必要性     4

    1.2 Hadoop Core及其简史     4

    1.3 Hadoop生态系统概述     5

    1.4 AI技术、认知计算、深度学习以及BDA     6

    1.5 自然语言处理与BDAS     6

    1.6 SQL与NoSQL查询处理     6

    1.7 必要的数学知识     7

    1.8 设计及构建BDAS的循环过程     7

    1.9 如何利用Hadoop生态系统实现BDA     10

    1.10 “图像大数据”(IABD)基本思想     10

    1.10.1 使用的编程语言     12

    1.10.2 Hadoop生态系统的多语言组件     12

    1.10.3 Hadoop生态系统架构     13

    1.11 有关软件组合件与框架的注意事项     13

    1.12 Apache Lucene、Solr及其他:开源搜索组件     14

    1.13 建立BDAS的架构     15

    1.14 你需要了解的事情     15

    1.15 数据可视化与报表     17

    1.15.1 使用Eclipse IDE作为开发环境     18

    1.15.2 本书未讲解的内容     19

    1.16 本章小结     21

    第2章 Scala及Python进阶     23

    2.1 动机:选择正确的语言定义应用     23

    2.2 Scala概览     24

    2.3 Python概览     ...

  • Hadoop 数据分析理论和生物、电信资源勘查等行业真实案例相结合,掌握Hadoop高级数据分析技术。

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘