首页 > 图书中心 >图书详情

Hadoop大数据技术基础(Python版)微课视频版

提供课件、参考答案、源码,咨询QQ:2301891038(仅限教师)。300分钟实操视频+实训+课件,Python+Hadoop大数据实战项目详解。

作者:刘彬斌
定价:59
印次:1-1
ISBN:9787302601302
出版日期:2022.06.01
印刷日期:2022.05.30

《Hadoop大数据技术基础(Python版)微课视频版》从初学者角度出发,通过丰富的示例和实战项目,详细讲解大数据开发环境、关键技术及其应用。全书共分10章,第1~9章的内容分别为大数据概述、Linux系统的安装与使用、Python 3语言基础、Hadoop开发环境、HDFS技术、MapReduce技术、Hive数据仓库、HBase分布式数据库、Sqoop工具,第10章详细解析了实战项目“货运车分布分析平台”,帮助初学者快速入门。本书所有知识点都结合具体的编程示例,对于重要知识点提供视频讲解,还设计了多个实训,使读者通过实践环节加强对知识点的理解和掌握。 本书适合作为高等院校计算机应用、大数据技术及相关专业的教材,也适合作为大数据技术相关培训的教材和大数据技术初学者的自学资料。

more >

前言 1. 为什么要学习本书 随着5G、工业互联网、人工智能等前沿科技的发展,工业大数据将从探索起步阶段迈入纵深发展阶段,迎来快速发展的机遇期,全球工业大数据行业的竞争也将变得更为激烈。随着市场数据增长的加剧,国家对数据服务的要求也越来越多样化、专业化、快速化,大数据的存储和分析无疑对所有数据企业是一个挑战。 Apache Hadoop是用于大规模数据存储及处理的分析引擎,具有高可靠性、高效性、高扩展性、高容错性、低成本等特点,并且在Hadoop生态体系中,包含了分布式文件存储系统、分布式计算系统、分布式列存储数据库、分布式协作服务、数据仓库等多方面的解决方案,深受广大软件开发工程师的喜爱。对于想从事大数据行业的开发人员来说,学好Hadoop尤为重要。 Hadoop技术功能强大,涉及知识面较广,没有基础的读者很难深入Hadoop体系架构之中,因此本书采用理论和案例相结合的讲解方式,将知识点由浅入深、由易到难地进行解析,让初学者能够在逐渐深入的学习过程中掌握Hadoop的生态体系。 2. 本书内容 本书共分10章,各章内容简介如下。 第1章主要介绍大数据的产生与发展,以及大数据技术的生态工具。通过本章的学习,读者应了解为什么要学习大数据、大数据生态系统有哪些成员。 第2章主要介绍Linux系统的安装、基本命令操作、权限与目录管理、文件操作及网络配置。通过本章的学习,读者应掌握Linux系统的常用操作。 第3章主要介绍Python 3语言的基础语法。通过本章的学习,读者应掌握Python 3环境的安装与配置,熟悉Python 3的基础语法。 第4章主要介绍Hadoop生态圈常用工具和Hadoop大数据集群环境的搭建。通过本章的学习,读者应掌握Hadoop大数据集群环境的搭建及Hadoop大数据集群常见问题的处理。 第5章主要介绍HDFS的工作原理及HDFS的操作。通过本章的学习,读者应掌握HDFS的工作原理、HDFS命令与HDFS API的常用操作,并且能够使用API解决实际问题。 第6章主要介绍MapReduce的工作原理及API的操作。通过本章的学习,读者应掌握MapReduce的工作原理和API的常用操作,并且能够使用MRJob模型编程解决实际问题。 第7章主要介绍Hive数据仓库的工作原理、Hive环境的搭建和HiveQL的使用。通过本章的学习,读者应掌握Hive环境的安装与配置,熟悉HiveQL的基础语法,并且能够使用HiveQL解决实际问题。 第8章主要介绍HBase分布式数据库的数据模型以及操作方式。通过本章的学习,读者应掌握部署HBase集群的方法,了解HBase存储数据的架构原理,并且能够使用HBase分布式数据库解决实际问题。 第9章主要介绍Sqoop工具的环境搭建及Sqoop工具的使用。通过本章的学习,读者应掌握Sqoop工具的安装和操作,并且能够使用Sqoop工具实现ETL操作。 第10章主要介绍货运车分布分析平台的构建、开发和部署,该平台是基于HDFS的离线分析项目,使用Python语言对分析结果进行了可视化展示。通过本章的学习,读者应掌握如何基于Python语言开发Hadoop程序。 3. 作者与致谢 本书由刘彬斌著,参与本书的编写、资料整理、书稿校对、课件制作等工作的有周磊、廖云华、胡涵等。感谢清华大学出版社专业严谨的工作态度,为本书的顺利出版提供了宝贵的意见,并付出了辛勤的劳动。 4. 配套资源 读者在学习本书时,可以配合与本书配套的讲解视频、教学大纲、PPT课件、习题和实例源码等资源,快速提升编程水平和解决实际问题的能力。 读者扫描本书封底“文泉云盘”涂层下的二维码,绑定微信后,即可扫描书中的二维码观看对应视频来进行学习(配有视频的章节已在目录中标出)。 教学大纲、PPT课件、习题答案和实例源码等资源可以从清华大学出版社官方微信公众号“书圈”(见封底)下载。关于本书及资源使用中的问题,请联系404905510@qq.com。 编者2022年1月

more >
扫描二维码
下载APP了解更多

同系列产品more >

Java语言程序设计(第4版)

张思民、康恺
定 价:59.80元

查看详情
机器学习——原理、算法与Python实...

姚捃、刘华春、侯向宁
定 价:59.90元

查看详情
大数据分析:Python爬虫、数据清洗...

黄源,蒋文豪,龙颖
定 价:59.80元

查看详情
大数据采集与预处理技术(HDFS+HBa...

唐世伟 田枫 盖璇 李学贵
定 价:59.90元

查看详情
深度学习预训练语言模型(案例篇)

康明
定 价:69.90元

查看详情
图书分类全部图书
more >
  • 刘彬斌,成都邦飞科技有限公司副总经理,电子科技大学硕士,在读博士,成都市高新人才,四川省软件行业第五届理事会理事,成都市大数据产业联盟理事会理事,CSDN学院技术公开课优秀讲师。拥有10年以上软件研发经验。曾参与国家高技术研究发展计划(863计划)、242国家安全项目、自然科学基金等课题。2014年主持研发“自动构建部署系统”,荣获成都高新区第一批“高新人才计划”创业启动扶持项目。
  • 1. 《Hadoop大数据技术基础(Python版)微课视频版》从初学者角度出发,通过丰富的实操示例和实战项目解析,详细讲解大数据开发环境、关键技术及其应用。

    2. 本书基于Python环境编写,帮助读者在较短时间内同时掌握Python基本语法与大数据入门技术,对大数据技术入门者具有较高价值。

    3. 本书设计了丰富的实训内容,提供300分钟微课视频、PPT课件、教学大纲、实例源码、习题答案等资源,适合作为大专院校数据科学与大数据技术、大数据管理与应用及相关专业的教材,也适合作为大数据技术初学者自学用书。
more >
  • 目录

    第1章大数据概述

    1.1大数据的产生与发展

    1.2大数据的基础知识

    1.3大数据架构

    1.4本章小结

    1.5课后习题

    第2章Linux系统的安装与使用

    2.1系统安装

    2.1.1安装 CentOS 7.x

    2.1.2安装步骤

    2.2基本命令

    2.2.1cd命令

    2.2.2打包和解压命令

    2.2.3其他常用命令

    2.3权限与目录

    2.3.1权限

    2.3.2目录

    2.4文件操作

    2.4.1文件与目录管理

    2.4.2用户和用户组管理

    2.5网络配置

    2.6本章小结

    2.7课后习题

    第3章Python 3语言基础

    3.1Python 3简介

    3.1.1Python 的发展历史

    3.1.2Python的应用

    3.2环境搭建

    3.2.1Python 3环境的搭建

    3.2.2PyCharm

    3.3基础语法

    3.3.1语法规范

    3.3.2数据类型

    3.3.3Number数据类型

    3.3.4字符串

    3.3.5列表

    3.3.6元组

    3.3.7字典

    3.3.8集合

    3.3.9函数

    3.3.10模块

    3.3.11类和对象

    3.3.12封装

    3.3.13构造函数

    3.3.14继承

    3.3.15异常

    3.3.16操作MySQL

    3.4本章小结

    3.5课后习题

    3.6实训

    ...

精彩书评more >

标题

评论

版权所有(C)2022 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802013248号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘