


定价:69元
印次:1-9
ISBN:9787302514275
出版日期:2018.11.01
印刷日期:2022.12.26
图书责编:付弘宇
图书分类:教材
全书内容分为大数据系统基础、Hadoop技术、Spark技术和项目实战4部分。其中,Linux是学习大数据技术的基础,先从Linux入手,打下坚实的基础,之后才能更好地学习Hadoop和Spark。4部分内容分别介绍如下。 大数据系统基础篇通过大数据概述、Linux系统安装、Linux系统基础命令、Shell编程和MySQL数据操作,为以后编程奠定坚实的基础。 Hadoop技术篇以Hadoop生态圈为中心,详细介绍Hadoop高可用集群搭建、HDFS技术、MapReduce技术、Hive技术,为读者学习大数据开发技术提供便利,并以实用的方式简单介绍HBase、Sqoop、Flume工具的使用,使读者在精通一门技术的前提下,能扩展了解相关知识,真正成为一专多能的专业型人才。 Spark技术篇从Spark概述、Scala语言、环境搭建、RDD核心技术、Spark SQL和机器学习等多方面讲解Spark大数据的开发,从基础的Scala语言开始学习,并以Hadoop环境为基础搭建Spark大数据集群,从最基础、最常用、最容易理解的思路出发,帮助读者逐步掌握Spark大数据技术。 项目实战篇从真实项目“电力能源大数据分析”中抽取一部分业务作为实战解读,通过简洁的流程讲解,使读者了解大数据项目开发的整个过程。
随着信息技术的不断发展,以及物联网、社交网络、移动终端等新兴技术与服务的不断涌现和广泛应用,数据种类日益增多,数据的规模急剧增大,大数据时代已悄然来临。由于大数据对政府决策、商业规划和危险预防等方面所起的重大作用,大数据逐渐成为一种重要的国家战略性资源,受到政府、能源及信息领域的普遍关注。大数据的多样性(Variety)、规模性(Volume)和高速性(Velocity)等特点,使得传统的数据存储、管理、分析技术已经无法满足大数据的处理要求。 时至今日,无论你是来自互联网、通信行业,还是来自金融业、服务业或零售业,相信你都不会对大数据感到陌生。调查显示,32.5%的公司正在搭建大数据平台,29.5%的公司已经在生产环境实践大数据技术,并有成功的用例/产品;24.5%的公司已经做了足够的了解,开发准备就绪;基本不了解的只占调查对象的13.5%。根据某知名数据公司的调查数据,目前国内市场的IT人才缺口已经高达几十万,到2025年,这一数字还会增加至200万,“尤其是大数据技术方面的人才”。在智联、58同城等大型招聘网站最新发布的招聘职位中,大数据相关岗位占比已经超过50%,薪酬比软件工程师高10%以上。由此可见,大数据人才的培养是一份重大的责任和使命。 1.高校大数据人才培养的背景 (1)高校教育中,大数据人才培养存在起步晚、规模化不足的问题,而且高校学生从大学入学到研究生毕业需要相当长的一段时间。本书从实用的角度出发,为高校快速培养大数据人才提供可行性。 (2)如前文所述,大数据人才紧缺的现象在全球越来越突出。在此背景下,本书旨在弥补高校大数据教材...
第1篇 大数据系统基础
第1章 大数据概述 3
1.1 数据的产生与发展 3
1.2 大数据的基础知识 4
1.3 大数据架构 5
第2章 系统的安装与使用 7
2.1 系统安装 7
2.1.1 安装CentOS 6.x 7
2.1.2 安装步骤 7
2.2 基本命令 18
2.2.1 cd命令 18
2.2.2 打包和解压指令 19
2.2.3 其他常用命令 21
2.3 权限与目录 26
2.3.1 权限 26
2.3.2 目录 27
2.4 文件操作 28
2.4.1 文件与目录管理 28
2.4.2 用户和用户组管理 39
2.5 习题与思考 46
第3章 任务命令 47
3.1 脚本配置 47
3.1.1 Shell脚本 47
3.1.2 Shell变量 47
3.1.3 Shell传递参数 48
3.1.4 Shell数组 50
3.1.5 Shell运算符 51
3.1.6 Shell echo命令 55
3.1.7 Shell printf命令 57
3.1.8 Shell test命令 58
3.1.9 Shell流程控制 60
3.2 网络配置 67
3.3 习题与思考 70
第4章 数据库操作 71
4.1 数据库简介 71
4.1.1 MySQL数据库简介 71
4.1.2 安装MySQL 72
4.2 数据库基本操作 72
4.2.1 MySQL的DDL操... 查看详情
详细讲解真实的大数据项目“电力能源大数据分析”。
查看详情





