





定价:59元
印次:1-1
ISBN:9787302542193
出版日期:2020.01.01
印刷日期:2019.12.11
图书责编:夏毓彦
图书分类:零售
这是一本大数据技术入门的简明教材。全书理论和实践相结合,以应用实战为主,深入浅出地讲解每个知识点,对每个应用实验按学习习惯,分步骤讲解,每个步骤都有文字说明和效果截图,使读者能清晰地知晓动手实操的效果和错误之处。 全书分为9章,全面介绍了大数据技术的相关基础知识、HDFS和数据库、采集传输工具、挖掘分析算法、Spark计算框架、可视化、大数据安全、大数据应用等内容,着重介绍了HDFS分布式文件系统、NoSQL等各种数据库、数据仓库Hive,以及数据采集分析技术,并配套了详细的实验教程以及练习题。 本书适合作为高等院校计算机、软件工程、大数据专业高职、本科生的教材,同时可供企业中从事大数据开发的工程师和科技工作者参考。
陈建平,资深讲师,技术总监,10年相关项目经历。长期从事大数据相关研究分析工作,曾担任IBM(上海)高级数据分析经理。
前 言 当前,大数据(Big Data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然现在企业可能并没有意识到数据爆炸性增长带来的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。 大数据在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量,大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。 大数据专业作为典型的“新工科”专业,在课程体系建设方面还处于摸索阶段,没有太多可供借鉴的现成经验,需要一大批热爱教学的高等学校教师积极投身课程体系和教材建设工作中,共同推动全国高等学校大数据教学工作不断向前发展。 关于本书 本书定位为大数据从入门到应用的简明系统教材,特色是理论和实践相结合,更多的是以应用实战为主,内容全面、深入浅出地讲解了每个知识点,通俗易懂。对每个实验基本是按照学习的习惯,分步骤式地讲述,每个步骤都有文字说明和效果截图,使得读者能很清晰地知晓自己在动手实操过程的效果和错误之处,一目了然。 本书使用Apache原生态的Hadoop环境,包括关系型数据库MySQL、分布式文件系统HDFS、非结构化数据库HBase、数据接入工具Kafka等组件。在撰写过程中,参考了大量网络的资料,百度、谷歌、知乎、CSDN等...
第1章 了解大数据 1
1.1 大数据处理的基础技术 1
1.1.1 大数据相关概念 1
1.1.2 大数据处理流程 2
1.1.3 大数据处理基础技术 3
1.2 主流大数据技术 6
1.2.1 主流大数据技术各阶段 6
1.2.2 Hadoop生态系统 6
1.2.3 Hadoop核心组件简介 7
1.3 大数据平台解决方案 8
1.3.1 Cloudera 8
1.3.2 Hortonworks 8
1.3.3 MapR 9
1.3.4 FusionInsight 9
1.3.5 Transwarp Data Hub 10
1.4 大数据发展现状和趋势 11
1.4.1 大数据市场规模 11
1.4.2 国内大数据发展面临的问题 11
1.4.3 大数据发展趋势 11
1.5 习题 12
第2章 大数据基础软件 14
2.1 Linux基础介绍 14
2.1.1 用户和用户组管理 14
2.1.2 文件和目录操作 19
2.1.3 文本编辑器 23
2.2 Java基础介绍 25
2.2.1 Java基础 25
2.2.2 编程开发 29
2.2.3 Java开发环境配置 29
2.3 SQL语言基础介绍 32
2.3.1 数据库基础 32
2.3.2 SQL简介 34
2.3.3 SQL语法 34
2.3.4 SQL基础语法 36
2.4 实验一:在Linux中安装和使用Java 38
2.4.1 本实验目标 38
... 查看详情