大数据采集与预处理技术(HDFS+HBase+Hive+Python)(微课视频版)
提供视频、代码、数据集、课件、教案、试卷、试题及答案,咨询QQ:2301891038(仅限教师)一本书掌握数据科学、机器学习从业者都需要的数据预处理技术

作者:唐世伟 田枫 盖璇 李学贵

丛书名:大数据与人工智能技术丛书

定价:59.9元

印次:1-5

ISBN:9787302612247

出版日期:2022.09.01

印刷日期:2024.08.16

图书责编:温明洁

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书主要介绍大数据关键技术中的大数据采集和数据预处理技术,是大数据专业的入门级的专业基础课教程(含教学课件、源代码与视频教程),旨在为学生搭建起大数据的知识架构,讲述大数据采集和数据预处理的基本原理,开展相关的实验,为学生在大数据以及相关领域的学习奠定坚实的基础。全书共分四部分:第一部分是理论基础(第1~2章和第6章),主要介绍大数据技术、大数据采集和大数据预处理的基本概念以及基础理论;第二部分是大数据采集(第3~5章),分别介绍3种大数据的采集方法、技术及4种工具;第三部分是大数据预处理(第7~8章),介绍4种大数据预处理技术、方法;第四部分是实验指导(第9~11章),介绍大数据采集和大数据预处理的实验平台以及具体实验的内容、方法、流程等。 为便于读者高效学习,快速掌握大数据专业基础知识。作者精心制作了完整的教学课件(11章PPT)与部分配套视频教程(200分钟)。本书可以作为高等院校计算机、电子信息、信息管理、软件工程等专业,尤其大数据相关专业的本科和硕士研究生教材或参考书。

前言 据赛迪智库预测,中国近年来大数据核心人才缺口达230万人,全世界相关人才缺口超过1000万人。我国教育部门为了响应社会发展需要,于2016年开始正式开设“数据科学与大数据技术”本科专业及“大数据技术与应用”专科专业。近几年,全国形成了申报与建设大数据相关专业的热潮。目前全国各类高校、高职院校都已陆续开设了大数据相关的专业和课程。大数据作为交叉型学科,其相关专业强调培养具有多学科交叉能力的大数据人才。 大数据专业是顺应时代发展的产物。大数据作为新兴的、交叉的专业,在培养方案、系列教材等方面,各高校都在组织教师进行改进、研究。普遍认为,数据科学与大数据技术专业的毕业生,应掌握计算机理论和大数据处理技术,需要从大数据应用的三个主要层面(即数据管理、系统开发、海量数据分析与挖掘)系统地培养,能够应对大数据应用中的各种典型问题,具有将领域知识与计算机技术和大数据技术融合、创新的能力,可以从事大数据研究和开发应用等工作。 本书主要介绍大数据关键技术中的大数据采集和数据预处理技术,是大数据专业的入门级的专业基础课教程,旨在为学生搭建起大数据的知识架构,讲述大数据采集和数据预处理的基本原理,开展相关的实验,为学生在大数据以及相关领域的学习奠定坚实的基础。 本书以大数据关键技术为主线,重点介绍大数据采集技术和数据预处理技术。本书共四大部分,共11章。第一部分:大数据基础,含第1章概述、第2章大数据采集技术基础和第6章数据预处理基础;第二部分:大数据采集,含第3章系统日志数据采集、第4章基于数据库的数据迁移和第5章互联网数据采集;第三部分:数据预处理,含第7章数据清洗与集成和第8...

课件下载

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情

随书资源

目录

第1章概述

1.1大数据基础

1.1.1大数据的定义与特征

1.1.2我国的大数据发展及趋势

1.1.3大数据的应用

1.1.4大数据的层次架构

1.2大数据技术

1.2.1大数据关键技术

1.2.2大数据支撑技术

1.3大数据的影响及思维方式

1.3.1大数据的影响

1.3.2大数据的思维方式

1.4大数据伦理及安全

1.4.1大数据伦理

1.4.2大数据安全

1.5本章小结

习题

第2章大数据采集技术基础

2.1传统数据采集技术

2.1.1传统数据采集及特点

2.1.2传统数据采集的硬件与软件

2.1.3传统数据采集的关键技术

2.2大数据采集基础

2.2.1大数据采集的概念

2.2.2大数据采集的要点

2.2.3大数据的来源

2.2.4大数据采集的基本方法

2.3大数据分布式文件系统

2.3.1数据管理技术的发展

2.3.2HDFS概述

2.3.3HDFS特点

2.3.4HDFS工作原理

2.3.5HDFS的读/写数据流程

2.4分布式数据库系统HBase

2.4.1分布式关系数据库系统的缺陷

2.4.2HBase简介

2.4.3HBase的数据模型关键要素

2.4.4HBase的体系结构

2.5大数据分布式数据仓库

2.5.1数据仓库的特点

2.5.2Hive的内部架构

2.5...

汇集大数据采集与预处理的理论与常见用法,通过实例展示