


定价:59元
印次:1-1
ISBN:9787302647546
出版日期:2025.12.01
印刷日期:2025.12.26
图书责编:魏莹
图书分类:教材
"《大数据分析及应用》重点介绍了大数据的基础理论、算法理论和关键技术几方面的内容,主要包括:大数据基础、数据采集方法、数据预处理、主成分分析、预测分析、集成学习、预测模型评估、描述性分析、生存分析、社交网络分析、数据处理技术、数据分析技术、数据可视化技术、Hadoop生态系统和互联网电商数据的分析应用等。 《大数据分析及应用》适合计算机、人工智能、大数据等相关专业的本科生、研究生使用,同时也适合对大数据分析与应用感兴趣的相关人员,以及大数据分析与应用行业的工程技术人员阅读。 "
曹福凯,博士,教授、高级工程师,硕士生导师,研究方向大数据分析及应用、人工智能、智慧教育、智能医学及应用。现任华北理工大学冀唐学院信息中心主任及计算机教研室主任,华北理工大学信息创新实验室主任。
前 言 大数据发展势头强劲。政策上,国家出台《“十四五”数字经济发展规划》等文件,推动数据要素流通与产业创新,为行业提供制度保障。技术上,我国5G、数据中心等基础设施处于全球领先地位,生成式AI专利占比超60%,人工智能与大数据深度融合,有效提升了数据处理效率。应用上,大数据已广泛渗透至政务、金融、医疗、工业等领域,例如杭州“城市大脑”优化交通,三一重工提升设备管理效率。从机遇来看,大数据行业前景十分广阔,是数字经济的重要驱动力。 本书对大数据相关知识进行了系统的介绍,涵盖大数据基础、大数据存储与管理、大数据处理与分析、大数据应用等内容。通过大量案例深入浅出地介绍了数据平台建设与应用之路。以Why-What-How的思路展开,从0到1介绍知识点,并重点讲述How的过程,同时结合某个场景下的具体案例,以便读者能更好地理解实操过程。 本书共计15章,具体介绍如下。 第1章大数据基础,介绍大数据概述、特点和应用领域,并阐述大数据与云计算、物联网的相互关系。学习本章内容能够帮助读者构建大数据的学习体系。 第2章数据采集方法,介绍大数据处理的基础。通过学习本章内容,读者可以了解大数据和数据源的分类,以及每类数据源的采集方法。 第3章数据预处理,重点介绍了数据清洗技术。通过学习本章内容,读者将掌握如何对采集到的数据进行初步处理,使数据更加可靠,并方便进行后续分析。 第4章主成分分析,主要介绍广泛应用的主成分分析法。通过学习本章内容,读者将掌握分析数据之间的关系,使主成分分析成为读者处理数据的有力工具,同时为其他机器学习的前处理打下基础。 ...
第1章 大数据基础 1
1.1 大数据概述 1
1.1.1 什么是大数据 1
1.1.2 大数据生态圈简介 2
1.1.3 大数据应用场景 2
1.1.4 数据与数据科学 3
1.2 大数据的特点 4
1.2.1 数据量大 5
1.2.2 数据类型繁多 6
1.2.3 处理速度快 7
1.2.4 价值密度低 7
1.3 大数据计算模式 8
1.3.1 批处理计算 8
1.3.2 流计算 8
1.3.3 图计算 9
1.3.4 查询分析计算 9
1.4 大数据产业结构 9
1.5 大数据常见应用 10
1.6 大数据、云计算与物联网 11
1.6.1 云计算 11
1.6.2 物联网 14
1.6.3 大数据、云计算及物联网的
关系 18
1.7 本章小结 19
习题 19
第2章 数据采集方法 20
2.1 大数据采集概述 20
2.1.1 大数据分类 20
2.1.2 数据库采集 22
2.2 系统日志采集 22
2.2.1 Flume基本概念 22
2.2.2 Flume使用方法 23
2.2.3 Flume应用案例 24
2.2.4 日志采集的目的 25
2.2.5 日志采集过程 26
2.3 网络数据采集方法 27
2.3.1 网络爬虫工作原理 28
2.3.2 网络爬虫工作流程 29
2.3.3 网页搜索策略 29
2.3.4 网页分析算法 33
2.3.5 网络爬虫框架 34
2.4 本... 查看详情
"“大数据分析”是一门理论性和实践性都很强的课程。《大数据分析及应用》是为高等院校相关专业“大数据分析”课程全新设计编写,针对学生的发展需求,系统、全面地介绍了关于大数据分析的基本知识和技能,以项目/任务方式详细介绍了大数据基础、大数据分析基础、大数据技术与大数据分析的应用、大数据分析基本原则、构建大数据分析路线、大数据分析方法的运用、大数据分析的用例、预测分析方法、预测分析技术、数据清洗与处理、大数据分析模型、大数据分析的工具与平台等内容,具有较强的系统性、可读性和实用性。
"





