





定价:69元
印次:1-7
ISBN:9787302569688
出版日期:2021.04.01
印刷日期:2025.01.06
图书责编:杨帆
图书分类:教材
本教材介绍数据科学的通识入门知识,可以作为高等院校大数据专业的专业基础课程教材。本教材以“建立知识体系、掌握基本原理、学会初级实践、了解相关技术”为原则,为计算机专业类学生深入学习数据科学和大数据技术奠定基础。本教材将系统讲授数据科学的基本概念和知识体系、数据分析的基本流程和方法(包括数据预处理,回归、聚类、分类等智能分析技术)、大数据分析的基本工具,并以Python语言为例,通过大量实例和练习讲授初级的数据分析技术。
石川,男,1978年4月生于湖北洪湖。现就职于北京邮电大学计算机学院,教授、博导。长期专注于数据挖掘与机器学习研究,发表高水平论文50余篇。获北京市“师德先锋”称号和“青年英才”计划支持。
前言 近些年,各行各业聚集的“大数据”不仅对信息处理技术提出了挑战,而且深刻影响社会经济的各个方面。大数据时代的到来也催生一门新的学科——数据科学。数据科学是基于计算机科学、统计学、数学等学科的一门新兴的交叉学科,主要研究内容包括数据科学基础理论、数据预处理、数据计算和数据管理。作为一门新兴学科,很多学校开设了相关专业,也急需讲授其核心理论体系和应用实践的教材。本书顺应数据科学兴起的潮流,为数据科学与大数据及相关专业的学生,提供一本入门和导论性质的教材。 作者深入调研了现有的大数据教材和资料,结合十余年数据挖掘和机器学习等领域的科研实践以及“计算机导论”等计算机专业基础课程的教学实践经验,以“建立知识体系、掌握基本原理、学会初级实践、了解前沿技术”为原则,精心设计编写了本书。本书具有如下特色。 (1) 内容全面,重点突出。本书涵盖了数据科学的主要内容,包括基础理论、数学基础、分析方法、应用前沿和处理技术。同时,作者也从数据挖掘的视角着重强调了数据分析的基本方法和技能。 (2) 理论系统,实践丰富。本书比较系统地介绍了与数据科学紧密相关的基本理论和方法,并且配以丰富的实例进行讲解。作者以Python语言为例,配以大量实例详细讲解了数据分析的基本方法。 (3) 模块设计,灵活组合。本书划分为3个模块: 基础理论(第1~2章)、分析方法(第3~6章)、高级主题(第7~8章),3个模块相对独立,模块内部也是由浅入深。选择合适章节内容和讲授深度,可以支撑2~6学分的“数据科学导论”课程设置。 (4) 深入浅出,可读性强。本书尽量介绍数据科学最相关的内容和最基本的概念,...
第1章数据科学概论1
1.1数据和大数据1
1.1.1数据1
1.1.2数据化进程3
1.1.3大数据5
1.2数据科学理论基础8
1.2.1数据科学发展历程8
1.2.2数据科学的概念9
1.2.3数据科学的主要内容9
1.3数据科学应用实践13
1.3.1数据科学家13
1.3.2数据科学工作流程14
1.3.3数据科学实践案例15
1.4小结19
1.4.1本章总结19
1.4.2扩展阅读材料20
1.5习题20
1.6参考资料21
第2章数学基础23
2.1线性代数23
2.1.1向量23
2.1.2矩阵24
2.1.3矩阵导数29
2.1.4实例: 利用SVD进行评分预测31
2.2概率统计32
2.2.1随机事件与概率33
2.2.2条件概率与事件独立性342.2.3随机变量及其数字特征36
2.2.4数理统计41
2.2.5信息论42
2.2.6实例: 利用朴素贝叶斯算法进行文本分类43
2.3优化理论44
2.3.1基本概念45
2.3.2优化问题的一般形式48
2.3.3优化方法54
2.3.4实例: SVM分类器57
2.4图论基础58
2.4.1图的定义58
2.4.2图的概念59
2.4.3图的矩阵表示62
2.4.4拉普拉斯矩阵与谱64
2.4.5实例: 谱聚类算法65
2.5小结67
2.5.1本章总结67
2.5.2扩展阅读材料68
2.6习题68
2.7参考资料69
数据科学导论目录第3章Python语言初步70
3.1Python语言概述7...