数据科学导论
提供课件、代码、教学大纲,咨询QQ:2301891038(仅限教师)

作者:石川、王啸、胡琳梅

丛书名:面向新工科专业建设计算机系列教材

定价:69元

印次:1-7

ISBN:9787302569688

出版日期:2021.04.01

印刷日期:2025.01.06

图书责编:杨帆

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本教材介绍数据科学的通识入门知识,可以作为高等院校大数据专业的专业基础课程教材。本教材以“建立知识体系、掌握基本原理、学会初级实践、了解相关技术”为原则,为计算机专业类学生深入学习数据科学和大数据技术奠定基础。本教材将系统讲授数据科学的基本概念和知识体系、数据分析的基本流程和方法(包括数据预处理,回归、聚类、分类等智能分析技术)、大数据分析的基本工具,并以Python语言为例,通过大量实例和练习讲授初级的数据分析技术。

石川,男,1978年4月生于湖北洪湖。现就职于北京邮电大学计算机学院,教授、博导。长期专注于数据挖掘与机器学习研究,发表高水平论文50余篇。获北京市“师德先锋”称号和“青年英才”计划支持。

前言 近些年,各行各业聚集的“大数据”不仅对信息处理技术提出了挑战,而且深刻影响社会经济的各个方面。大数据时代的到来也催生一门新的学科——数据科学。数据科学是基于计算机科学、统计学、数学等学科的一门新兴的交叉学科,主要研究内容包括数据科学基础理论、数据预处理、数据计算和数据管理。作为一门新兴学科,很多学校开设了相关专业,也急需讲授其核心理论体系和应用实践的教材。本书顺应数据科学兴起的潮流,为数据科学与大数据及相关专业的学生,提供一本入门和导论性质的教材。 作者深入调研了现有的大数据教材和资料,结合十余年数据挖掘和机器学习等领域的科研实践以及“计算机导论”等计算机专业基础课程的教学实践经验,以“建立知识体系、掌握基本原理、学会初级实践、了解前沿技术”为原则,精心设计编写了本书。本书具有如下特色。 (1) 内容全面,重点突出。本书涵盖了数据科学的主要内容,包括基础理论、数学基础、分析方法、应用前沿和处理技术。同时,作者也从数据挖掘的视角着重强调了数据分析的基本方法和技能。 (2) 理论系统,实践丰富。本书比较系统地介绍了与数据科学紧密相关的基本理论和方法,并且配以丰富的实例进行讲解。作者以Python语言为例,配以大量实例详细讲解了数据分析的基本方法。 (3) 模块设计,灵活组合。本书划分为3个模块: 基础理论(第1~2章)、分析方法(第3~6章)、高级主题(第7~8章),3个模块相对独立,模块内部也是由浅入深。选择合适章节内容和讲授深度,可以支撑2~6学分的“数据科学导论”课程设置。 (4) 深入浅出,可读性强。本书尽量介绍数据科学最相关的内容和最基本的概念,...

目录
荐语
查看详情 查看详情
目录

第1章数据科学概论1

1.1数据和大数据1

1.1.1数据1

1.1.2数据化进程3

1.1.3大数据5

1.2数据科学理论基础8

1.2.1数据科学发展历程8

1.2.2数据科学的概念9

1.2.3数据科学的主要内容9

1.3数据科学应用实践13

1.3.1数据科学家13

1.3.2数据科学工作流程14

1.3.3数据科学实践案例15

1.4小结19

1.4.1本章总结19

1.4.2扩展阅读材料20

1.5习题20

1.6参考资料21

第2章数学基础23

2.1线性代数23

2.1.1向量23

2.1.2矩阵24

2.1.3矩阵导数29

2.1.4实例: 利用SVD进行评分预测31

2.2概率统计32

2.2.1随机事件与概率33

2.2.2条件概率与事件独立性342.2.3随机变量及其数字特征36

2.2.4数理统计41

2.2.5信息论42

2.2.6实例: 利用朴素贝叶斯算法进行文本分类43

2.3优化理论44

2.3.1基本概念45

2.3.2优化问题的一般形式48

2.3.3优化方法54

2.3.4实例: SVM分类器57

2.4图论基础58

2.4.1图的定义58

2.4.2图的概念59

2.4.3图的矩阵表示62

2.4.4拉普拉斯矩阵与谱64

2.4.5实例: 谱聚类算法65

2.5小结67

2.5.1本章总结67

2.5.2扩展阅读材料68

2.6习题68

2.7参考资料69

数据科学导论目录第3章Python语言初步70

3.1Python语言概述7... 查看详情

查看详情