数据科学导论
提供课件、代码、教学大纲,咨询QQ:2301891038(仅限教师)

作者:石川、王啸、胡琳梅

丛书名:面向新工科专业建设计算机系列教材

定价:69元

印次:1-7

ISBN:9787302569688

出版日期:2021.04.01

印刷日期:2025.01.06

图书责编:杨帆

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本教材介绍数据科学的通识入门知识,可以作为高等院校大数据专业的专业基础课程教材。本教材以“建立知识体系、掌握基本原理、学会初级实践、了解相关技术”为原则,为计算机专业类学生深入学习数据科学和大数据技术奠定基础。本教材将系统讲授数据科学的基本概念和知识体系、数据分析的基本流程和方法(包括数据预处理,回归、聚类、分类等智能分析技术)、大数据分析的基本工具,并以Python语言为例,通过大量实例和练习讲授初级的数据分析技术。

石川,男,1978年4月生于湖北洪湖。现就职于北京邮电大学计算机学院,教授、博导。长期专注于数据挖掘与机器学习研究,发表高水平论文50余篇。获北京市“师德先锋”称号和“青年英才”计划支持。

前言 近些年,各行各业聚集的“大数据”不仅对信息处理技术提出了挑战,而且深刻影响社会经济的各个方面。大数据时代的到来也催生一门新的学科——数据科学。数据科学是基于计算机科学、统计学、数学等学科的一门新兴的交叉学科,主要研究内容包括数据科学基础理论、数据预处理、数据计算和数据管理。作为一门新兴学科,很多学校开设了相关专业,也急需讲授其核心理论体系和应用实践的教材。本书顺应数据科学兴起的潮流,为数据科学与大数据及相关专业的学生,提供一本入门和导论性质的教材。 作者深入调研了现有的大数据教材和资料,结合十余年数据挖掘和机器学习等领域的科研实践以及“计算机导论”等计算机专业基础课程的教学实践经验,以“建立知识体系、掌握基本原理、学会初级实践、了解前沿技术”为原则,精心设计编写了本书。本书具有如下特色。 (1) 内容全面,重点突出。本书涵盖了数据科学的主要内容,包括基础理论、数学基础、分析方法、应用前沿和处理技术。同时,作者也从数据挖掘的视角着重强调了数据分析的基本方法和技能。 (2) 理论系统,实践丰富。本书比较系统地介绍了与数据科学紧密相关的基本理论和方法,并且配以丰富的实例进行讲解。作者以Python语言为例,配以大量实例详细讲解了数据分析的基本方法。 (3) 模块设计,灵活组合。本书划分为3个模块: 基础理论(第1~2章)、分析方法(第3~6章)、高级主题(第7~8章),3个模块相对独立,模块内部也是由浅入深。选择合适章节内容和讲授深度,可以支撑2~6学分的“数据科学导论”课程设置。 (4) 深入浅出,可读性强。本书尽量介绍数据科学最相关的内容和最基本的概念,...

课件下载

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目录

第1章数据科学概论1

1.1数据和大数据1

1.1.1数据1

1.1.2数据化进程3

1.1.3大数据5

1.2数据科学理论基础8

1.2.1数据科学发展历程8

1.2.2数据科学的概念9

1.2.3数据科学的主要内容9

1.3数据科学应用实践13

1.3.1数据科学家13

1.3.2数据科学工作流程14

1.3.3数据科学实践案例15

1.4小结19

1.4.1本章总结19

1.4.2扩展阅读材料20

1.5习题20

1.6参考资料21

第2章数学基础23

2.1线性代数23

2.1.1向量23

2.1.2矩阵24

2.1.3矩阵导数29

2.1.4实例: 利用SVD进行评分预测31

2.2概率统计32

2.2.1随机事件与概率33

2.2.2条件概率与事件独立性342.2.3随机变量及其数字特征36

2.2.4数理统计41

2.2.5信息论42

2.2.6实例: 利用朴素贝叶斯算法进行文本分类43

2.3优化理论44

2.3.1基本概念45

2.3.2优化问题的一般形式48

2.3.3优化方法54

2.3.4实例: SVM分类器57

2.4图论基础58

2.4.1图的定义58

2.4.2图的概念59

2.4.3图的矩阵表示62

2.4.4拉普拉斯矩阵与谱64

2.4.5实例: 谱聚类算法65

2.5小结67

2.5.1本章总结67

2.5.2扩展阅读材料68

2.6习题68

2.7参考资料69

数据科学导论目录第3章Python语言初步70

3.1Python语言概述7...