目录
第1章健康大数据分析与挖掘概述
1.1健康大数据
1.1.1健康大数据的概念
1.1.2健康大数据的采集与管理
1.1.3健康大数据使用中的伦理问题
1.1.4相关问题的应对策略
1.1.5健康大数据的应用
1.2数据分析与挖掘
1.2.1数据分析与挖掘的基本流程
1.2.2健康大数据分析
1.2.3数据挖掘技术的应用
1.3本章小结
习题1
第2章大数据采集
2.1大数据采集概述
2.1.1大数据采集的概念
2.1.2大数据采集方法
2.1.3大数据采集平台
2.2大数据来源
2.2.1大数据的主要来源
2.2.2健康大数据来源
2.2.3心脑血管数据集来源及介绍
2.3网络爬虫技术
2.3.1网络爬虫概述
2.3.2常用网络爬虫技术
2.3.3网页数据的采集
2.3.4网页数据采集实例
2.4网络爬虫工具
2.4.1Googlebot爬虫
2.4.2八爪鱼采集器
2.4.3火车头采集器
2.4.4GooSeeker
2.5数据抽取技术
2.5.1数据抽取概述
2.5.2数据抽取工具
2.5.3网页数据抽取
2.6案例——公共健康大数据采集
2.7本章小结
习题2
第3章数据预处理
3.1数据预处理概述
3.2数据集成
3.2.1数据集成概述
3.2.2数据集成的主要方法
3.2.3数据集成的关键问题
3.2.4案例——心脑血管数据集成
3.3数据清洗
3.3.1缺失值的检测与处理
3.3.2重复值的检测与处理
3.3.3异常值的检测与处理
3.3.4案例——心脑血管数据值清洗
3.4数据转换
3.4.1数据标准化
3.4.2数据归一化
3.4.3数据编码
3.4.4案例——心脑血管数据转换
3.5数据脱敏与隐私保护
3.5.1数据脱敏与隐私保护概述
3.5.2数据脱敏原则
3.5.3数据脱敏方法
3.5.4案例——心脑血管数据脱敏
3.6数据变换
3.6.1数据变换概述
3.6.2线性空间变换
3.6.3域空间变换
3.6.4案例——心脑血管数据变换
3.7数据规约
3.7.1数据规约概述
3.7.2维度规约
3.7.3数量规约
3.7.4数据压缩
3.7.5案例——心脑血管数据规约
3.8本章小结
习题3
第4章数据分析
4.1数据分析概述
4.2描述性统计分析
4.2.1描述性统计分析概述
4.2.2描述性统计分析的常用方法
4.2.3案例——心脑血管数据描述性统计分析
4.3相关分析
4.3.1相关分析概述
4.3.2相关分析的常用方法
4.3.3案例——心脑血管数据相关分析
4.4因子分析
4.4.1因子分析概述
4.4.2因子分析的常用方法
4.4.3案例——心脑血管数据因子分析
4.5对比分析
4.5.1绝对数比较
4.5.2相对数比较
4.5.3案例——心脑血管数据对比分析
4.6本章小结
习题4
第5章数据挖掘
5.1数据挖掘概述
5.2回归分析
5.2.1回归分析概述
5.2.2常用的回归模型
5.2.3案例——心脑血管数据回归分析
5.3分类分析
5.3.1分类分析概述
5.3.2分类分析的常用算法
5.3.3案例——心脑血管数据分类分析
5.4聚类分析
5.4.1聚类分析的定义
5.4.2聚类分析的常用算法
5.4.3案例——心脑血管数据聚类分析
5.5关联规则挖掘
5.5.1关联规则挖掘概述
5.5.2关联规则挖掘的常用算法
5.5.3案例——心脑血管数据关联规则挖掘
5.6本章小结
习题5
第6章数据可视化
6.1数据可视化概述
6.1.1数据可视化的一般流程
6.1.2数据可视化的方法
6.1.3数据可视化常用的工具
6.2数据可视化常用图形
6.2.1柱状图
6.2.2折线柱状组合图
6.2.3特征热力图
6.2.4箱线图
6.2.5平行坐标图
6.3Python中数据可视化常用的库
6.3.1Matplotlib库
6.3.2Seaborn库
6.3.3Pandas Plotting
6.3.4Bokeh库
6.3.5Holoviews库
6.4案例——心脑血管数据的可视化分析
6.5本章小结
习题6
第7章综合案例——心脑血管风险数据的分析与预警
7.1案例概述
7.1.1案例介绍
7.1.2数据描述
7.2数据清理
7.2.1数据类型检查
7.2.2缺失值、重复值及异常值的检测
7.2.3缺失值、重复值及异常值的处理
7.3数据集成、转换与规约
7.3.1数据集成
7.3.2数据转换
7.3.3数据规约
7.4数据统计性分析
7.4.1心脑血管数据相互影响分析
7.4.2心脑血管数据分布分析
7.4.3心脑血管数据相关分析
7.5预测模型
7.5.1逻辑回归模型
7.5.2决策树模型
7.5.3梯度提升决策树模型
7.5.4XGBoost模型
7.6模型优化策略
7.6.1超参数调优
7.6.2特征工程
7.6.3模型融合
7.7本章小结
习题7
