目录
第1章大数据基础及应用概况
1.1基础知识
1.1.1大数据的定义
1.1.2大数据的特点
1.1.3大数据的结构
1.1.4相关技术
1.1.5现状与趋势
1.2大数据处理步骤
1.2.1数据获取
1.2.2数据存储
1.2.3 数据管理
1.2.4 数据分析
1.3 应用案例
1.3.1 商品推荐服务
1.3.2 公共信息服务
1.3.3 数据呈现服务
第2章 数据获取
2.1 公共开放数据资源
2.2 现有数据格式转换与清洗整理
2.3 网页数据采集
2.3.1 模板任务采集
2.3.2 自定义任务采集
第3章 数据分析入门
3.1 Weka简介与数据预处理
3.1.1 软件下载
3.1.2 文件与数据格式
3.1.3 Weka程序界面
3.1.4 数据预处理
3.2 数据分类
3.2.1 J48决策树分类器
3.2.2 LinearRegression分类器
3.2.3 M5P分类器
3.3 数据聚类
3.3.1 SimpleKMeans聚类器
3.3.2 EM聚类器
3.3.3 DBSCAN聚类器
3.4 数据关联
3.4.1 关联规则相关概念
3.4.2 Apriori算法介绍
3.4.3 Weka中Apriori关联规则挖掘
3.5 选择属性
3.5.1 属性选择概述
3.5.2 Weka中Select attributes标签页
3.5.3 选择属性模式介绍
3.5.4 Weka中选择属性操作示例
3.6 数据可视化
3.6.1 Visualize标签页
3.6.2 数值型类别属性可视化
第4章 数据分析进阶
4.1 贝叶斯网络
4.1.1 贝叶斯公式简介
4.1.2 贝叶斯网络简介
4.1.3 编辑贝叶斯网络结构
4.1.4 使用贝叶斯网络编辑器进行推理
4.2 神经网络
4.2.1 神经网络介绍
4.2.2 Weka神经网络选项设置
4.2.3 编辑神经网络
4.2.4 神经网络参数调整
4.3 时间序列分析及预测
第5章 Tableau数据可视化
5.1 Tableau概述与入门
5.1.1 概述
5.1.2 下载与安装
5.1.3 数据类型
5.1.4 Tableau Desktop软件界面
5.1.5 文件类型
5.2 初级可视化分析
5.2.1 条形图
5.2.2 直方图
5.2.3 饼图
5.2.4 折线图
5.2.5 压力图
5.2.6 树地图
5.2.7 气泡图
5.3 地图分析
5.3.1 认识地图
5.3.2 创建地图
5.4 高级数据操作
5.4.1 分层结构
5.4.2 组
5.4.3 集
5.4.4 参数
5.4.5 计算字段
5.5 分析图表整合
5.6 案例一:无锡市宜居时间分析
5.6.1 创建计算字段
5.6.2 空气质量
5.6.3 气温
5.6.4 宜居时间
5.6.5 制作仪表板
5.7 案例二:佛山市纳税企业增长情况分析
5.7.1 创建计算字段
5.7.2 预测
5.7.3 剖析-行业
5.7.4 剖析-区域
5.7.5 制作仪表板
5.7.6 分析
第6章 数据分析拓展
6.1 引言
6.1.1 研究背景及实验数据
6.1.2 研究方法
6.2 k-最近邻算法
6.2.1 k-最近邻算法的基本原理
6.2.2 Weka中k-最近邻算法应用实践
6.3 支持向量机算法
6.3.1 支持向量机算法基本原理
6.3.2 Weka中支持向量机算法应用实践
6.4 逻辑回归算法
6.4.1 逻辑回归算法基本原理
6.4.2 Weka中的逻辑回归算法应用实践
6.5 随机森林算法
6.5.1 随机森林算法基本原理
6.5.2 Weka中的随机森林算法应用实践
6.6 模型性能评估(一)
6.7 模型性能评估(二)
第7章 数据思维
7.1 数据分析基础
7.1.1 相关概念
7.1.2 数据分析可以帮用户做什么
7.1.3 如何做有效的数据分析
7.2 数据分析思维、过程和方法
7.2.1 数据分析思维
7.2.2 数据分析过程
7.2.3 数据分析方法
7.2.4 数据分析结果展示
参考文献
