图书目录

目录

第1章 大数据在各行各业 // 001

1.1 什么是大数据? // 002

1.1.1 非常流行的大数据概念 // 002

1.1.2 不那么流行的大数据概念 // 006

1.1.3 也许会带给你灵感的大数据概念 // 007

1.2 大数据在银行业 // 029

1.2.1 业界展望:大数据,银行业未来的核心动力 // 029

1.2.2 创新方向:大数据助力银行网点实现转型 // 036

1.3 大数据在征信业 // 041

1.3.1 业界展望:FICO 评分与芝麻信用,传统征信向大数据征信的转变 // 042

1.3.2 创新方向一:从拒绝推断看个人征信业的大有可为 // 046

1.3.3 创新方向二:论大中型客户数字化授信的可行性 // 054

1.4 大数据在审计业 // 057

1.4.1 业界展望:大数据分析如何支撑审计工作 // 057

1.4.2 创新方向:大数据能否代替传统审计? // 061

1.5 大数据在传统制造业 // 065

业界展望:数字化企业进阶指南 // 066

1.6 大数据在互联网行业 // 069

创新方向:从滴滴收购优步看垄断企业的马太效应 // 069

1.7 大数据在舆情行业 // 076

创新方向:数据分析帮你掌握话语权 // 077

1.8 大数据在汽车行业 // 086

业界展望:征服汽车后市场,大数据与你同行 // 086

1.9 大数据在影视业 // 089

创新方向:星期几上映的电影最具有票房号召力? // 090

1.10 大数据在环保产业 // 098

创新方向:北京治霾,能为你做点什么? // 098

1.11 大数据在体育产业 // 104

创新方向:欧洲杯,跟着西班牙队学数据挖掘! // 105

小结 // 109

第2章 大数据在商业领域的应用 // 111

2.1 推荐算法在传统销售渠道中的应用模式 // 112

2.2 巧用运筹优化,提升整合营销管理水平 // 116

2.3 关联规则的应用 // 121

2.3.1 小谈关联规则 // 121

2.3.2 购物篮分析:绝不只是“啤酒与尿布” // 124

2.3.3 创新方向:靠关联规则重获新生的东北小馆 // 128

2.4 智能荐食模型:大数据告诉你今天吃什么 // 133

智能荐食模型 // 134

2.5 顾客时空模型:其实天下没有免费的 WiFi // 138

2.5.1 无处不在的免费 WiFi // 138

2.5.2 顾客时空模型 // 139

2.5.3 进一步挖掘 // 141

2.6 社会网络分析法,助力信贷反欺诈 // 142

2.7 数据可视化利器:SAS Visual Analytics // 145

2.7.1 为什么需要数据可视化? // 145

2.7.2 数据可视化的几个常见例子 // 146

2.8 文本挖掘,帮你识别网购评论是真是假 // 151

2.9 路径优化:如何改良快递送货路线? // 156

第3章 数据前期准备 // 171

3.1 从抗日武装的发展谈到数据治理 // 172

3.1.1 数据质量问题 // 173

3.1.2 数据应用问题 // 174

3.1.3 实施策略和路径问题 // 176

3.2 如何生成你需要的基础数据? // 182

3.3 如何利用数据仓库优化数据分析? // 189

3.4 二分类变量的数据缺失插补 // 193

3.5 数据离散化,如何避免丢失信息? // 201

3.6 如何避免数据离散化影响自变量的重要性? // 204

3.7 二分类模型中如何应对分类自变量取值过多? // 206

第4章 技术案例 // 211

4.1 建模变量太多怎么办? // 212

4.2 信用评级模型怎么评估? // 215

4.3 观察窗口怎么选? // 219

4.4 K折交叉验证怎么做? // 223

4.5 如何衡量变量之间的相关性? // 230

4.6 决策树算法真的越复杂越好吗? // 235

4.7 如何精选分类模型指标? // 245

4.8 当数据分析遇上超级奶爸 // 250

4.9 深度挖掘,你的工资拖后腿了吗? // 253

4.10 用分位数回归看你的工资水平 // 258

附录A 一位数据工作者的成长之路 // 265

A.1 数据分析师入门攻略 // 266

A.2 如何做一名“称职”的数据专家? // 269

A.3 一个数据仓库转型者眼中的数据挖掘 // 271

A.4 预测科学:三点经验谈实际应用 // 276

A.5 数据模型多了,应该怎么管? // 277

A.6 手握数据挖掘模型,你一定要知道怎么用 // 281

A.7 浅谈以史为鉴与数据分析 // 286

后记 // 297