目 录
第1章.懂点统计学,能更明事理 / 002
1.1 引言 / 002
1.2 有助于正确地了解自己 / 004
1.3 误用统计学方法可能造成伤害 / 005
1.4 让你的行为合理地谨慎 / 008
1.5 揭开谜团,发掘真相 / 011
1.6 看清真相,防止被蒙 / 012
1.7 同样的数据,不同的结论 / 013
第2章.认识统计数据的各种特征 / 016
2.1 迷人的数据无处不在 / 017
2.1.1 数据是推动创新的一股力量 / 017
2.1.2 数据是发掘真相的一把钥匙 / 018
2.1.3 数据是探索未知奥秘的导航 / 018
2.2 多种多样的来源 / 019
2.3 初探数据的特征 / 020
2.3.1 数据分类 / 021
2.3.2 能表述性质的数据 / 022
2.3.3 有数量意义的数据 / 022
2.3.4 定量数据与定性数据的关系 / 024
2.4 数据的内容质量 / 025
2.4.1 数据是否真实 / 025
2.4.2 数据是否准确 / 026
2.4.3 与目标是否相关 / 027
2.5 数据的安全隐患 / 028
2.6 数据的使用与分析 / 030
第3章.弄清楚可能存在的样本问题 / 032
3.1 吸烟30年的他为何身体超级棒 / 032
3.1.1 吸烟又健康的王爷爷 / 032
3.1.2 一般性结果不排除有特例 / 034
3.1.3 全方位考察一下特例 / 035
3.1.4 需要怎样检验特例 / 037
3.2 你相信吃巧克力能减肥吗 / 038
3.2.1 感觉反常识吗 / 039
3.2.2 风靡全球的报道 / 040
3.2.3 使用化名的作者 / 040
3.2.4 研究过程是这样的 / 041
3.2.5 问题出在哪里 / 042
3.2.6 类似的形形色色的研究 / 043
3.2.7 警惕那些小样本研究 / 045
3.2.8 警惕只说结论的新奇观点 / 046
3.3 到底能不能“开灯睡觉” / 047
3.3.1 媒体说的好可怕 / 047
3.3.2 那个统计靠谱吗 / 048
3.3.3 追根溯源看一看 / 049
3.3.4 样本好像不对劲儿 / 050
3.3.5 原作者也承认样本有问题 / 051
3.3.6 证据无效,晚上睡觉踏实了 / 052
3.4 哪里安装钢板能降低飞机被击落的概率 / 052
3.4.1 哪些部位更脆弱 / 053
3.4.2 关于选取样本和推论的不同声音 / 055
3.4.3 有偏差的样本会导致错误的结论 / 056
3.5 样本越多越准确吗 / 057
3.5.1 用200多万的样本量,预测结果怎么失败了 / 057
3.5.2 便利性样本自然导致有偏差的结果 / 059
3.5.3 网络时代就能充分覆盖全部目标人群了吗 / 060
3.5.4 Z时代样本对象选多了吗 / 061
3.6 小结:看穿样本 / 064
第4章.看透用什么方法分析数据 / 066
4.1 京港澳少年儿童绘画大赛为什么通过投票评比 / 067
4.1.1 投票结果决定是否获胜 / 068
4.1.2 喜欢猫咪的人多还是喜欢狗狗的人多 / 069
4.2 新冠病毒的潜伏期究竟是14天还是24天 / 070
4.2.1 什么是中位数 / 072
4.2.2 如何使用中位数 / 073
4.3 为什么拖后腿的总是我 / 073
4.3.1 你的工资被入统了吗 / 074
4.3.2 使用了什么样的工资统计口径 / 076
4.3.3 谁说平均工资是大多数人的工资 / 077
4.3.4 谁拉高了普通人的平均工资 / 077
4.3.5 求职时别被平均薪酬忽悠了 / 079
4.3.6 再看到平均数先要扪心三问 / 080
4.4 平均年增长率怎么计算更合适 / 081
4.4.1 更符合实际的均值计算方法 / 083
4.4.2 买基金,看清收益率 / 083
4.5 想要的究竟是稳定还是刺激 / 084
4.5.1 如何才能找个更准点到达的公交车 / 084
4.5.2 哪位同学更可能逆袭考上重点高校 / 087
4.6 哪位学生候选人的支持率更高 / 088
4.6.1 美国的学校录取新生存在性别歧视吗 / 091
4.6.2 辛普森悖论现象是如何发生的 / 093
4.6.3 如何才能避免出现辛普森悖论 / 094
4.7 冰淇淋会导致犯罪?这纯属巧合 / 095
4.7.1 存在相关性,但违背常识 / 095
4.7.2 不卖冰淇淋就没有犯罪了吗 / 096
4.7.3 什么是相关性分析 / 097
4.7.4 小明外出与手机使用时间的关系 / 098
4.8 国内最安逸城市排名遭质疑 / 099
4.8.1 数据能够支持结论吗 / 100
4.8.2 数据之间的差距显著吗 / 101
4.9 生活中常遵循的钟形分布曲线 / 102
4.9.1 股市只有5%的人赚钱 / 103
4.9.2 身高的正态分布 / 105
4.9.3 选择吃什么晚餐 / 105
4.9.4 考试成绩分布 / 106
4.9.5 小结 / 107
4.10 英语学得好的人为什么法语和西班牙语也学得好 / 107
4.10.1 语言学习者的特征 / 108
4.10.2 制订个性化英语学习方案 / 109
4.10.3 学霸为什么门门功课得A / 110
4.10.4 足球踢得好,打篮球也不差 / 112
第5章.别忘了要进行数据检验 / 114
5.1 做奶茶先放奶还是先放茶 / 114
5.1.1 奶茶味道的测试检验 / 115
5.1.2 为什么要喝8杯奶茶 / 116
5.1.3 怎么知道不是瞎猜的 / 117
5.1.4 品茶能力的显著检验 / 119
5.2 男生比女生数学成绩更好吗 / 119
5.2.1 数学成绩引发的性别困惑 / 119
5.2.2 关于男女成绩的假设检验 / 120
5.2.3 p值不代表成绩差异的大小 / 121
5.2.4 假设检验是必不可少的 / 122
5.3 智能手表电池续航时间像宣传的那么长吗 / 123
5.4 打不打疫苗被感染的概率问题 / 124
5.4.1 打不打疫苗感染的概率一样 / 125
5.4.2 新疫苗产品的有效性检验 / 126
5.4.3 辉瑞疫苗的保护率解读 / 127
第6章.谨慎使用统计结果作决策 / 129
6.1 看着好看的统计结果 / 129
6.1.1 有技巧地描述数据 / 130
6.1.2 投资回报率同比增长200% / 132
6.1.3 价格上涨幅度大吗 / 132
6.1.4 图表显示变化很大 / 133
6.1.5 结语 / 137
6.2 被统计数据误导的决策 / 137
6.2.1 就诊时间怎么增加了 / 137
6.2.2 减少促销合适吗 / 139
6.3 统计口径谎言——两个第一 / 140
6.3.1 谁才是第一名 / 140
6.3.2 两个第一不奇怪 / 143
6.4 忽略基数规模差异的把戏 / 145
6.4.1 哪个品牌的电动车更加可靠 / 145
6.4.2 投诉率高的产品一定差吗 / 147
6.4.3 仅比较增长率是不客观的 / 149
第7章.基于大数据技术赋能的统计学 / 154
7.1 大数据的威力 / 154
7.1.1 大数据的新特征 / 155
7.1.2 大数据分析的高速度 / 156
7.1.3 大数据的统计新思路 / 157
7.2 大数据预测 / 158
7.2.1 谷歌流感趋势预测——大数据预测是可行的 / 159
7.2.2 数据量大不等于完整——也可能存在系统误差陷阱 / 160
7.2.3 利用相关数据预测应小心陷阱 / 162
7.3 大数据也会“垃圾进入/垃圾输出” / 164
7.3.1 不要过度依赖大数据 / 164
7.3.2 大数据清洗非常重要 / 165
7.4 不被数据算法控制而变“疯魔” / 168
7.4.1 那是算法陷阱惹的祸 / 168
7.4.2 信息茧房是怎么建成的 / 170
7.4.3 算法偏差和算法歧视 / 172
7.4.4 如何挣脱数据算法的控制 / 174
第8章.基于智能化应用场景的统计学 / 176
8.1 学哪个专业未来更有前途 / 176
8.2 探索两个学科的起源 / 178
8.3 人工智能的本质是精装版的统计学吗 / 179
8.4 数据是统计学和人工智能的共同基础 / 181
8.5 人工智能比统计学使用的数据更丰富 / 183
8.6 统计学与人工智能之间相距千万里 / 184
8.7 统计学与人工智能使用数据的方式不同 / 186
8.8 人工智能专业为什么要学好统计学 / 188
第9章.统计预测照亮未来之路 / 191
9.1 生活中时常发生预测 / 191
9.2 父母身材高,孩子以后会长多高 / 193
9.3 受教育程度不同,未来的收入差多少 / 195
9.3.1 多读一年书到底能带来多少收入 / 195
9.3.2 高学历必然得到高工资吗 / 198
9.3.3 历史可能会重演 / 201
9.4 哪年是毕业生最难的就业季 / 202
9.5 篮球得分预测需要不断地调整 / 205
9.6 人工智能技术使统计预测更准吗 / 206
9.6.1 将曾经的不可能变为可能 / 206
9.6.2 大数据助力现代预测 / 210
9.6.3 人工干预相对少 / 211
9.6.4 始终保持批判性 / 211