前言
我们写本书的初衷是要尽早地向数学背景较好的学生介绍贝叶斯统计。本书所涉及的范围与统计学入门课本相类似 ,只不过是从贝叶斯的观点来阐述。本书的重点是统计推断:我们想要说明如何用贝叶斯方法进行推断 ,贝叶斯方法为什么比频率论的方法好。本书旨在成为学习贝叶斯统计的启蒙教材。第 1章至第 14章包含这部分的内容。我们收到了许多读者的正面评价,相信本书的目标已经达到。
我们得到的反馈还表明 ,很多读者在开始学习本书时是处于中级水平而不是最初设想的入门水平,对这些读者来说第 2章和第 3章的内容有些过时,所以我们加入一些更高级的材料以迎合这个群体的需要。第 2版在达到初始目标之余需要更进一步 ,我们纳入了更多的模型 ,主要是单变量模型。我们还用近似法处理冗余参数 ,第 4章至第 16章包含这部分内容。
第 3版的变化
后来的反馈表明 ,具有较强数学和统计学背景的读者希望本书有更多关于多参数模型的细节 ,为此我们在第 3版新增了 4章,同时重写了已有的部分章节。第 17章包括均值与方差均未知的正态观测的贝叶斯推断 ,这一章扩展了第 11章的思路 ,还讨论了两个样本的情况 ,从而让读者考虑基于均值差的推断。为了在第 19章中讨论多元线性回归 ,我们在第 18章介绍了多元正态分布。最后 ,第 20章让读者超越本书大部分章节所考虑的共轭分析的范畴 ,进入计算贝叶斯推断的王国。第 20章对所涉及的话题只是点到为止,但还是为用户提供了处理不同问题的有价值的信息和技巧。我们选了一些新的习题以及使用 Minitab宏和 R函数的计算机练习 ,从本书的网址 http://introbayes.ac.nz可以下载 Minitab宏。经过改进的新版 R包 Bolstad已纳入新的 R函数 ,这个版本可以从 CRAN镜像下载或在 R中利用互联网直接安装。附录 C和附录 D分别是 Minitab包和 R包 Bolstad的使用与安装说明 ,为适应自第 2版以来 R和 Minitab的变化 ,我们重写了这两个附录。
我们对贝叶斯统计的看法
一本书的特色在于它在内容上的取舍 ,我们试图在本书中说明贝叶斯统计是一个好的统计推断方法。超出本书范围的细节在脚注中说明。我们选择主题的一些理由如下。
IV前言
在讨论贝叶斯统计时我们并没有提及决策论或损失函数。在很多书中 ,贝叶斯统计被划分到决策论中 ,同时以频率论的方式讲解推断。决策论本身是个有趣的话题 ,但我们要介绍的是贝叶斯统计推断而不想偏离正轨。
我们认为 ,为了充分利用贝叶斯统计 ,必须考虑到所有的先验都是主观的 ,它们要么是 (1)你的信念的总结 ,要么是 (2)你最初允许自己相信的一切的总结。我们认为主观先验是在看到数据之前赋予每个可能的参数值的相对权重 ,即使采用平坦先验让所有可能的值有相等的先验权重 ,因为它是由我们选择的 ,所以也是主观的。无论如何 ,它仅在该参数化中让所有的值具有相等的权重 ,所以只在这种情况下可以认为它是“客观的”。我们不希望本书详细讨论在贝叶斯统计中要力求客观的问题。因为不想分散读者的注意力,但会在脚注中解释为什么不可能有普遍的客观性 ,我们想让读者了解在参数化中先验的“相对权重”的思路。
叫1
第 1版没有明确提及杰佛瑞先验 ,尽管二项的贝塔先验 Be2 , 12)和正态均值的平坦先验分别就是这些观测分布的杰佛瑞先验。第 2版提及二项、泊松、正态均值和正态标准差的杰佛瑞先验。第 3版提及正态均值和标准差的独立杰佛瑞先验。我们尤其不想让读者在有关杰佛瑞先验的问题上纠缠 ,如均值和方差合在一起的杰佛瑞先验 ,因为它与独立杰佛瑞先验相反 ;或者杰佛瑞先验违反似然原理的问题 ,这些都超出了我们希望的知识水平。读者只需要知道在这些情况下杰佛瑞先验也可以作为先验 ,知道它赋予的相对权重应该在何时用以及如何用。所有的参数化在数学上都同等有效 ;不过通常只有主要的那一个才有意义 ,我们希望读者聚焦在作为先验的参数化的相对权重。它应该是 (1)先验信念的概括 (与矩或中位数的先验信念匹配的共轭先验), (2)参数化的平坦先验,或者 (3)在整个取值范围上具有合理权重的其他一些形式。对于在整个取值范围内能合理分配权重的所有先验而言,所得的后验会是相似的。
若均值为已知的参数 ,我们可以对正态分布的标准差进行贝叶斯推断。方差的共轭先验是逆卡方分布 ,虽然是将贝叶斯定理用在方差上 ,但对我们来说标准差更直观 ,因此需要引入先验密度的换元公式。
在第 2版中 ,我们假设均值为已知参数 ,因此没有考虑均值和标准差均未知这种在数学上更复杂的情况 ,第 3版的第 17章阐述了这种情况下的贝叶斯推断。在前两版中 ,当通过数据估计方差时 ,需要用学生 t分布来调整均值的可信区间 ,而在第 3版的第 17章中 ,我们证明它其实就是在得到后验并通过边缘化消去方差之后所得的结果。第 17章还包括对两个均值的差的推断 ,若不再假设两个总体的方差相同 ,问题会变得相当困难。对于方差不同的两个总体的均值差 ,第 17章推导出著名的 Behrens-Fisher问题的贝叶斯解。本书的 R包中的 bayes.t.test函数实际上为用户提供了利用 Gibbs采样的数值解。新版中的第 20章介绍了 Gibbs采样。
致谢
威廉感谢读者的批评指正 ,已对前两版中的印刷错误做了修改。威廉还要感谢 Minitab的 Cathy Akritas和 Gonzalo Ovalles帮助改进 Minitab宏。威廉和詹姆斯感谢
前言 V
Jon Gurstelle, Steve Quigley, Sari Friedman, Allison McGinniss以及 John Wiley & Sons团队的支持。最后,威廉要感谢妻子 Sylvie对他的永恒的爱与支持。
威廉·M.鲍尔斯塔德新西兰哈密尔顿
詹姆斯·M.柯伦新西兰奥克兰