多元统计分析是统计学中内容十分丰富、应用范围极为广泛的一个分支。在自然科学和社会科学的许多学科中,研究者都有可能需要分析处理有多个变量的数据的问题。能否从表面上看起来杂乱无章的数据中发现和提炼出规律性的结论,不仅对所研究的专业领域要有很好的训练,而且要掌握必要的统计分析工具。对实际领域中的研究者和高等院校的研究生来说,要学习掌握多元统计分析的各种模型和方法,手头有一本好的、有长久价值的参考书是非常必要的。这样一本书应该满足以下条件:首先,它应该是“浅入深出”的,也就是说,既可供初学者入门,又能使有较深基础的人受益。其次,它应该是既侧重于应用,又兼顾必要的推理论证,使学习者既能学到“如何”做,而且在一定程度上了解“为什么”这样做。最后,它应该是内涵丰富、全面的,不仅要基本包括各种在实际中常用的多元统计分析方法,而且还要对现代统计学的最新思想和进展有所介绍、交代。
我们认为R.A.约翰逊(R.A.Johnson)和D.W.威切恩(D.W.Wichern)合著的《实用多元统计分析》(第四版)(Applied Multivariate Statistical Analysis,4th Ed)就是这样一本有长久价值的多元统计分析参考书。单从它已出到第四版就可以看出其经久不衰的价值。清华大学出版社决定将这本经典著作翻译成中文出版是很有眼光的,我们也很高兴有机会亲自参加翻译工作。本书的内容十分丰富,涵盖多元统计分析的各种有广泛应用的、经典和现代的模型和方法,分为四大部分:
第一部分:预备知识(1~4章),其中包括多元分析概述,矩阵代数与随机向量,样本几何与随机抽样,多元正态分布;
第二部分:关于多元均值与线性模型的推断(5~7章),其中包括关于均值向量的推断、多个多元均值向量的比较,多元线性回归模型;
第三部分:协方差结构分析(8~10章),其中包括主成分分析,因子分析与对协方差矩阵结构的推断,典型相关分析;
第四部分:分类和分组方法(11~12章),其中包括判别与分类,聚类、距离方法与多维标度变换。
除去满足以上所提到的几个条件外,本书的另一大特点是对分析计算的过程介绍得很详细。通常对一种分析方法的计算过程,先用一组简单的数据,将计算过程一步一步、不厌其烦地展开,使读者可以用手算的方法完成计算的全过程,从而对计算过程获得一定的感性认识。然后,对实际数据用计算机软件(SAS)进行分析,并给出对输入方法的说明和对输出结果的解读,使得读者能够掌握用统计软件分析数据的具体操作步骤,并能自己读懂输出的结果。此外,本书中有大量的来自实际问题的数据实例,通过对这些实例的分析,读者可以学到如何将一个实际问题转化为恰当的统计问题,进而选择恰当的方法来进行分析。
我们在翻译中的分工如下:1~4章赵衡秀译(陆璇校),5~6章叶俊译(赵衡秀校),8~10章葛余博和葛菱南译(叶俊校),第7章及11~12章陆璇译(葛余博校)。由于我们的水平和能力都有限,因此在译文中难免有这样或那样的错误或不妥之处。希望各位专家、读者在书中发现错误或不妥之处时,及时向我们或出版社指出,以便在以后有机会时予以改正。