统计是一个面向问题解决的、系统收集数据和基于数据做出回答的过程,
其本质是通过在随机现象中寻找分布规律 回答现实问题的科学过程.
实际问题的复杂性和人类认知的局限性,
造成反映实际问题的数据在问题表示的充分性、
代表性和分布的单一性等方面, 与传统的统计应用要求不相匹配, 于是
催生了对数据分布假定宽松的非参数统计的兴起与发展.
尤其是最近20年来, 随着信息技术和网络技术的快速发展,
基于大量数据计算探索数据分布特点的数据分析方法层出不穷,
成为非参数统计发展的新主题, 代表着统计学未来的方向.
非参数统计自然成为连接统计学、信息学和计算机科学等交叉研究的 桥梁,
共同推动数据分析和信息利用整体地向前发展.
本书是一本专门讲授非参数统计理论和方法的教科书.
内容主要分为两个部分:传统的非参数统计推断和现代非参数统计方法.
传统的非参数推断内容由单一样本、两样本及多样本非参数统计估计和假设检验、分类数据的关联分析方法、
定量数据的相关和回归等内容构成;现代非参数统计方法部分包含非参数密度估计、非参数回归和数据挖掘与机器学习技术等内容.
本书的主要特色是结合R软件讲解非参数统计方法的原理和应用,
我们的宗旨是塑造有独立专业思考能力, 对所学知识有比较地选择,
并能够使用恰当方法解决实际问题的统计专业人才. 据此,
我们在课程设计中, 专门设计了学生在接受
知识的过程中对知识的运用和鉴别能力的训练.
本书大部分例题都给出R源程序解法示例,
各种理论条件的检验、讨论、分析和比较, 鼓励学生针对数据的特点,
独立编写数据分析程序. 为加强与R的结合, 书中图形大部分由R生成,
我们广泛收集了很多领域 数据分析实例和应用编写成本书的例题和习题,
以扩展学生的应用领域, 提高学生解决实际问题的能力.
本书可作为统计、经济、管理、生物等宏、微观专业领域本科三、四年级以上学生以及相关研究人员学习非参数统计方法的教材,
也可以用作统计研究或从事数据分析的方法的参考书.
本书的先修课程只需具备初等统计学基础. 对统计基础略感陌生的读者,
可以阅读第2章相关内容作为补充.
本书的内容可以安排在一学期54课时内完成,
建议安排10课时左右用于学生上机实践. 本书备有丰富的习题,
兼有理论推导、方法应用和上机实践题目.
本书写作过程中, 得到众多老师的支持与鼓励.
感谢吴喜之先生多年来在非参数统计前沿和方法论上的引领和指导,
感谢袁卫、金勇进、易丹辉、张波、赵明德、谢邦昌和郁彬等教授在学科发展动态上的启迪与建议,
感谢赵彦云、高敏雪等教授的支持与鼓励,
感谢朱建旭同学参与了第10章的部分编写, 协助整理了部分文献、
图表和习题,
感谢孙兆楠、赵博元、詹瑾、李扬、王旭、王爱玲、伍燕然以及研究生讨论班的各位学生对部分内容
进行的相关讨论, 感谢责任编辑王海燕和赵从棉,
正是凭借着她们对本书出版计划的坚定而耐心的支持, 才有本书的问世.
感谢我的恩师、朋友、学生和家人与我相伴的岁月!