前言
习近平总书记指出,“我们对高等教育的需要比以往任何时候都更加迫切,对科学知识和卓越人才的渴求比以往任何时候都更加强烈”。钟登华院士认为,“新工科是基于国家战略发展新需求、国际竞争新形势、立德树人新要求而提出的我国工程教育改革方向”。面对第四次工业革命,新工科应该积极应对变化,引领创新,探索不断变化背景下的工程教育新理念、新结构、新模式、新质量和新体系。新工科教育的最终目的是培养能适应和引领未来发展的创新型工程人才。
多学科交叉融合将成为未来工程发展的显著趋势,复杂性是现代工程问题的本质特征,绿色化、信息化和智能化将对未来工程产生十分重要的影响,伦理问题将成为未来工程发展必须高度重视的内容。在大数据时代催生的巨量人才缺口背景下,数据科学与大数据技术、人工智能、智能科学与技术专业应运而生,它们属于典型的数学、统计、计算机科学等多学科交叉融合的新兴工科专业。
图灵奖得主吉姆·格雷(Jim Gray)将科学研究分为实验、理论、计算和数据密集型科学发现四类范式。作为新工科专业的数据科学与大数据技术集多范式于一身。信息技术新工科产学研联盟发布的《数据科学与大数据技术专业建设方案(建议稿)》的培养目标中要求学生掌握面向数据应用的统计学、数学、计算机科学以及应用领域学科的基础理论和方法,并能利用统计建模和机器学习的基本理论、方法对数据进行深度分析和产品化开发。
在大数据时代,计算统计(Computational Statistics)正是由以计算密集为特征的统计方法及其支持理论所构成的一门学科,它融合了多学科交叉融合的领域,通常包含科学计算中的数值计算和统计计算的理论与算法等,将数学、信息科学、计算科学等完美融合,已经成为现代数据科学的重要支柱。
在数据科学与大数据技术、人工智能、智能科学与技术等新工科专业开设“计算统计”课程,对于支撑复合型专业人才培养目标十分重要。但是,面临的最大问题是无法找到适合培养目标的“计算统计”课程教材。国外的《计算统计》和《统计计算:使用R》教材主要面向统计学专业的学生,大多使用MATLAB程序或R程序,翻译教材也比较难懂。
国内的《数值分析》和《计算方法》等教材,对于数学思维的培养非常重要。从国内研究现状和以往的教学经验看,学生普遍认为这些教材理论性太强,对数学基础要求较高,学起来比较吃力。较多例题和习题偏推导,还有些数字特别复杂的计算题,不利于学生巩固知识。《数值分析》教材侧重代数数值算法,缺少统计计算内容,这对后续学习“机器学习”及其“数据统计分析”课程的作用有限。《数值分析》类教材中的案例以及单一的教学模式也无法适应新工科人才培养的需求。
本书借鉴了国内外经典教材中的相关内容,吸收了较新的高级统计和优化方法,采用通俗易懂的语言由浅入深地介绍统计计算和计算统计中的理论方法,有利于学生统计思维、计算思维与科学计算能力的养成。本书具有鲜明的理论与应用相结合的特色,融合经典计算方法和较新的统计计算方法,创设了计算统计在计算机中综合应用案例,具有很好的专业针对性。在矩阵计算中,介绍了用于网页排序的PageRank计算方法。在马尔可夫链蒙特卡洛方法中,介绍了自然语言处理领域中的文本主题模型等。
本书由汪文义统稿、定稿,宋丽红编写了第1~4章,汪文义编写了第5~8章,李佳负责校对。本书入选江西师范大学2020年度本科规划教材立项,得到国家自然科学基金(62267004,62067005)和江西省普通本科高校教育教学改革研究课题“理工融合、科魂匠心”视域下“计算统计”课程混合式教学模式改革与实践(JXJG2326)、混合式课程精准教学模式构建与实践(JXJG22244)的资助。
本书系统介绍核心理论、算法与应用,适用于计算机、数学、统计等专业本科生及研究生。
作者2025年1月