图书前言

导师序言

时间序列是将特定研究对象以数值、向量、物体等形式,按照时间顺序记录的数据。时间序列分析通过研究已经记录的历史数据,提炼统计规律,并用以对未来序列进行预测,是统计学中的一个重要分支。随着技术的推进与发展,现在收集到的时间序列数据往往呈现维度高、相关性强、时变性强等复杂特征。复杂时间序列数据对分析和建模提出了新的挑战,亟须新的统计推断方法。本书聚焦复杂时间序列数据的统计理论和实际应用,研究了三个极具代表性的统计推断问题,即时间序列分布函数的统计推断,函数型时间序列的统计推断,以及局部平稳时间序列多步向前预测区间的统计推断。

第2章针对严平稳时间序列的分布函数建立了四种同时置信带。其中一个有趣的应用是通过构造的同时置信带来检验股票每日回报率分布函数的整体形状(例如重尾和尖峰态)。第2章在最宽泛的假设下得到了渐近结论,并检验了标准普尔500指数序列(1950年1月至2018年8月)的分布函数。一个令人惊讶的发现是其分布函数可以是自由度大于2的多个学生分布,甚至是正态分布。本书提出的同时置信带是现有针对时间序列分布函数形状检验的唯一理论可靠的工具。该工作使用了核光滑、强混合性和随机过程收敛等结果,并于2019年在北大-清华统计学论坛获优秀墙报奖。

第3章对于平稳函数型时间序列的均值函数提出了一种渐近正确的同时置信带。具有时间相依性的函数型数据在科学研究中频繁出现,例如脑电图和心电图信号等,它们被称为“函数型时间序列”。第3章将轨迹间依赖性建模为取值为L2空间中的无穷移动平均,记作FMA()。在函数型主成分得分和测量误差的基本矩条件假设下,本书建立了均值函数B样条估计量的默示有效性,并基于此推导了同时置信带。对于脑电图信号这一函数型时间序列,该工作表明其均值函数实际上可以表示为稀疏的傅里叶级数,因为脑电图时间序列均值函数的三角级数估计量被包含在低置信水平的同时置信带中。这是目前唯一针对离散观测、存在测量误差的函数时间序列的同时置信带工作,其理论推导运用了B样条平滑、高斯过程部分和强逼近等复杂技巧。该工作于2020年荣获国际数理统计协会(Institute of Mathematical Statistics,IMS)颁发的汉南研究生旅行奖(Hannan Graduate Student Travel Award),作者李杰博士是当年唯一来自中国的获奖者。

第4章构造了局部平稳时间序列的多步向前预测区间。具体步骤是,通过B样条估计时变趋势函数,通过核光滑方法估计时变方差函数,在对标准化的时间序列拟合自回归模型后,得到预测残差的分位数估计,最后构造出了未来观测的预测区间。第4章用提出的新方法分析了西安市2013年1月至2020年7月大气污染物的浓度数据,发现本书提出的预测区间精度高于季节性ARIMA方法的预测区间,从而证明了所提方法的优越性。该工作于2021年被国际统计学会(International Statistical Institute,ISI)认定解决了一个对广大发展中国家具有实际意义的应用统计问题,荣获每两年颁发一次的国际统计学会简·丁伯根奖一等奖(ISI Jan Tinbergen Award Division·A First Prize),这也是此奖项的一等奖首次授予华人统计学者。

本书在理论分析中灵活运用了非参数统计的核估计与B样条估计方法,高斯强逼近、随机过程的弱收敛,以及时间序列的混合性质等多种技巧和工具。本书提出的方法适用于经济、生物、环境等诸多领域的实际数据,展现了本书成果对相关领域产业应用的重要意义,很好地体现了现代统计学研究方向的交叉性质。本书结构框架清晰,学术表达专业严谨,写作规范,希望能够给相关领域的研究带来一定的启示。

杨立坚

2023年8月