第1章经济时间序列的处理、季节调整与分解 本章主要介绍经济时间序列的处理、季节调整与分解。经济时间序列的处理包括数据类型的检验和频率转换,时间序列分解方法包括季节调整和趋势分解。 经济指标的月度或季度时间序列包含4种变动要素: 长期趋势要素T、循环要素C、季节要素S和不规则要素I。长期趋势要素代表经济时间序列长期的趋势特性。循环要素是以数年为周期的一种周期性变动,它可能是一种景气变动,也可能是经济变动或其他周期变动。季节要素是每年重复出现的循环变动,以12个月或4个季度为周期的周期性影响,是由温度、降雨、每年中的假期和政策等因素引起的。季节要素和循环要素的区别在于季节变动是固定间距(如季或月)中的自我循环,而循环要素是从一个周期变动到另一个周期,间距比较长且不固定的一种周期性波动。不规则要素又称随机因子、残余变动或噪声,其变动无规则可循,这类因素是由偶然发生的事件引起的,如罢工、意外事故、地震、水灾、恶劣气候、战争、法令更改和预测误差等 高铁梅,陈磊,王金明,等.经济周期波动的分析与预测方法[M].2版.北京: 清华大学出版社,2015: 第4章.。 在经济分析中,季节要素和不规则要素往往掩盖了经济发展中的客观变化,给研究和分析经济发展趋势与判断目前经济所处的状态带来困难。因此,需要在经济分析之前将经济时间序列进行季节调整,剔除其中的季节要素和不规则要素。而利用趋势分解方法又可以把趋势要素和循环要素分离开来,从而研究经济的长期趋势变动和景气循环变动。 1.1经济时间序列的处理和频率转换方法 数据是进行计量经济分析的基础。近年来我国的统计体系越来越完善,可获得的数据量迅速增长,但是在从各类数据库中提取数据后,还不能直接使用,需要进行预处理,从而使建模中采用的经济指标数据具有可信性、合理性和一致性。因此本节首先介绍几种经济数据类型的概念。由于有时所获得指标的数据频率不同(如有年度、季度或月度)而无法一起使用,需要将其中的某些指标进行频率转换,以达到数据频率的统一,我们在1.1.2小节中介绍两种数据频率的转换方法。 1.1.1经济指标中数据类型的概念 1. 流量与存量 流量变量(flow variable)是指一定时期内发生的某种经济变量变动的数值,它是在一定的时期内测度的,其大小有时间维度。例如,反映社会产品和劳务的生产、分配情况的国内生产总值(GDP)、工业增加值、劳动者收入、投资、消费、政府支出等都是流量。 存量变量(stock variable)表示某个时间点上结存数量的统计数字。例如,资产负债表中的期初资产和期末资产、存款额、贷款额、黄金储备、外汇储备、财富、库存等都是存量。 最通俗的例子: 自来水管放出来的水是流量,自来水被存储在某个蓄水池里是存量。存量与流量之间有密切的联系,流量是一定时期内发生的变量,是动态的概念,而存量是一个时点上存在的变量,是静态的概念。例如,在财富与收入这两个经济变量中,财富是一个存量,它是某一时刻所持有的财产; 收入是一个流量,新增加的财富是靠新创造的收入来计算的。 流量分析是对一定时间内有关经济总量的产出、投入(或收入、支出)的变动及其对其他经济总量的影响进行分析; 而存量分析是指对一定时点上已有的经济总量的数值对其他有关经济变量的影响进行分析。 2. 月(季)累计值与当月(季)值 月(季)累计值是由每年年初累计至当年各月(季)计算得到的统计数据; 当月(季)值是单月(季)的统计数据,如当月产值一般是按当月入库产成品数量与产品销售价格的乘积计算,称为当月现价产值。 在实际数据使用过程中,由于月(季)累计值是年初至当月(季)的累加数,用累计值计算的增长率越到年末越接近全年平均增速。统计局对一些指标,如投资,只公布累计值数据,但累计值指标波动较为平缓,经济波动被平滑了,需要化成当月(季)值来进行分析,可以近似地使用当期累计值减去上期累计值的方法计算得到当月(季)值。 3. 同比增长率、环比增长率和定基比增长率 由于采用基期的不同,经济发展速度可分为同比增长率、环比增长率和定基比增长率,均用百分数或倍数表示,下面以月度数据为例给出计算公式。 同比增长率是指本期发展水平与上年同期发展水平之比。由于同比增长率比较的是前后两年的相同月份(季度),如果近似假设两者具有相同的季节性,在计算变化率的过程中被自然除去。由于使用简单,中国大部分宏观数据都是以同比增长率的形式发布出来的。但是同比增长率的缺点是受前一年同期数值高低的影响,对经济增长的振幅会产生一些偏差。设Rt为月度同比增长率,Yt为月度经济指标,则有 Rt=100×(Yt-Yt-12)/Yt-12(1.1.1) 注意: 如果是季度数据,则12个月的滞后期应换成4个季度的滞后期。 环比增长率是指报告期水平与前一时期水平之比,表现逐期的发展速度。由于季节因素影响到相邻两个时期数据的可比性,因此计算环比增长率需要先通过季节调整模型,剔除原始统计数据的季节因素,设rt为月度环比增长率,Y~t为季节调整后的月度经济指标,则有 rt=100×(Y~t-Y~t-1)/Y~t-1(1.1.2) 定基比增长率是指报告期水平与某一固定时期水平之比,表明经济变量在较长时期内总的发展速度。设RGt为月度定基比增长率,Yt为月度经济指标,Y0为某年某月度基期值,则有 RGt=100×(Yt-Y0)/Y0(1.1.3) 同比增长率、环比增长率和定基比增长率,这三者所反映的虽然都是变化速度,但由于采用基期的不同,其反映的内涵是完全不同的。 4. 指数序列 在经济中反映变量动态变化或变量间相对关系的指标通常称为指数。经济变量中指数序列的类型很多,除了前面给出的增长率指数外,还有如物价指数、生产指数、贸易指数、资本产出率、消费率、劳动生产率等等,在频率转换中各种指数序列都作为同一类变量来处理。 5. 名义值与实际值 名义值(nominal value)是使用当期价格计算得到的值,而实际值(real value)是经过价格平减得到的值,因此剔除了价格因素。例如,名义国内生产总值(nominal GDP)即以当年价格计算的国内生产总值,实际国内生产总值(real GDP)即以基年价格(基年是人为设定的某一年,如将GDP基年定为1978年)计算的国内生产总值,二者的差别就在于计算的价格标准不同,前者是现期价格,后者是基期价格。 名义国内生产总值与实际国内生产总值之商被称为GDP平减指数(GDP deflator),用以衡量物价变动的幅度,是衡量通货膨胀的一种指标。例如年度GDP平减指数以1978年为基期,值为1,2006年GDP平减指数达到4.337,说明1978年至2006年物价上涨了3.337倍。 通俗地说,名义国内生产总值是指一定时期内所生产的商品与劳务的总量乘以当期“市价”而得到的数值,而名义国内生产总值增长率等于实际国内生产总值增长率与通货膨胀率之和。因此,即使总产量没有增加,仅价格水平上升,名义国内生产总值也会上升。在价格上涨的情况下,国内生产总值的上升只是一种假象,有实质性影响的还是实际国内生产总值变化率,所以使用国内生产总值这个指标时,还必须通过GDP平减指数,对名义国内生产总值作出价格调整,从而精确地反映产出的实际变动。 不同经济领域的价格变动是不一样的,当在计量经济模型中要求使用经济指标的实际值时,不同的经济指标需要用不同的价格指数进行平减。由此我们需要使用不同的基期价格指数,如消费类指标要用基期居民消费价格指数(consumer price index,CPI)平减; 商品销售类指标要用基期商品零售价格指数(retail price index,RPI)平减; 工业类指标要用基期工业品价格指数(producer price index,PPI)平减; 投资类指标要用基期固定资产投资价格指数(price index of investment in fixed assets,PIIFA)平减; 出口类指标要用基期出口价格指数(export price index,EPI)平减; 进口类指标要用基期进口价格指数(import price index,IPI)平减。 这6种价格指数的原始数据(Excel表)和计算过程及基期价格指数在第1章的EViews工作文件子目录里存放,电子版可以在清华大学出版社的网站上下载。但是统计局不公布基期价格指数,仅公布多数价格指数的同比增长率和环比增长率数据,因此可以根据某一年的环比增长率计算出当年的基期价格指数,再根据同比增长率数据向前和向后推算出相应的基期价格指数。对不同的经济指标,就可以利用相应的基期价格指数进行平减得到其实际值时间序列。 1.1.2频率转换 在经济数据中存在两类频率转换(frequency conversion)方式: ①高频数据向低频数据转换,如月度数据转换为季度或年度数据,季度数据转换为年度数据; ②低频数据向高频数据转换,如年度数据转换为季度数据,年度或季度数据转换为月度数据。 1. 高频数据向低频数据转换 高频数据具有的信息较多,转换为低频数据较为容易。但对不同的经济指标转换方法也不同,下面以月度数据转换为季度数据为例来加以说明。 (1) 将月度流量数据转换为季度数据时,应采取将对应季度的3个月数值相加得到其季度的数据。例如商品零售额,把对应季度的3个月商品零售额相加就得到该季度的商品零售额。 (2) 将月度存量数据或月度累计值数据转换为季度数据时,应将对应季度的最后月份数值作为季度值。例如存款额,把对应季度的最后月份存款额作为其季度存款额,也即将3、6、9、12月的存款额作为1、2、3、4季度的存款额。月累计值转换成季累计值的方法类似。 (3) 在经济分析中,有些指标可能需要近似地取对应季度3个月的平均值(或最大值、最小值、第1月份值、最后月份值)作为季度数据。例如价格指数,取其对应季度的3个月价格指数平均值作为其季度值,也是一种比较好的近似转换方法。 2. 低频数据向高频数据转换 低频数据向高频数据转换由于缺少信息,需要采用插值方法,因此比较困难。下面以将季度数据转换为月度数据为例来加以说明。 (1) 阶梯函数方法(constant)。对于存量或指数类型的季度数据,直接将当季数据分别放入对应的3个月里; 对于流量类型的季度数据,将当季数据除以3,即将当季数据的月平均值分别放入对应的3个月里,这样转换得到的月度曲线是阶梯式的。 (2) 线性插值方法(linear)。对于存量或指数类型的季度数据,直接采用线性插值方法将季度数据的各个点用直线连接成一个折线形式的月度曲线; 对于流量类型的季度数据,将当季数据除以3,即将季度数据的月平均值的各个点用直线连接成一个折线形式的月度曲线。 (3) 二次插值方法(quadratic)。对于存量或指数类型的季度数据,直接采用局部二次多项式插值方法,形成一个光滑的月度曲线; 对于流量类型的季度数据,将当季数据除以3,即对季度数据的月平均值采用局部二次多项式插值方法,形成一个光滑的月度曲线。这种方法的优点是,由于利用相邻的3个点进行局部二次多项式插值,所以更适合于数据较少的季度数据,而且增加数据后不影响前面的插值结果。 (4) 三次自然样条插值方法(natural cubic spline)。三次样条函数S(x)在低频数据序列yt的每一时间分段[xi-1,xi](i=1,2,…,N-1,N表示数据个数)上是三次多项式,整条曲线及其导数是连续的,利用三次自然样条插值方法获得的曲线具有很高的精度。三次样条函数需满足以下条件: ① 插值条件: S(xi)=yi(i=0,1,…,N-1)。 ② 微分条件: 一阶导数S′(x)、二阶导数S″(x)在[xi-1,xi]区间都是连续的 S′i(xi)=S′i+1(xi)(1.1.4) S″i(xi)=S″i+1(xi),i=1,2,…,N-2(1.1.5) 即S(x)曲线是光滑的。所以N个三次多项式分段可以写作 Si(x)=ai+bi(x-xi)+ci(x-xi)2+di(x-xi)3,i=0,1,…,N-1 (1.1.6) 式中: ai,bi,ci,di为4N个未知系数。 ③ 边界条件: 左右两端点处用自然边界条件给出 S″(x0)=S″(xN-1)=0(1.1.7) 根据插值点,求出每段样条曲线多项式中的系数,即可得到每段曲线的具体表达式,然后利用分段表达式计算出高频数据插值结果S^(x)。注意: 三次样条函数方法是一个整体插值方法,改变原始序列的一个点将影响插值序列的所有点。 对于存量或指数类型的季度数据,直接采用三次样条函数插值方法; 对于流量类型的季度数据,需将当季数据除以3,即对季度数据的月平均值采用三次样条函数插值方法。 (5) Denton插值方法。这一方法是由Denton(1971) DENTON F T.Adjustment of monthly or quarterly series to annual totals: an approach based on quadratic minimization[J]. Journal of the American Statistical Association,1971,66(333): 99102. 提出的一个以保持低频数据y的变化趋势为准则,基于数值平滑,通过最优化方法进行的时间序列分解的数学方法,Cholette(1984) CHOLETTE P A. Adjusting subannual series to yearly benchmarks[J].Survey methodology,1984,10(1): 3549. 做了修改。设y是已知的低频数据序列,N是其数据个数,y=(y1,y2,…,yN)′; 设w是待估计的高频数据插值序列,z是与w相关的高频数据序列,T是其数据个数,高频数据序列的样本区间是t=1,2,…,T,即w=(w1,w2,…,wT)′和z=(z1,z2,…,zT)′。 Denton方法假定对于已知的低频数据序列可以构建一个高频数据插值序列w,并可以找到一个与w相关的高频数据序列z,且z与w有非常接近的增长率。惩罚函数P(w,z)构造为序列(w/z)的一阶差分函数的平方和,在满足 ∑bkt=aknwt=yk(1.1.8) 条件下最小化惩罚函数P(w,z): minwP(w,z)=∑Tt=2wtzt-wt-1zt-12(1.1.9) 进而得到高频数据序列w^。式(1.1.8)中,参数的选择要按数据类型来选取: 如果y是流量变量,则约束条件(1.1.8)是插值序列w在每个时期的和等于低频数据y,且n=1; 如果y是存量变量,则约束条件(1.1.8)中的ak = bk,即每个时期k,插值序列w终点的值等于低频数据y,且n=1; 如果y是指数变量,约束条件(1.1.8)是插值序列w在每个时期k平均值的和等于低频数据y,如果y为年度数据,需要转换为季度数据时n=1/4,需要转换为月度数据时n=1/12,如果y为季度数据,需要转换为月度数据时n=1/3。 (6) ChowLin插值方法。ChowLin方法是由Chow和Lin(1971) CHOW G C,LIN A L.Best linear unbiased interpolation,distribution,and extrapolation of time series by related series[J].The review of economics and statistics,1971,53(4): 372375.提出的一个基于回归分析的插值方法。设y是已知的低频数据序列,N是其数据个数,y=(y1,y2,…,yN)′,建立方程: wt=Ztβ+ut(1.1.10) 式中: w=(w1,w2,…,wT)′是满足约束条件(1.1.8)的待估计的高频数据序列,对于存量变量、流量变量和指数变量的约束条件与Denton方法相同; Zt是由与wt相关的一个或多个高频数据指标组成的T × P阶解释变量矩阵; β是P阶系数向量; ut是随机扰动项,其均值为0,协方差矩阵为V。 ChowLin插值方法假定方程(1.1.10)的扰动项ut服从AR(1)过程: ut=ρut-1+εt(1.1.11) 式中: εt ~N(0,σ2),|ρ|<1。由方程(1.1.10)和方程(1.1.11)估计得到的w^即为转换后的高频数据序列。 注意: 方程(1.1.10)中也可以没有与w相关的p个高频数据解释变量,这样解释变量矩阵Z是一个全为1的向量,即方程(1.1.10)的右端第一项可以是常数项。此时方程(1.1.10)变为一阶自回归AR(1)模型,这就要求低频数据序列y是平稳的,如果y不平稳,可以通过差分使其转换为平稳后进行上述计算。 (7) Litterman插值方法。Litterman插值方法(1983) LITTERMAN R B. A random walk,Markov model for the distribution of time series[J].Journal of business and statistics,1983,1(2): 169173.与ChowLin插值方法类似,只是Litterman插值方法假定方程(1.1.10)的扰动项服从随机游走过程: ut=ut-1+εt(1.1.12) 式中: εt ~N(0,V), εt=ρεt-1+δt(1.1.13) 并且初始条件ut= 0。这个方法是利用状态空间模型方法求解的。如果方程(1.1.10)中没有解释变量,则要求y是平稳的。 Denton插值方法、ChowLin插值方法和Litterman插值方法都是全局插值方法,因此改变低频数据序列y的任何一个点或增加数据点都将影响到所估计的高频插值序列w^的结果。美国经济分析局(BEA)的研究报告(2007) CHEN B,ANDREWS S H. An empirical review of methods for temporal distribution and interpolation in the national accounts[J]. Survey of current business, 2008, 88(5): 3137.中对Denton、ChowLin和Litterman这3种方法都有更详尽的叙述。 对于含有季节因素的季度数据,先进行季节调整再进行频率转换可以得到较高精度的转换结果。 例1.1频率转换方法 图1.1.1(a)是名义季度国内生产总值GDP_Q,GDP_Q数据的取值范围为2004年1季度—2014年4季度; 图1.1.1(b)是通过Litterman插值方法计算得到的名义月度国内生产总值GDP_M。可以看出插值序列GDP_M每3个月的和等于GDP_Q相应季度的值。 图1.1.1GDP的季度数据和频率转换后的月度数据图形 图1.1.2(a)是季度固定资产投资价格指数FPI_Q(季度基期,1995年1季度=1); 图1.1.2(b)是通过Litterman插值方法计算得到的月度固定资产投资价格指数FPI_M,转换成1995年1月=1的基期数据。为了清楚起见,图1.1.2 FPI_Q的范围为2004年1季度—2014年4季度。对于指数类型的数据来说,插值序列FPI_M每3个月的平均值等于FPI_Q相应季度的值。 图1.1.2固定资产投资价格指数的季度数据和频率转换后的月度数据图形 实际上,本节介绍的低频向高频转换的几种插值方法的效果都相差不多,本例仅选择了Litterman插值方法。 1.2季 节 调 整 时间序列的季度、月度观测值常常显示出月度或季度的循环变动。例如,冰激凌的销售额在每一年的夏季最高,玩具的销售额在圣诞节期间达到顶峰。季节性变动掩盖了经济发展的客观规律,因此,我们在利用月度或季度时间序列进行计量分析之前,需要对时间序列数据进行季节调整。 季节调整(seasonal adjustment)就是从时间序列中去除季节要素,从而显示出序列潜在的趋势循环分量,而趋势循环分量才能够真实地反映经济时间序列运动的客观规律,我们应该用它来进行经济分析。只有季度、月度数据才能做季节调整。在EViews 10.0版本中,提供了4种比较常用的季节调整方法: Census X13方法、Census X12方法、TRAMO/SEATS方法和移动平均比法。 1.2.1移动平均公式 移动平均(moving averages)是X13季节调整程序的核心算法,其基本原理是算术平均。在季节调整过程中,其表现出如下特性: 周期(及其整数倍)与移动平均项数相等的周期性变动基本得到消除,互相独立的不规则变动得到平滑。 1. 简单移动平均 时间序列数据Y={y1,y2,…,yT},T为样本长度,在时点t上的2k+1项移动平均值MAt的一般表示为 MAt=12k+1∑ki=-kyt+i,t=k+1,k+2,…,T-k(1.2.1) 式中的k为正整数,此时移动平均后的序列{MAt}的始端和末端各欠缺k项值,需要用插值或其他方法补齐。 例如,常用的三项移动平均为 MAt=13∑1i=-1yt+i,t=2,…,T-1(1.2.2) MA1=132y1+y2(1.2.3) MAT=132yT+yT-1(1.2.4) 2. 中心化移动平均 如果处理的是月度数据Yt,考虑消除季节变动时,最简单的方法是对Yt进行12个月移动平均。此时,由于项数是偶数,故常常进行所谓“移动平均的中心化”,即取连续的两个移动平均值的算术平均作为该月的值,即 MA6.5=(y1+y2+…+y12)/12 MA7.5=(y2+y3+…+y13)/12(1.2.5) 因为12是偶数,通过求平均值可以达到中心化,即中心化移动平均值为 MA7=y1+y2+…+y1212+y2+y3+…+y13122(1.2.6) 中心化移动平均的一般公式为 MAt=12112∑5i=-6yt+i+112∑6i=-5yt+i=11212yt-6+∑5i=-5yt+i+12yt+6(1.2.7) 式中: t=7,8,…,T-6。 对于季度数据也类似地采用中心化移动平均,通过上述方法剔除季节要素,从而得到季节调整后的序列。需要指出的是,中心化移动平均后,序列的两端各有欠项,对于月度数据欠6项,对于季度数据欠2项,需要用插值或其他数值计算方法将其补齐。 3. 加权移动平均 上面介绍的12个月中心化移动平均是二次移动平均,也可以用一次移动平均式(1.2.7)表示,这种移动平均方法称为加权平均,其中每期的权数不相等。下面介绍几种季节调整中经常用到的加权移动平均方法。同样序列的两端各有欠项,需要用插值或其他数值计算方法将其补齐。这些方法一般用于消除不规则要素,可根据不规则要素波动的长度选择不同的方法。 (1) 3×3项移动平均 3×3项移动平均是对3项移动平均值再进行3项移动平均。首先进行3项移动平均: MA2=(y1+y2+y3)/3 MA3=(y2+y3+y4)/3 MA4=(y3+y4+y5)/3(1.2.8) 再进行3项移动平均: MA(2)3=(MA2+MA3+MA4)/3=(y1+2y2+3y3+2y4+y5)/9(1.2.9) 3×3项移动平均的一般公式为 MAt=(yt-2+2yt-1+3yt+2yt+1+yt+2)/9(1.2.10) 式中: t=3,4,…,T-2。式(1.2.10)也称3项反复移动平均或5项加权移动平均。 (2) 5×5项移动平均 把3×3项移动平均公式的项数换成5,用前述类似的方法就得到了5×5项移动平均公式,也称5项反复移动平均或9项加权移动平均。其公式为 MAt=(yt-4+2yt-3+3yt-2+4yt-1+5yt+4yt+1+3yt+2+2yt+3+yt+4)/25(1.2.11) 式中: t=5,6,…,T-4。 (3) 对称的亨德森移动平均 在X13季节调整方法中,为了从TCI序列中获得趋势循环要素TC,必须消除其中的不规则要素I,所使用的是亨德森(Henderson)加权移动平均方法。亨德森移动平均又称亨德森滤波,它是一种特殊的加权移动平均: MAt=∑Hi=-Hh(2H+1)iyt+i,H+1≤t≤T-H(1.2.12) 式中的H为正整数,亨德森加权移动平均有5,9,13,23项之别,不规则要素越大,需要的项数也越大。关于对称的亨德森移动平均系数h(2H+1)i的推导公式,参看Kenny and Durbin(1982) KENNY P B,DURBIN J. Local trend estimation and seasonal adjustment of economic and social time series[J]. Journal of the Royal Statistical Society: Series A,1982(1): 141.。 下面给出亨德森5项加权移动平均 SHISKIN J. The X11 variant of the census method Ⅱ seasonal adjustmnt Program[R].the U.S.Census Bureau,1965.阿部喜三,等.季节变动调整法[R].研究系列第22号.日本经济企划厅经济研究所,1971.: MAt=-0.073yt-2+0.294yt-1+0.558yt+0.294yt+1-0.073yt+2(1.2.13) 式中: t=3,4,…,T-2。两端各欠2项,欠项公式为 MA1=0.67y1+0.403y2-0.073y3(1.2.14) MA2=0.257y1+0.522y2+0.294y3-0.073y4(1.2.15) MAT-1=-0.073yT-3+0.294yT-2+0.522yT-1+0.257yT(1.2.16) MAT=-0.073yT-2+0.403yT-1+0.67yT(1.2.17) 1.2.2Census X13ARIMASEATS季节调整方法 1954年美国商务部国势普查局(Bureau of Census,Department of Commerce)在美国全国经济研究局(National Bureau of Economic Research,NBER)第二次世界大战前研究的移动平均比法(the ratiomoving average method)的基础上,开发了关于季节调整的最初的电子计算机程序,开始大规模对经济时间序列进行季节调整。这一方法历经了多次演变,现已成为一种相当经典的季节调整方法。其中,较具影响性的几个版本包括1965年发布的X11方法、1998年发布的X12ARIMA方法(或称为Census X12方法)以及2007年由美国商务部国势普查局与西班牙银行合作开发的X系列季节调整程序的最新版本: X13ARIMASEATS方法。 X11方法是基于移动平均的季节调整方法。它的特征在于除了能适应各种经济指标的性质,根据各种季节调整的目的选择计算方式外,在不做选择的情况下,也能根据事先编入的统计基准,按照数据的特征自动选择计算方式。在计算过程中可根据数据中的随机因素大小,采用不同长度的移动平均公式,随机因素越大,移动平均长度越大。X11方法是通过几次迭代来进行分解的,每一次对组成因子的估算都进一步精化。X11方法包括乘法模型和加法模型,乘法模型将时间序列分解为趋势循环要素与季节要素、不规则要素的乘积; 加法模型将序列分解为趋势循环要素与季节要素、不规则要素的和。其中乘法模型只适用于序列值都为正的情形。应当注意,季节调整的观测值的个数是有限制的,X11季节调整方法需要至少4个整年的月度或季度数据,最多能调整20年的月度数据或30年的季度数据。 X12ARIMA季节调整程序是在X11方法的基础上引进“随机建模思想”发展而来的,在进行季节调整之前,首先,通过regARIMA(regression autoregressive integrated moving average)模型对序列进行前向预测和后向预测、补充数据,以保证在使用移动平均进行季节调整过程中数据的完整性; 其次,还增加了检验和修正不同类型的离群值,估计并消除日历因素影响,对季节调整效果进行更为严格的诊断检验等功能。简言之,X12ARIMA方法包括X11方法的全部功能,并对X11方法进行了4个方面的重要改进: ①增加了季节、趋势循环和不规则要素分解的对数加法模型与伪加法模型; ②扩展了对贸易日和移动假日影响的调整功能; ③增加了新的季节调整结果稳定性诊断功能; ④增加了regARIMA建模和模型选择功能 FINDLEY D F,MONSELL B C. New capabilities and methods of the X12ARIMA seasonal adjustment program[J]. Journal of business and economic statistics,1998,16(12):127152.。 X13ARIMASEATS季节调整方法是美国商务部国势普查局与西班牙银行合作开发的X系列季节调整程序的最新版本,包括regARIMA和TRAMO(time series regression with ARIMA noise,missing observation,and outliers)两个预调整选择分支,以及X11ARIMA和SEATS(signal extraction in ARIMA time series)两个季节调整选择分支。增强的功能包括更加通用的用户界面、新的诊断方法和程序检测功能以及克服各种调整问题的新工具。此外,在X13ARIMASEATS方法中还增加了TRAMO/SEATS季节调整的外部调用功能,包括调用TRAMO程序对时间序列进行预处理,或调用SEATS程序对时间序列进行季节调整。目前,该程序已成为功能最为强大、应用最为广泛的季节调整方法。其基本流程如图1.2.1所示。本章在下面详细介绍X13ARIMASEATS方法的基本原理和程序功能。具体的操作参见1.4节。 图1.2.1X13ARIMASEATS的基本流程 1. X13季节调整方法的模型选择 X13季节调整方法共包括4种分解形式: 加法、乘法、对数加法和伪加法模型。注意,在采用乘法、对数加法和伪加法模型进行季节调整时,时间序列中不允许有零和负数。 (1) 加法模型的一般形式为 Yt=TCt+St+It(1.2.18) 式中: TCt为趋势循环要素; St为季节要素; It为不规则要素。在加法模型中,季节要素和趋势循环要素的影响用绝对量来表示,与所要分析的现象的计量单位相同,分析起来比较直观。它的局限性是各经济变量之间的计量单位不同,缺乏可比性。 (2) 乘法模型的一般形式为 Yt=TCt×St×It(1.2.19) 与加法模型相比,乘法模型的主要特点在于以相对数表示季节要素,因而可以避免计量单位的影响,增强了不同经济变量之间的可比性,但也带来直观性差的问题。 (3) 对数加法模型是通过对乘法模型取自然对数得到的特殊形式的加法模型。其一般形式为 ln Yt=ln TCt+ln St+ln It(1.2.20) (4) 伪加法模型是由英国中央统计局研究开发的。其一般形式为 Yt=TCt(St+It-1)(1.2.21) 该模型主要是对某些非负时间序列进行季节调整。它们具有这样的性质: 在每一年中相同月份出现接近于零的正值。在这些月份含有接近于零的季节因子。受这些小因子的影响,时间序列值偏离其趋势值。使用伪加法模型进行季节调整,当Yt≈0时,通过减去一个估计量TCt(St-1),使得这些月份的调整后结果TCIt更接近于序列趋势的估计值。例如,在一年的特定时期,农产品产量就是这样的时间序列。 2. X11季节调整程序的核心算法 Census X13季节调整程序有两种: 一种是扩展的X11方法,另一种是SEATS方法。SEATS方法将在1.2.3小节介绍。设Yt表示一个无奇异值的月度时间序列,通过预测和回推来扩展序列使得在序列的尾端不需要对季节调整公式进行修改。把Yt分解为趋势循环项TCt、季节项St和不规则要素It。现以加法模型为例,介绍X11季节调整方法的核心算法(为叙述简便而不考虑补欠项的问题)。其共分为3个阶段: 第一阶段: 季节调整的初始估计 (1) 通过中心化12项移动平均计算趋势循环要素的初始估计: TC(1)t=12Yt-6+Yt-5+…+Yt+…+Yt+5+12Yt+6/12(1.2.22) (2) 计算SI项的初始估计: SI(1)t=Yt-TC(1)t(1.2.23) (3) 通过3×3移动平均计算季节因子S的初始估计: S^(1)t=[SI(1)t-24+2SI(1)t-12+3SI(1)t+2SI(1)t+12+SI(1)t+24]/9(1.2.24) (4) 消除季节因子中的残余趋势: S(1)t=S^(1)t-[S^(1)t-6+2S^(1)t-5+…+2S^(1)t+5+S^(1)t+6]/24(1.2.25) (5) 季节调整结果的初始估计: TCI(1)t=Yt-S(1)t(1.2.26) 第二阶段: 计算暂定的趋势循环要素和最终的季节因子 (1) 利用Henderson移动平均公式计算暂定的趋势循环要素: TC(2)t=∑Hj=-Hh(2H+1)jTCI(1)t+j(1.2.27) (2) 计算暂定的SI项: SI(2)t=Yt-TC(2)t(1.2.28) (3) 通过3×5项移动平均计算暂定的季节因子: S^(2)t=[SI(2)t-36+2SI(2)t-24+3SI(2)t-12+3SI(2)t+3SI(2)t+12+2SI(2)t+24+SI(2)t+36]/15(1.2.29) (4) 计算最终的季节因子: S(2)t=S^(2)t-[S^(2)t-6+2S^(2)t-5+…+2S^(2)t+5+S^(2)t+6]/24(1.2.30) (5) 季节调整的第二次估计结果: TCI(2)t=Yt-S(2)t(1.2.31) 第三阶段: 计算最终的趋势循环要素和最终的不规则要素 (1) 利用Henderson移动平均公式计算最终的趋势循环要素: TC(3)t=∑Hj=-Hh(2H+1)jTCI(2)t+j(1.2.32) (2) 计算最终的不规则要素: I(3)t=TCI(2)t-TC(3)t(1.2.33) 例1.2季 节 调 整 利用X13季节调整程序中的X11加法模型对中国社会消费品零售总额月度时间序列(SL)进行季节调整,数据的取值时间范围为1995年1月—2003年12月。社会消费品零售总额的季节调整结果如图1.2.2所示。 从图1.2.2(a)中可以看出中国社会消费品零售总额序列具有明显的季节变动。通过X11加法模型进行季节调整后,从图1.2.2(b)中可以看出季节要素和不规则要素已被消除,得到趋势循环要素TC序列。图1.2.2(c)是社会消费品零售总额的不规则要素I。图1.2.2(d)是社会消费品零售总额的季节要素S。 图1.2.2社会消费品零售总额的季节调整结果 3. X13季节调整之前的预调整方法 (1) 贸易日影响和Young模型 由每天经济活动的总和组成的月度时间序列受该月各周的影响,这种影响称为贸易日影响(或周工作日影响)。例如,对于零售业在每周的星期一至星期五的销售额比该周的星期六、星期日要少得多。因此,各个月星期几的天数是不一样的,在某月如果多出的天数是一周的前五天,那么该月份销售额将较低; 如果多出的天数是一周的星期六、星期日,那么该月份销售额将较高。又如,在流量序列中平均每天的影响将产生“月长度”影响。因为在每年中2月份的长度是不相同的,所以这种影响不可能完全被季节因素承受。2月份残留的影响被称为闰年影响。 Young(1965)讨论了浮动贸易日的影响 YOUNG A H. Estimating trading day variation in monthly economic time series[Z]. Washington,D.C.:U.S.Department of Commerce,Bureau of Census, 1965.,Cleveland和Grupe(1983)讨论了固定贸易日的影响 CLEVELAND W P,GRUPE M R. Modeling time series when calendar effects are present[M]//ZELLNET A.Applied time series of economic data. Washington, D.C.: U.S. Department of Commerce, Bureau of the Census, 1983: 5767.。贸易日影响和季节影响一样使得比较各月的序列值变得困难,而且不利于研究序列间的相互影响。由于这个原因,当贸易日影响的估计在统计上显著时,通常在季节调整之前先把贸易日的影响从序列中剔除。在调整的内容中,形成了又一个分解要素——贸易日要素D。 在X13方法中,假设贸易日影响要素包含在不规则要素中,即不规则要素的形式是ID,假设已从原序列Y中分解出ID。然后用回归分析求出星期一,星期二,……,星期日的相应权重,从而可以将ID分解为真正的不规则要素I和贸易日要素D。为了对月度流量序列得到一个贸易日影响的模型,假设一周中星期i的影响记为αi,i=1表示星期一,i=2表示星期二,……,i=7表示星期日。dit表示在第t月中包含星期i的个数,该月贸易日的影响可表示为 ∑7i=1αidit=α-Nt+∑7i=1(αi-α-)dit(1.2.34) 式中: α-=∑7i=1αi/7,Nt=∑7i=1dit表示第t月的天数。 第t月贸易日的影响可以分解成两部分: 一部分只与该月的天数Nt有关,另一部分与星期i的净影响有关。第t月与该月的天数Nt有关的贸易日影响可以用α-N*t来表示,其中N*t由下式给出: N*t=14∑4k=1Nt+12k(1.2.35) 对于乘法分解模型,在方程(1.2.34)的两端同时除以α-N*t,我们可以去掉贸易日平均影响要素,即 NtN*t+∑7i=1βiditN*t=∑7i=1(βi+1)ditN*t(1.2.36) 式中: βi=(αi/α-)-1。 方程(1.2.36)就是Young(1965)的乘法分解模型的贸易日影响公式。设ID表示包含贸易日影响的不规则要素的预估计,建立回归方程 IDt=∑7i=1(βi+1)ditN*t+εt(1.2.37) 利用普通最小二乘法估计式(1.2.37)中的参数β^1,…,β^7,从而求得的估计结果ID∧ 是乘法分解模型的贸易日要素D的估计值,而残差序列εt是真正的不规则要素I的估计值。 对于加法分解模型,在式(1.2.34)的两端同时减去α-N*t,去掉贸易日平均影响要素,得到 α-(Nt-Nt)+∑7i=1(αi-α-)dit=β0(Nt-N*t)+∑7i=1βidit(1.2.38) 式中: β0=α-,βi=αi-α-,1≤ i ≤7。和乘法模型类似,建立回归方程 IDt=β0(Nt-N*t)+∑7i=1βidit+εt(1.2.39) 利用普通最小二乘法估计方程(1.2.39)的参数β^0,β^1,…,β^7,从而求得的估计结果ID∧是加法分解模型的贸易日要素D的估计值,而残差序列εt是真正的不规则要素I的估计值。 (2) 移动假日效应和genhol程序 在节假日里,人们往往停止生产、集中消费,使得许多经济变量表现出显著不同于非假日的特征。例如,中国春节的影响可以增加当周或前一周商品的零售额,或者是降低特定工厂在春节前几天的产量。假日有两种类型: 一种是在每年的固定日历日期出现的特定节日和官方假日,称为固定假日; 另一种不一定出现在每年的同一时间,称为移动假日,如美国的感恩节或者中国的春节。固定假日的影响效果构成所在月份(或季度)的季节因素的一部分,已经包含在季节因素或者固定季节效应内,在消除季节因素的同时也就消除了固定假日的影响。因此,需要单独考虑的是移动假日的影响。 ① 移动假日效应 中国人民银行调查统计司.时间序列X12ARIMA季节调整——原理与方法[M].北京: 中国金融出版社,2006.。 在X13方法中,根据美国的情况设定了复活节(在3月22日至4月25日范围内变动)、劳动节(9月第一个星期一)和感恩节(11月第四个星期四)3种移动假日。复活节和劳动节效应的基本模型假定: 从节日之前的第ω天开始,经济活动水平发生变动并保持在这一新水平上直至节日的前一天。感恩节效应的基本模型假定: 在感恩节之前的|ω|天或在节日之后的|ω|天(不超过12月24日),经济活动水平发生变动并保持在这一新水平上。ω>0表示感恩节之前的|ω|天,ω<0表示感恩节之后的|ω|天。据此可以构造回归变量: P(|ω|,t)=1|ω|× [受节日影响的|ω|天中落在第t月的天数](1.2.40) 表示经济活动水平受节日影响的|ω|天中,落在第t月的天数占全部时段长度|ω|的比例。在移动假日影响不到的月份,该变量的取值为0。在X13方法中,针对经济时间序列建立由式(1.2.43)所定义的regARIMAX模型,并包括式(1.2.40)所定义的移动假日回归变量,而且可以包括贸易日或奇异值等影响,并在估计其他回归影响的同时消除它们。注意EViews软件中的移动假日调整只针对美国,不能应用于其他国家。 在实际计算时,回归变量应当采取中心化形式,以保证在消除估计的假日影响之后,所得到的序列的年底总和大致等于调整之前的原序列的年度总和。如果没有进行中心化处理,这两个年度总和之间就会每年相差大致相同的幅度。X13程序只针对月度流量数据进行移动假日效应回归,对存量数据中可能存在的移动假日影响没有提供内置的解释变量。但X13程序允许用户自行定义和添加回归变量,最多不超过52个。程序自带的回归变量和用户自行添加的回归变量总数不超过80个。 ② genhol程序简介。针对美国以外的国家使用X13方法进行移动假日调整的需要,美国普查局提供了一个专门生成移动假日解释变量的genhol程序,用户只需提供本国特定的移动假日所对应的在公历中的日期,以及所设定的假日效应的影响时效,程序就能够自动产生供X13使用的移动假日解释变量的数据值。 genhol程序将移动假日效应区分为节前影响、节后影响和节日期间影响3类,并对应引入3个解释变量。假定经济活动水平在影响期内保持不变,即服从均匀分布。对3类影响的时间长度可以分别加以设定,并通过各种诊断检验方法,如AIC(Akaike information criterion)、样本外预测表现等选取最合适的影响时间长度。genhol程序对移动假日效应的区分如图1.2.3所示。其中: ①节前影响: 假定在节前b2天至节前b1天的区间内均匀影响经济活动水平,定义节前影响变量为所给定的区间[b2,b1]落在相应月份内的天数比例; ②节日期间影响: 假定在节前b1+1天至节后a1-1天的区间内均匀影响经济活动水平,定义节日期间影响变量为所给定区间[b1+1,a1-1]落在相应月份内的天数比例; ③节后影响: 假定在节后a1天至节后a2天的区间内均匀影响经济活动水平,定义节后影响变量为所给定区间[a1,a2]落在相应月份内的天数比例; ④在移动假日影响不到的月份,该变量取值为0。利用genhol程序能够更为细致地考察移动假日对流量数据的影响。 图1.2.3genhol程序对移动假日效应的区分 (3) regARIMA模型 为保证季节调整效果,在利用扩展的X11方法对时间序列进行季节调整之前,需要对时间序列进行预处理,这些工作都是基于regARIMA模型实现的。其主要体现在: ①X11方法是基于移动平均法的季节调整方法,它的一个主要缺点是在进行季节调整时,需要在原序列的两端补欠项,如果补欠项的方法不当,就会造成信息损失。通过用regARIMA模型对原序列两端进行预测,延迟原序列,解决了移动平均法末端项补欠值的问题。②在X13中预先定义了一些类别的回归变量,包括趋势常量、总体均值、固定季节效应、交易日效应、节假日效应、离群值点、水平漂移、暂时变化及斜线上升等变量。在regARIMA模型中添加这些解释变量不仅可以识别并剔除掉时间序列中存在的日历效应,同时也可以识别并剔除掉离群值的影响进而实现平滑数据的目的。 X13ARIMASEATS季节调整方法的新增功能的主要来源之一是提供了更加宽泛的时间序列建模功能——构建regARIMA模型。在regARIMA模型中,时间序列的均值(或其对数)函数用回归变量的线性组合来解释,并且该时间序列的残差结构定义为一个ARIMA过程。如果不添加任何解释变量,就意味着均值被假定为零,regARIMA模型退化为ARIMA模型(autoregressive integrated moving average models)。 建立ARIMA(p,d,q)模型,需要确定模型的参数,包括单整阶数d、自回归(AR)模型的延迟阶数p、移动平均(MA)模型的延迟阶数q。也可以在模型中指定一些外生回归变量,建立regARIMA模型。 对一个时间序列Yt建模,我们经常需要对序列进行一个非线性转换yt=f(Yt),来得到一个适合于regARIMA模型的序列。例如,Yt是一个正值序列,具有围绕序列水平方向运动的季节项,对其取对数,更一般地, yt=lnYtdt=ln Yt-ln dt(1.2.41) 式中: dt是一个适当的除数序列 在进行非线性变换时,也可以不在式(1.2.41)中除以除数序列dt,而将其作为式(1.2.43)中的一个回归变量。。可能的除数序列包括: ①月长度因子Nt/N*t; ②在Yt的不规则要素回归模型中得到的贸易日和节假日影响的组合因子; ③估计异常经济事件的调整因子。 建立包括一个单参数λ的修正的BoxCox幂转换: y(λ)t=Yt/dt,λ=1 λ2+[(Yt/dt)λ-1]/λ,λ≠0,1 ln(Yt/dt),λ=0(1.2.42) X13方法能够对时间序列yt建立非季节阶数为p,d,q; 季节AR阶数为P,季节差分阶数为D,季节MA阶数为Q的ARIMAX模型。模型有如下形式: p(L)ΦP(Ls)(1-L)d(1-Ls)Dyt-∑ri=1βixit=θq(L)ΘQ(LS)εt(1.2.43) 式中: L为滞后算子; 季节差分是指(1-Ls)yt=yt-yt-s; s为季节数,对季度数据s=4,对月度数据s=12。滞后算子多项式p(L),θq(L),ΦP(Ls),ΘQ(Ls)的阶数分别为p,q,P,Q。误差项εt的均值为0,方差为σ2。xit为外生回归因子,i=1,…,r。对式(1.2.43)使用极大似然估计方法确定回归系数βi,σ2及ARIMA模型系数。对ARIMA模型的介绍详见第2章2.1节。 (4) 离群值调整 离群值包括离群值点(additive outlier,AO)、水平位移(level shift,LS)、暂时变化(temporary change,TC)和季节离群值点(seasonal outlier,SO)4种类型。当序列中存在离群值时,需要在季节调整之前对序列进行离群值调整,从而提高季节调整结果的精度。 离群值点(AO)是指时间序列在t0时刻出现奇异值数据。相应地,可定义离群值点调整解释变量如下 参见X13ARIMASEATS Reference Manual,Version 1.1,U.S. Census Bureau,2013: 3233.: AO(t0)t=1,t=t0 0,t≠t0(1.2.44) 水平位移(LS)是指从t0时刻起序列值瞬间变化到一个新的水平上,并保持这一水平,其示意图如图1.2.4所示。定义水平位移调整解释变量如下: LS(t0)t=-1,tn(1.3.26) 式中 ξn=-∑nj=-nwL,j2n+1(1.3.27) 如果没有约束条件,这样ξn=0,则最优的近似就是理想滤波的权重的截断。 4. 高通滤波和带通滤波 低通滤波剔除了高频成分而保留了低频成分,高通滤波正好相反。因此,对于同样的切断频率λc,高通滤波wH(λ)的权重为 wH,0=1-wL,0,wH,j=-wL,j,j≠0(1.3.28) 理想的带通滤波wB(λ)只通过范围在λL1<|λ|<λ L2的频率,λL1,λ L2分别是两个低通滤波的“切断”频率。因此,可以将带通滤波wB(λ)作为这两个低通滤波的差。带通滤波wB(λ)的频率响应函数为 wB(λ)=wL2(λ)-wL1(λ)(1.3.29) 显然可以使得在频率带λL1<|λ|<λ L2的范围内,频率响应函数为1,而其他区间为0。显然带通滤波的权重便是两个低通滤波权重的差,即 wB,j=wL2,j-wL1,j(1.3.30) 从频率的角度定义了这些类型的滤波,这经常和周期相联系。频率为λ的循环的周期是p=2π/λ,切断频率为λc、截断点为n的近似的低通滤波可以记为LPn(p),意味着周期大于等于p(=2π/λc)的那些成分将保留。高通滤波和带通滤波可以类似地分别定义为 HPn(p)=1-LPn(p)(1.3.31) BPn(p,q)=LPn(p)-LPn(q)(1.3.32) 截断点n的选择是决定理想滤波BPn(p,q)近似优劣的根本因素,如果n取得过小,将会产生谱泄漏(leakage)和摆动(gibbs)现象。前者是说,滤波在剔除不想保留的成分的同时,也将想要保留下来的一部分成分剔除掉了; 后者是指频率响应函数在大于1和小于1两种状态之间摆动。随着n的增加,这些现象明显改善。但是,n不能选择太大,因为那样两端将缺失过多数据。图1.3.9显示了当n=8,12,18,36时BPn(p,q)的频率响应函数。 图1.3.9BPn(p,q)的频率响应函数 注: 虚线表示BP(p,q)滤波频率响应函数, 实线表示n取不同的值得到的带通滤波的频率响应函数。 设λ=2πω,则频率响应函数的频率λ的取值范围是[0,π],对应标准化后频率ω的取值范围为[0,0.5]。因此,周期p为32的高通滤波的理想的频率响应函数在大于等于1/32的频率区间的取值应为1。 例1.6利用BP滤波对经济时间序列进行趋势、循环分解 社会消费品零售总额(SL)的取值时间范围为1980年1月—2007年12月。经过单位根检验(单位根检验见第2章)SL是二阶单整序列。因此取对数并将取对数后的序列记为ln sl,经单位根检验,ln sl是一阶单整序列。 首先对ln sl进行季节调整去掉季节和不规则要素,得到只包含趋势循环要素的序列ln sl_TC。从图1.3.9可以看出BPn(p,q) 滤波的n=18比较合适,但是这样序列两端各缺失18项,由于序列较长,前端缺失的数据就去掉了,后端缺失的数据可以通过预测18个月来填补。为了近期的分解结果没有缺失值,本例建立ln sl的ARIMA(3,1,1) 模型(ARIMA模型介绍见第2章)并对ln sl 进行预测,外推到2009年6月,记为ln slf。 根据增长率周期波动分析,我国社会消费品零售总额的增长率存在1.5~5年的波动。取p=18(ωp=1/18),q=60 (ωq=1/60),利用式(1.3.29)带通滤波方法希望得到只保留1.5~5年周期成分的滤波序列。而取n=18的BPn(p,q) 滤波中1.5~5年周期成分的权重最大,可以近似地作为中国社会消费品零售总额对数的循环要素序列ln sl_C,同时利用时间序列分解的加法模型从ln sl_TC中减去ln sl_C,可得到趋势要素序列ln sl_T。 由于BP滤波两端各损失18个月的数据,所以趋势要素序列ln sl_T(图1.3.10)和(图1.3.11)循环要素序列ln sl_C的数据序列时间长度为1982年1月—2007年12月。 分别对ln sl_C和ln sl_T序列取指数,可得到社会消费品零售总额序列SL的循环要素SL_C和趋势要素SL_T(注意: 此时为乘法模型,循环要素SL_C在1上下波动),分解结果由图1.3.12~图1.3.13给出。 图1.3.10ln sl序列和ln sl_T序列 注: 实线表示ln sl的原序列,虚线表示趋势要素序列ln sl_T。 图1.3.11循环要素序列ln sl_C 图1.3.12SL序列和SL_T序列 注: 实线表示SL的原序列, 虚线表示趋势要素序列SL_T。 图1.3.13循环要素序列SL_C 1.4EViews软件的相关操作 EViews 10 Users Guide Ⅰ,IHS Global Inc.,2017. Chapter 5,pp.170177; Chapter 11,pp.445497,pp.539544. 1.4.1频率转换 EViews工作文件中的数据都是相同频率的,但是从一个工作文件窗口向另一个不同数据频率的工作文件窗口复制数据序列,就有一个频率转换的问题。存在两个数据频率转换方式: 从高频率数据向低频率数据转换,如月度数据向季度数据转换; 从低频率数据向高频率数据转换,如季度数据向月度数据转换。下面以季度数据序列和月度数据序列的转换为例来说明,要建立两个不同数据频率的数据文件窗口(季度数据工作文件和月度数据工作文件)。如果是月度数据序列转换为季度数据序列,首先在月度工作文件窗口中单击选择要转换的数据序列,再右击出现菜单,选择“Copy”复制; 然后在季度数据序列工作文件窗口的空白处右击,在出现菜单中选择“Paste Special”粘贴,此时会出现“Paste Special”窗口(图1.4.1),确定高频向低频的频率转换方法。如果是季度数据序列转换为月度数据序列,方法类似,需确定低频向高频的频率转换方法。注意两个工作文件要在同一个主窗体下。 图1.4.1频率转换选择窗口(高频向低频转换) 1. 从高频率数据向低频率数据转换 从高频率数据向低频率数据转换(图1.4.1),有6种选择(以月度数据向季度数据转换为例): (1) 各季度的3个月观测值平均值。 (2) 各季度的3个月观测值的和。 (3) 各季度的第一个月的观测值。 (4) 各季度的最后一个月的观测值。 (5) 各季度3个月中最大观测值。 (6) 各季度3个月中最小观测值。 2. 从低频率数据向高频率数据转换 从低频率数据向高频率数据的转换(图1.4.2),有8种插值方法: (1) 阶梯函数(Constant)。 (2) 二次插值方法(Quadratic)。 (3) 线性插值方法(Linear)。 (4) 三次自然样条函数插值方法(Cubic)。 (5) 点方法(Point)。 (6) Denton方法。 (7) ChowLin方法。 (8) Litterman方法。 图1.4.2频率转换选择窗口(低频向高频转换) 根据低频数据的性质还要在“Match”栏中选择转换后的高频数据是按平均值、求和,还是第一个月值或最后一个月值相匹配。例1.1中季度GDP转为月度GDP选择的是Litterman方法,在“Match”栏中选择“Sum”; 季度固定资产投资价格指数(FPI)转为月度数据时,选择的也是Litterman方法,在“Match”栏中选择“Average”。 1.4.2季节调整 1. X13ARIMASEATS季节调整 双击需进行季节调整的月度或季度时间序列名,在序列菜单选择Proc/Seasonal Adjustment/Census X13命令,将显示如图1.4.3所示X13季节调整选项对话框(X13 Options)。 图1.4.3X13季节调整选项对话框 (1) 变量预处理选项(Variables) X13ARIMASEATS程序允许用户在季节调整之前执行ARIMA回归,因此,X13对话框中的变量选项允许用户定义在ARIMA步骤中使用的序列和外生变量的形式。例1.2没有选择变量预处理,即选择缺省: None。 变量预处理选项(Variables)包括变量转换(Transform)、X13内置回归变量 (X13 built in regressors)、用户定义回归变量 (Userdefined regressors)、自动离群值检测(Automatic outliers)。 (2) ARIMA模型选项(ARIMA) ① ARIMA模型指定(Model) a. 手工指定(Manual) 如果用户选择手工指定方式,需要Model文本框中按(p,d,q)(P,D,Q)形式输入自回归、差分和移动平均阶数,以及季节自回归、季节差分和季节移动平均阶数。 b. X11自动指定(X11 Auto) 如果用户选择X11 Auto方式指定ARIMA模型,X13程序将利用X11ARIMA的算法自动选择最优的ARIMA模型。例1.2选择X11 Auto方式。X11ARIMA模型算法要求用户通过选择方式指定ARIMA模型,在Model部分的Specify下拉菜单中提供了3种备选方式: 通过列表选择(By list)、通过阶数限制选择(With limits)以及通过文件选择(By file)。如果是通过列表选择,用户可以在右边的列表框中指定多个形如 (p,d,q)(P,D,Q) 的备选模型。如果是通过阶数限制选择,用户需要设置ARIMA模型的每一项的最大阶数。EViews将基于用户设定的最大阶数,通过组合方式建立一系列备选模型。如果是通过文件选择,用户可以指定一个扩展名为 (.MDL) 的文件,该文件中包括一系列ARIMA备选模型。 c. TRAMO自动指定(TRAMO Auto) 如果用户选择TRAMO Auto方式指定ARIMA模型,X13程序将利用TRAMO/SEATS算法选择最优的ARIMA模型。对话框的Differencing和ARIMA部分允许用户指定差分和ARIMA项的最大阶数,Differencing部分中的Auto/Fixed转换按钮分别代表自动选择差分水平和选择固定的差分水平。 ② ARIMA模型估计(Estimation) Estimation部分允许用户指定带有回归因子的ARIMA模型的基本估计选项。Likelihood method下拉菜单允许用户指定使用精确极大似然方法或条件极大似然方法对模型进行估计和预测。 ③ ARIMA模型预测(Forecast) Forecast部分提供了利用所估计的ARIMA进行预测和回推的选项。用户需要指定预测和回推的长度,此外,当误差项服从对数正态分布时,可以选择Adjust for log transformation选项对预测进行对数变换调整。注意,当用户指定的预测和回推长度超出当前工作文件范围时,EViews不给出错误提示,但超出工作文件范围的观测值不能被生成。 (3) 季节调整选择(Seasonal Adjustment) 在季节调整选项(Seasonal Adjustment)分支中,用户可以利用单选按钮选择基于X11方法或SEATS方法进行季节调整,或选择None按钮不进行季节调整,此时X13程序仅估计指定的ARIMA回归模型。例1.2季节调整方法选择X11。 如果用户指定一种季节调整方法,EViews将显示两个预测输出(Forecast output)选项,选择这两个命令(Append forecasts和Append backcasts)可以对输出序列追加一年的预测和/或回推值,并且在表格输出中显示结果。对话框的剩余部分显示了X11和SEATS季节调整方法的基础选项。例1.2这两个预测输出(Forecast output)选项都选上。 ① X11基础选项 在X11基础选项中,Method下拉菜单用来设置季节调整分解方法,用户可以在乘法模型、加法模型、伪加法模型、对数加法模型和X13缺省选项中进行选择,例1.2选择加法模型(Additive)。当用户选择X13缺省选项,则模型的选择模式依赖于Variables分支中的变换选项(Transformation)的设定。 趋势滤波(Trend filter)下拉菜单允许用户对最终的趋势循环要素选择亨德森移动平均方法,可以让X13程序自动选择,或者指定一个1至101区间内的奇数。例1.2让X13程序自动选择。 季节滤波(Seasonal filter)下拉菜单允许用户指定季节移动平均的类型,缺省时X13将自动地选择季节滤波类型。例1.2让X13程序自动选择。 ② SEATS基础选项 通过指定Use HP filter选项,用户可以选择利用HP滤波方法对趋势循环因素进行分解。Do not allow stationary seasonal models选项通知X13程序,不允许对非差分季节模型进行调整,如果选择这个选项,并且指定了一个平稳季节ARIMA模型,X13将使用(0,1,1)指定来替代季节ARIMA模型成分。LjungBox Q limit文本框用来输入SEATS程序检验ARIMA模型质量的限制数。 (4) 季节调整结果输出(Output) 在输出选项(Output)分支中,允许用户指定多个季节调整输出序列被保存在工作文件中。在季节调整分支中选择不同方法(X11或SEATS),则输出选项的用户界面不同。 当选择X11方法时,最终输出序列(Final series output)部分包括季节调整后的序列(D11)、趋势要素(D12)、季节要素(D10)和不规则要素(D13)4个部分,括号内为输出序列短名。输出序列全名由原始序列名+“_”+序列短名组成,如原始序列名为GDP,X11季节要素短名为D10,则季节要素全名为GDP_D10。例1.2输出sl_d11、sl_d12、sl_d10、sl_d13。预测输出(Forecast output)选项不可用。 当选择SEATS方法时,最终输出序列(Final series output)部分包括季节调整后的序列(S11)、趋势要素(S12)、季节要素(S10)、不规则要素(S13)和暂时因素(S14)5个部分。预测输出(Forecast output)选项允许用户保存季节调整后的序列(AFD)、趋势要素(TFD)、暂时要素(YFD)和季节要素(SFD)的预测值。 2. X12季节调整 双击需进行季节调整的月度或季度时间序列名,在序列菜单选择Proc/Seasonal Adjustment/ Census X12,打开一个对话框。X12对话框中有5个标签,首先显示的是季节调整对话框(图1.4.4)。 图1.4.4X12季节调整对话框 (1) X11方法(X11 Method) 这一部分指定季节调整分解的形式: 乘法、加法、伪加法(此形式必须伴随ARIMA说明)和对数加法。注意在使用乘法、伪加法和对数加法模型时,被调整的序列中不允许有零和负数。 (2) 季节滤波 (Seasonal Filter)和趋势滤波(Trend Filter)选择 当估计季节因子时,允许选择季节移动平均滤波项数(又称月别移动平均项数),缺省时由程序自动确定(X12 default)。X12方法使用对称的亨德松(Henderson)移动平均进行趋势滤波。 (3) ARIMA模型选择 X12还允许在季节调整前对被调整序列建立一个合适的ARIMA模型,可以得到用于季节调整的向前/向后预测值。 (4) 存储调整后的分量序列(Component Series to Save) X12方法将被调整的序列名作为缺省列在Base name框中,可以改变序列名。在下面的复选项中选择要保存的季节调整后分量序列,X12方法将序列名加上相应的后缀保存在工作文件中: 最终的季节调整后序列(_SA)、最终的季节因子(_SF)、最终的趋势—循环序列(_TC)、最终的不规则要素分量(_IR)、季节/贸易日因子(_D16)和假日/贸易日因子(_D18)。 3. TRAMO/SEATS季节调整 双击需进行季节调整的月度或季度时间序列名,在序列菜单选择Proc/Seasonal Adjustment/TRAMO/SEATS,显示TRAMO/SEATS选项对话框。在TRAMO/SEATS选项中包括3个选择卡: TRAMO/SEATS选择卡、回归变量(Regressors)选项卡和外部冲击(Ouliers)选择卡。 (1) 运行模式(Run mode)。用户决定是否选择复选框(Run Seats after Tramo)。不选择复选框,则只运行Tramo程序; 如果选择复选框,则在运行Tramo程序之后,继续运行Seats程序。 (2) 数据转换(Transformation)。在数据转换的下拉菜单中有3个选项: 不进行数据变换(None)、进行对数变换(Log)和由程序决定是否进行对数变换(Auto Select level or log)。默认值是由程序决定是否进行对数变换(Auto Select level or log)。 (3) 选择ARIMA模型的阶数(ARIMA order search)。在该下拉菜单中有4个选项: 固定阶数(Fix order)、仅固定差分阶数(Fix only difference orders)、自动选择阶数(Search all)和自动选择阶数并且具有单位复根(Search all and unit complex roots)。 (4) 选择需要保存的序列(Series to Save)。用户需要在Base name后输入需要调整的序列名,并且用户可以选择需要保存的文件,软件提供了下列文件名供用户进行选择: 预测序列(_HAT)、线性变换序列(_LIN)、插值序列(_POL)、季节调整后的序列(_SA)、季节因子(_SF)、趋势序列(_TRD)、循环序列(_CYC)和不规则要素序列(_IR)。 1.4.3HodrickPrescott滤波 使用HodrickPrescott滤波来分解序列的趋势要素,选择Proc/Hodrick Prescott Filter,出现图1.4.5所示的例1.3的HP滤波选项对话框。 图1.4.5HP滤波选项对话框 首先对分解后的趋势序列给一个名字,EViews将默认一个名字,但也可填入一个新的趋势序列名字。然后给定参数λ的值,年度数据λ取100,季度和月度数据分别取1600 和14400。不允许填入非整数的数据。单击OK按钮后,EViews把原序列和趋势序列在一个图形中显示出来。注意只有包括在当前工作文件样本区间内的数据才被处理,区间外的数据都为NA。 1.4.4BP滤波 在EViews中,可以使用 BandPass 滤波对经济时间序列进行趋势循环分解。在序列对象的菜单中选择 Proc/Frequency Filter,显示图1.4.6所示例1.6的对话框。 图1.4.6频率滤波对话框 为了使用BandPass滤波,首先要选择一种滤波类型。共有3种类型: (1) BK固定长度对称滤波[Fixed length symmetric (BaxterKing,BK)]; (2) CF固定长度对称滤波[Fixed length symmetric (ChristianoFitzgerald,CF)]; (3) 全样本长度非对称滤波[Full sample a symmetric (ChristianoFitzgerald )]。 EViews默认的是BK 固定长度对称滤波。如果使用固定长度对称滤波,还必须指定先行/滞后(Lead/lag)项数n。 例1.6中n=18。由于带通(BK)滤波的两端各欠n项,为了近期的分解结果没有缺失值,例1.6利用ARIMA模型将季节调整后的TC序列ln sl_d12外推到2009年6月。经过单位根检验,发现ln sl_d12是一阶单整序列,对ln sl_d12建立ARIMA(3,1,1) 模型,然后预测18个月,使序列延长到2009年6月,记为ln sl_d12f。注意将样本区间(Sample)改为1980m01 2009m06。进入预测序列ln sl_d12f,在序列菜单的“Proc”中选择“Frequency Filter …”,单击后出现频率滤波对话框(图1.4.6),并填写相应信息。 用户必须选择循环周期(Cycle periods)的区间以计算BandPass滤波的频率响应函数的权重序列。这个区间由一对数据(PL,PU)描述,PL,PU由BandPass滤波要保留的循环波动成分所对应的周期来确定。月度数据填月数,季度数据填季度的个数。EViews将根据数据类型填入默认数值。例如,例1.6认为中国社会消费品零售总额的增长周期大约在1.5年(18个月)到5年(60个月),如果保留在这个区间内的循环要素,则区间的下界是18,上界是60。因此,设定PL=18,PU=60(相当于例1.6中的 p和q)。 用户需要输入希望保存的结果(循环成分、趋势成分)对象的名字。循环序列(Cycle series)是包含循环要素的序列对象(例1.6为ln sl_bp_c); 趋势序列(Noncyclical series)是实际值和循环序列的差(例1.6为ln sl_bp_t)。用户还能得到在滤波中所用的BandPass滤波频率响应函数的权序列,它将存储在矩阵对象中。 对称滤波移动平均的权重仅依赖用户指定的频率区间,而且是时不变的。EViews可以计算两种固定长度的对称形式的滤波,其中一种依据BaxterKing(1999),另一种依据ChristianoFitzgerald (2003)。二者差别在于选择BandPass滤波权重所依据的目标函数不同,即计算移动平均权重的方式不同。另外,EViews可以计算全样本非对称这种广义的滤波。非对称滤波是时变的,这种情况下,权重依赖于数据,而且在计算每个观测值时都不同,先行和滞后的权重都可以不同。 在选择BK和CF这两种对称滤波时,要注意固定长度滤波在做每次移动平均时都使用相同的超前、滞后项数。因此,n项超前、滞后滤波得到的序列将失去原序列两端各n个观测值。然而,非对称滤波序列没有这个要求,滤波后序列没有欠项。 在使用对称或非对称CF滤波时,要注意EViews提供了处理趋势数据的额外的选项。首先,要选择平稳性假设(stationarity assumption)。对于两种CF滤波,都需要设定序列是I(0)的协方差平稳过程或者是I(1)的单位根过程。然后,要选择剔除趋势的方法(Detrending method): 对于协方差平稳序列,应该选择剔除均值(remove mean)或剔除数据的趋势(remove linear trend); 如果是单位根过程,则应在剔除均值、剔除数据趋势或进行漂移调整(drift adjustment)三者中进行选择。由于BaxterKing滤波能够剔除I(2)过程的趋势,因此使用BaxterKing滤波时,上述两个选项不可选。 在BandPass滤波的输出结果中会出现两个图,左侧的图描述了原序列、趋势序列和循环序列。对于BK和CF固定长度对称滤波而言,EViews画出频率响应函数w(ω),频率ω的区间是[0,0.5],右侧的图描述了频率响应函数。但是,对于时变的CF滤波,并没有画出频率响应函数,因为滤波的频率响应函数随数据和观测值个数变化。