宏观量化的周期拐点和PPI领先指数设计

您所在的位置：网站首页 › 拐点指标 › 宏观量化的周期拐点和PPI领先指数设计

宏观量化的周期拐点和PPI领先指数设计

2024-01-16 21:46| 来源: 网络整理| 查看: 265

经济指标的周期、阶段、拐点如何确认？

指标间的领先滞后关系如何确认？

是否有科学的指数编制方法？

合成指数样本外能否有效预测峰与谷？

（二）研究思路

解决上述问题，宏观量化研究的主要步骤如下：

变量选取是研究的目标所在，指标主要分为两类：基准指标与宏观变量。基准指标的选取原则是能够作为当前所研究目标的指代变量，本身具有一定的重要性；宏观变量是对基准指标具有关联关系和解释性的一组数据，宏观变量种类繁多具有体系化、多样化的特点，常见有宏观的如投资类、消费类、进出口类、货币类、信用类等，中观的如行业产量类、库存类等。宏观变量的选取要考虑经济逻辑性、领域重要性、发布及时性等原则。

数据处理是研究效果的前提保障，实际中的经济数据可能出现不完整（存在缺失）、不连续（数据频率变化）、波动异常（季节性因素、统计误差或极端值）等情况，因此需对其进行预处理才能更好的进行后续的分析和研究。

合成方法是研究数据整合的重要步骤，选取的宏观变量经过处理之后如何将其复合为一个可跟踪的综合指数，需要考虑数据量纲大小、共线性、数据降维等问题，不同方法之间有其优势或劣势，需要根据场景选择使用。

拐点匹配是流程中分析关联关系的重要手段，对序列的拐点进行一一对应，明确彼此的相位对照关系，从而确认两者之间的领先滞后性。传统的关联分析一般使用互相关函数，通过遍历不同滞后期数，使用相关性分析、回归分析等方法测试序列的线性关系，这种做法在各期回归结果区别较大时能得出直观结论，而当某一序列有较强的自相关性时，该种方法就存在局限性。而拐点匹配方法的优势在于，不仅能计算平均拐点间隔时间，还能对经济指标的周期和阶段进行定期，并结合历史情形分析拐点的合理性与发生逻辑，从而使量化结果更具有解释力。

二、变量选取与数据处理

（一）变量选取原则

宏观变量的选取要考虑几个选取原则：

经济逻辑性：宏观变量需要对研究目标有着宏观上的传导逻辑。

领域重要性：宏观变量是各个领域中较为重要的宏观变量，能够较为全面的反映出当前领域的情况。

发布及时性：领先指标的发布频率不宜较低，且不能有太多滞后。

通过整理筛选宏观研究中常为投资者所关注的指标，我们将指标归纳为价格、金融条件、工业、进出口、消费、投资、财政7个大类及其细分的28个小类，后续可以根据研究目标从中选取关注的宏观变量进行处理使用。

（二）数据处理流程

宏观变量的时序数据往往包含四种要素：趋势要素（T）、循环要素（C）、季节要素（S）与不规则要素（I）。不同的数据所需要的处理步骤并不相同，需要结合数据特点进行步骤选择，通常有以下步骤：

首先要得到同一频率的数据，若指标频率不一我们无法直接对比，高频数据转低频通常需要采样，保留采样窗口的末期值或窗口均值。低频数据转高频通常需要进行线性插值，补充中间时间点的数值大小。

其次是得到去除趋势的数据，宏观数据主要分为两类，一类为比率或利率数据，例如国债十年期到期收益率、PMI，该数据本身并不含有明显的长期趋势性不需要进行趋势去除。第二类为绝对量的数据，例如M0存在着明显的趋势性，可以通过长期滤波或者计算同比的方式转化为增长率序列。

最后是得到平滑连续的数据，为了能将循环要素剥离出来，需要尽可能的去除季节要素与不规则要素的影响。季节要素是指每年不同时间段非循环因素对序列的影响，主要由于气候、节日、工作日数等因素组成，其中影响程度最大的是月份效应和节日效应，对此可以使用X-13模型；不规则要素是由偶然因素所引起的噪声，会干扰对指标周期性与拐点的判断，平滑方式主要分为全局平滑与滚动平滑。

需要进行季节效应调整的指标主要有以下几大类：消费与商品价格类，春节往往是购物旺季，会显著增加商品的销量，抬升其价格；货币类，在春节前往往提现的需求较高，因此M0在春节前的增速比较显著，M1与M2的春节效应并不明显；工业生产类，春节的位置会影响1、2月份的实际工作日，进而影响工业产量，如工业增加值、货运量、发电量、汽车产量等；进出口类，企业往往会在春节前减少进口，降低库存成本，因此进出口类指标也需要春节效应调整。

以工业增加值同比增速为例的季节分析如下，可以看到数据的季节要素较为明显，而且每年的1、2月份通常会存在较大幅度的变化。

去除噪音的平滑方式分为全局或滚动两大类：全局平滑的方法主要是各种滤波（例如BK滤波、HP滤波、EMD分解），滚动平滑的方法主要是各种移动平均（例如MA、EMA、LLT）。HP滤波是宏观经济学中常用的工具，例如OECD在做去除趋势与平滑时都使用此方法，第一步用高参数剔除趋势，第二步用低参数去除波动项中的噪声；EMD分解假设任何复杂的信号都是由若干瞬时频率有意义且唯一、但不同时刻瞬时频率可不同的本征模函数（IMF）叠加组成，分解过程不断从信号中提取出本征模态函数，直到信号仅保留趋势项为止。

以工业增加值同比增速为例进行去除噪音，月度数据的HP滤波参数通常使用14，EMD分解的选用标准可以是层数（通常使用2）或者信号噪音比的阈值（通常使用1.5），LLT类似移动平均的参数（通常使用12）。从结果来看，全局平滑效果较好，但比较依赖经验参数，加入新数据时会改变之前的平滑结果；滚动平滑则不会产生结果前修，但是受近期数据的影响明显，存在极值点相比原始数据后移的情况。

前面介绍了宏观变量必要的数据处理过程，最终得到平滑连续的数据在周期分析中才具有实用价值。周期的演绎模式可以由拐点来定义，拐点划分了指标序列的阶段，确定了拐点也就抓住了该指标周期性的基本特征。

(b) 检查相邻极值。首先判断每个极值点在相邻两个极值点之间是否为最大/小值，不满足则删除；其次判断极值点是否交替出现，若有重复峰/谷，只保留时间最早的较大/小点。

(d) 第二次检查相邻极值。在短周期被删除后序列可能再次包含多个峰值或波谷序列，因此需要重复第二步。

(e) 检查半周期长度。峰与谷的间隔是否满足最短时限（通常剔除小于6个月），不满足则删除偏离均值较小的极值点。

(f) 第三次检查相邻极值。重复第二步，最终剩下的极值点认定为拐点。

（二）拐点匹配

确定拐点后，我们一方面也确定了序列的周期和阶段，另一方面也借此得以进一步研究两个经济指标的关联，最终目的是确定两条时间序列之间的领先或滞后的期数。在此之前就需要对两个序列的拐点进行一一对应，明确彼此的相位对照关系。

拐点匹配在实际操作中并没有被广泛使用或主要机构公布的算法，这一过程可以基于时间相隔的远近来设计匹配逻辑，将拐点分为对应、缺失、多余三种可能的状态。假设基准序列B与变量序列X，主要步骤如下：

(a) 定位匹配点。判断序列X在(-M,N)（负数表示滞后，一般使用-6至18）的时间范围内，是否存在与序列A中各拐点对应的相同性质（峰/谷）拐点。

(b) 区分缺失的原因。对基准序列B中的每个拐点b(j)，在X的上述范围内寻找类型相同的、最近的拐点进行匹配，若存在匹配则进入下一步。否则判断该拐点的日期是否小于两序列时间交集的最早日期，若否则标记为对应拐点缺失，若是则标记为早期缺失，意味着是由于数据序列过短造成的。

(c) 检查重复的情况。判断上一步中寻得的X中的拐点x(i)是否此前已有对应拐点。若否，标记b(j)和x(i)相对应，若是，则比较此前与之对应的拐点与x(i)之间的时间间隔是否小于b(j)与x(i)之间的时间间隔。小于则将b(j)标记为拐点缺失，若否则修正x(i)的对应关系为b(j)，保持最近相邻的原则。

(d) 检查交叉的情况。对所有b(j)执行上述两步之后，检查每个有对应点的x(i)其对应的b(j)是否满足时间上的由远至近。若x(i)对应b(j)与x(i+1)对应b(j+1)出现时间戳j>j+1的情况，则判断x(i)与b(j)之间的时间间隔是否小于x(i+1)与 b(j+1)之间的时间间隔，若是则将b(j+1)标记为对应拐点缺失，若否则将 b(j)标记为对应拐点缺失。

(e) 检查X中剩余拐点。将无对应的x(i)标记为多余拐点，但如果x(i)在B序列最后N月内的除外，因为其对应的b(j)仍有可能在未来出现。

（三）评价指标

通过上述方法计算宏观变量的拐点以及匹配结果之后，对结果进行客观评价可以结合历史情景进行分析，也可以借助相关指标进行客观评价，基于匹配结果的评价指标主要有：

未匹配比例：反映基准指标中未能匹配的比例，数值越高说明所选变量的解释能力越弱。

冗余比例：反映宏观变量中无效的拐点比例，数值越高说明所选变量本身的无效信号次数越高。

时差平均值：拐点的平均领先阶数，数值越大说明领先性越强，但而过大的领先性有周期错配的可能性，结果可信度不足。

时差标准差：拐点领先阶数的标准差越小，拐点的领先期稳定性越强。

此外，时差相关性分析也是用来判断经济指标的领先与滞后阶数的常用方法，通过计算领先与滞后N期的候选指标与基准指标间的相关系数，选择相关系数最大的阶数作为领先或滞后阶数，数值结果可以与拐点匹配分析进行相互印证。

四、合成方法

选取的宏观变量经过上述流程处理之后，如何将其复合为一个可跟踪的综合指数从而方便与基准变量进行比较，主要合成方法包括扩散指数法、合成指数法、主成分分析PCA、动态因子模型DFM。其中合成指数法在不同经济研究机构中采用的方法略有差异，经合组织OECD历史最为悠久、应用最为广泛。本章我们简要介绍方法的原理及优缺点，后续再通过实际数据的合成结果与基准变量进行拐点匹配分析不同方法间的差异。

（一）合成指数法OECD

OECD自1978年始基于增长循环理念编制了各成员国的线性合成领先指数，主要步骤如下：

各个宏观变量为 ,(j=1,2,…,m),m为宏观变量个数，基准指标为X(t)

(1)求各个指标的标准化偏差

（2）计算宏观变量的平均标准化序列S(t)

（3）计算调整因子k和d，使得合成指数与基准指数具有可比性

OECD法计算简便，不存在任何信息损失。对于波动较大的指标，标准化偏差较大时将给予其较低的权重，来降低噪声对合成指数的干扰。不过当指标池中存在经济含义高度重叠的备选指标时，OECD法会重复计算其权重，因此在筛选指标时应尽量避免相关性过高的指标。

（二）主成分分析法PCA

主成分分析法通过降维的方式将多个指标复合为综合指标，通过正交变换将指标转换为线性不相关，从而提取指标组的主要信息。步骤如下：

（1）设宏观变量X中的指标序列 (i=1,2,…,p)，将X标准化后计算协方差矩阵的特征值 (从大到小排列)及其对应的特征向量

(2)计算主成分

(3) 对主成分按特征值从大到小排列并计算主成分的方差贡献率，在p个主成分中选取方差贡献率之和达80%的前m个主成分，以主成分的方差贡献率作为权重对m个主成分进行加权求和

(4) 计算调整因子k和d，使得合成指数与基准指数具有可比性

PCA法考虑了多变量的相关性，因而允许备选指标的经济含义高度重叠。但由于丢弃了其他主成分，PCA法存在一定程度的信息丢失。最关键的是，由于不同时间区间第一主成分蕴含的信息量不同，会造成不同时期合成指数的含义不完全一致。

（三）动态因子模型DFM

DFM的基本思想是经济的周期波动是通过一系列经济变量的活动来传递和扩散的，任何一个经济变量本身的波动都不足以代表宏观经济的整体波动，因此需要提取各个变量波动的共同动态因子。设宏观变量为

，步骤如下：

(1)隐含状态方程中称为的共同部分，为由s阶滞后算子多项式组成的N*q维矩阵

(2)假定动态因子服从某一向量随机过程VAR(P)，其中为p阶滞后算子多项式组成的q*q维矩阵，为驱动动态因子的q*1维结构冲击活原始冲击

(3)假定异质部分和原始冲击在所有时期k都不相关

DFM模型不仅允许观测变量受因子滞后项的影响，而且也允许因子本身具有独立的动态演化过程，具有双重动态特征。

五、PPI领先指数的设计

（一）变量的选取处理

生产价格指数(PPI)是衡量工业企业用品出厂价格变动趋势和变动程度，反映一时期生产领域价格变动情况的重要经济指标，对股票、大宗商品等资产价格都有重要影响。如果能通过一系列经济指标设计领先指数，对于提前预判PPI走势具有重要意义。

PPI从两分法的构成上来看，主要受到生产资料中的原材料工业与加工工业的影响，从39个不同行业的细分构成来看，影响较大的为黑色金属、石油、煤炭、化工、有色金属相关行业。因此我们选用的基准指标为PPI全部工业品当月同比，选用的宏观变量主要是两类，一类是与PPI相关性较高的价格类指标；另一类为工业企业盈利、货运量、进出口等反映经济景气的指标，当货运量提高，工业企业盈利改善，进出口额上涨，工业企业的对原材料需求上升，推动PPI上行。具体指标及所需要的处理步骤如下：

基准指标（PPI:全部工业品:当月同比）数据处理之后的结果如下，可以看到季节调整后数据变化不大，原因在于其本身就是同比数据，采用HP滤波去除噪音之后仍能较好的保留主要的周期规律和拐点情况。

（二）基准指标的周期拐点

（三）合成方法的效果对比

从未匹配比例、冗余比例上看，PCA最低OECD其次DFM最高，说明所选取的变量之间还是存在较高的共线性，这种情况下对数据进行降维能取得较好的效果；但是PCA方法依赖数据的完整性，早期数据的缺失会导致合成指数的时间跨度晚于基准指标；从领先效果来看，OECD平均值为4中位数为2.5，PCA平均值为4.7中位数为3，DFM平均值为3.6中位数为3.5；时差相关性方面OECD和PCA分别为0.86和0.92，DFM略差为0.66。整体而言通过一系列宏观变量合成得到的领先指数对PPI的预测能取得较好效果，并且相关性较高走势接近，基本保持在一个季度左右的领先期数。

六、结论

数据处理流程在于分离时间序列的四个要素：趋势要素（T）、循环要素（C）、季节要素（S）、不规则要素（I），针对数据的不同特点设置不同的处理步骤，在较为关键的去除噪音环节，对比了不同处理方式的优势和劣势：全局平滑效果较好，但比较依赖经验参数，加入新数据时会改变之前的平滑结果；滚动平滑则不会产生结果前修，但是受近期数据的影响明显，存在极值点相比原始数据后移的情况。实际使用中可以根据数据特点进行精细化的设置。

合成方法部分主要对比了三种常用方法的原理，合成指数法采用OECD的编制方式计算简便但存在共线性问题；主成分分析法PCA考虑了多变量的相关性，因而允许备选指标的经济含义高度重叠，但由于丢弃了其他主成分，存在一定程度的信息丢失，且依赖数据的完整性；DFM模型不仅允许观测变量受因子滞后项的影响，而且也允许因子本身具有独立的动态演化过程，具有双重动态特征。

对比三种合成方法，从领先效果来看，OECD平均值为4中位数为2.5，PCA平均值为4.7中位数为3,DFM平均值为3.6中位数为3.5；时差相关性方面OECD和PCA分别为0.86和0.92，DFM较差为0.66。整体而言，使用这一宏观量化流程合成得到的领先指数对PPI的预测能取得较好效果，并且相关性较高走势接近，基本保持在一个季度左右的领先期数，对于提前预判PPI走势具有重要意义。

免责声明：

本微信号推送内容中的信息均来源于被广发期货有限公司认为可靠的已公开资料，但广发期货对这些信息的准确性及完整性不作任何保证。

本微信号推送内容反映研究人员的不同观点、见解及分析方法，并不代表广发期货或其附属机构的立场。报告所载资料、意见及推测仅反映研究人员于发出本报告当日的判断，可随时更改且不予通告。

在任何情况下，本微信号推送内容仅供参考，推送内容或所表达的意见并不构成所述品种买卖的出价或询价，投资者据此投资，风险自担。

本微信号推送内容旨在发送给广发期货特定客户及其他专业人士，版权归广发期货所有，未经广发期货书面授权，任何人不得对本报告进行任何形式的发布、复制。如引用、刊发，需注明出处为“广发期货”，且不得对本报告进行有悖原意的删节和修改。

本微信号推送内容中的信息均来源于被广发期货有限公司认为可靠的已公开资料，但广发期货对这些信息的准确性及完整性不作任何保证。

在任何情况下，本微信号推送内容仅供参考，推送内容或所表达的意见并不构成所述品种买卖的出价或询价，投资者据此投资，风险自担。

点分享

点点赞

点在看返回搜狐，查看更多

【本文地址】

宏观量化的周期拐点和PPI领先指数设计

宏观量化的周期拐点和PPI领先指数设计

今日新闻

推荐新闻