摘要
①如何规避宏观数据建模时可能存在的错误、②如何对宏观数据进行必要的清洗和处理、③如何优化宏观数据的建模质量、以及④宏观数据在投资决策中有哪些应用场景,是投资者在使用宏观数据时必须要考虑的问题。本篇报告针对以上问题进行了探讨,以期让投资者在投资决策中能够能为有效的使用宏观数据。
使用宏观数据时需要规避的问题
需要规避的问题指:如果在使用宏观数据时出现了下述情况,则模型具有根本性错误,结论不具有任何可参考意义。
1)滞后性:多数重要宏观指标均会在下月(下季)公布当月(当季)的指标值。若在每月末使用宏观数据的当月值,则会在模型中引入未来数据,使结论无意义。处理宏观数据滞后性有两种方式:定期后移法与动态后移法。
2)数据前修:宏观指标可能会进行初值修订与口径变化,使当前看到的值并非发布时的初始值。实践中需要我们针对每一个宏观指标,去确定其是否存在初值修订或口径变化问题。
3)虚假回归:部分宏观数据与资产走势之间的数理相关性与其经济学逻辑相悖。虚假回归可能带来严重的过拟合现象,使模型结果无意义。虚假回归的问题一个有效的解决方法是预先明确宏观指标与未来资产走势之间的逻辑方向。
使用宏观数据时需要处理的事项
需要处理的事项指:如果在使用宏观数据时没有处理以下事项,则宏观数据的质量相对较差,虽不会使模型结果完全无意义,但会影响结果的可信度。
1)指标间相关性:宏观数据数量众多,难免会存在经济逻辑相似或历史取值接近的指标。指标间相关性可能使模型存在多重共线性问题,造成模型结果稳定性下降。处理指标间相关性有两类方式:建模前降维以及建模中惩罚。
2)季节性:宏观数据可能在不同月份表现出有一定规律的高低变化。季节性可能使宏观数据难以正确反映经济状态的实际变化,造成模型结果有效性的降低。处理宏观数据季节性有两类方式:计算同比以及X-13-ARIMA方法。
3)春节效应:春节假期往往落在1、2月份,从而干扰部分宏观数据在前两个月的取值。春节效应使得部分宏观数据前两个月数据质量降低,进而影响建模效果。处理春节效应有三类方式:合并前两月、变更参照日、季节性调整。
4)基数效应:计算增速时,上一期的异常值会对本期增速有较大的影响。基数效应使同比或环比变化难以反映经济运行真实状态,使模型结果有效性降低。处理基数效应有三类方式:复合增长率、历史值填充、X-13-ARIMA方法。
5)翘尾效应:计算同比时,之前指标的变化会对当前同比产生延伸影响。翘尾效应反映的是“正确数据”下的“延后状态”,如果想要去除翘尾效应,最好的方式是将同比数据转化为环比数据。
使用宏观数据时可以优化的角度
可以优化的角度指:如果在使用宏观数据时进行了对应的优化,则对模型具有锦上添花的效果。
1)考虑领先滞后关系。考虑领先滞后关系可以:①通过领先指标对滞后指标进行预测;②在建模时优先纳入领先指标、谨慎使用滞后指标。本文介绍了三种通过数量化方法判断领先滞后关系的方法:线性回归、格兰杰因果关系检验和脉冲响应分析。
2)引入宏观预期数据。宏观预期数据具有三方面优势:①与实际数据直接可比;②时效性强;③具有瞬时信息增量。我们在之前报告中实证展示了宏观预期数据在资产配置、因子择时、板块轮动中的应用效果。
3)判断宏观主要矛盾。经济增长、宏观流动性、通胀等因素,都会在特定情景下成为影响当时股票市场走势的主要宏观矛盾。本文介绍了两种宏观主要矛盾的判断方法:敏感型行业法和文本分析法。
宏观数据的建模应用场景
宏观数据在实际投资中有着丰富的应用场景。本文介绍了六个常用的应用场景:Nowcast、资产择时与配置、行业轮动、风格轮动、行业景气度、因子选股,并展示中金量化团队的已有应用实践成果。
风险提示:模型基于历史数据构建,未来存在失效风险。
正文
我们在进行投资决策时,经常会使用到各种宏观数据。如何规避宏观数据建模时可能存在的错误、如何对宏观数据进行必要的清洗和处理、如何优化宏观数据的建模质量、以及宏观数据在投资决策中有哪些应用场景,是投资者在使用宏观数据时必须要考虑的问题。本篇报告将针对以上问题进行探讨,以期让投资者在投资决策中能够能为有效的使用宏观数据。
图表1:本篇报告研究内容
资料来源:中金公司研究部
使用宏观数据时需要规避的问题
1. 滞后性
图表2:两种滞后性处理方式
资料来源:中金公司研究部
2. 数据前修
3. 虚假回归
图表3:不同宏观指标对资产未来走势的经济学逻辑方向存在差异
资料来源:中金公司研究部
使用宏观数据时需要处理的事项
需要处理的事项指:如果在使用宏观数据时没有处理以下事项,则宏观数据的质量相对较差,虽不会使模型结果完全无意义,但会影响结果的可信度。我们在本篇报告中指出了5方面需要处理的事项:①指标间相关性;②季节性;③春节效应;④基数效应;⑤翘尾效应。
1. 指标间相关性
图表4:指标间相关性处理方式对比
资料来源:中金公司研究部
2. 季节性
图表5:两种季节性处理方式对比
资料来源:中金公司研究部
图表6:同比数据对趋势变化的反映存在滞后性
资料来源:中金公司研究部
图表7:同比数据可能引入基数效应等其他问题
资料来源:Wind,中金公司研究部
3. 春节效应
图表8:春节效应处理方式对比
资料来源:中金公司研究部
4. 基数效应
图表9:2021年1季度GDP存在基数效应
资料来源:Wind,中金公司研究部
图表10:基数效应处理方式对比
资料来源:中金公司研究部
5. 翘尾效应
图表11:存量或状态类指标的同比数据易出现翘尾效应
资料来源:中金公司研究部
图表12:CPI环比数据的序列相关性更低
资料来源:Wind,中金公司研究部
图表13:CPI环比存在季节性问题
资料来源:Wind,中金公司研究部
使用宏观数据时可以优化的角度
1. 考虑领先滞后关系
图表14:PMI分项对多种宏观数据具有领先性
资料来源:Wind,中金公司研究部
考虑宏观数据的领先滞后关系对于建模有两方面帮助:①可以通过领先指标对滞后指标进行预测;②可以在建模时优先纳入领先指标,谨慎使用滞后指标。但宏观数据数量庞大,难以通过主观分析的方式判断所有指标之间的领先滞后关系。本篇报告介绍三种通过数量化方法判断领先滞后关系的方法:线性回归、格兰杰因果关系检验和脉冲响应分析。
我们以PMI生产和工业增加值为例,来展示以上三种方法的具体应用流程和效果。由于PMI生产每月末公布当月值,工业增加值每月中公布上月值,因此在时序上我们将当月PMI生产与上月工业增加值对齐,即认为6月的PMI生产和5月的工业增加值是同期数据。
► 线性回归。线性回归是判断领先滞后关系最为简便的方式,以指标Y作为因变量,指标X的滞后项作为自变量,进行一元线性回归。如果回归系数显著,则认为X是Y的领先指标。拓展1:X可设置不同的滞后期,以检验不同时间长度的领先性,但这种做法容易带来较高的过拟合风险,建议只在具有明确经济学传导逻辑的指标间使用,不建议在海量指标间数据挖掘式的使用。拓展2:自变量中可加入Y的滞后项,从而将Y的序列相关性考虑在内。应用实例中,我们以当期工业增加值同比作为因变量,以上期PMI生产和上期工业增加值同比作为自变量,进行线性回归,可得上期PMI生产的回归系数为0.083,P值小于0.01,具有显著正向影响,即PMI生产对工业增加值具有显著领先性。反之,如果以当期PMI生产作为因变量,以当期工业增加值同比和上期PMI生产作为自变量,进行线性回归,可得当期工业增加值同比的回归系数为-0.10,P值大于0.1,经济学和统计学上有效性均较差,即工业增加值对下月PMI生产并不具有领先性。
► 格兰杰因果关系检验。格兰杰因果关系检验的实质是判断加入指标X的滞后性后,对指标Y建模的解释程度能否提高,原假设为X非Y的格兰杰原因,如果检验P值小于临界值,则拒绝原假设,认为X是Y的格兰杰原因。应用实例中,我们检测PMI生产是否为工业增加值的格兰杰原因,结果显示格兰杰因果关系检验的各项P值均小于0.01,即PMI生产对工业增加值具有显著领先性。反之,如果检测工业增加值是否为下期PMI生产的格兰杰原因,则各项P值均大于0.3,即工业增加值对下月PMI生产并不具有领先性。
► 脉冲响应分析。脉冲响应分析是VAR模型中的概念,指的是某个变量受到外生冲击时,其他变量会受到的动态影响。应用在宏观数据的领先滞后关系中,我们可以分析指标X受到外生冲击时,对指标Y下一期取值的动态影响,如果置信区间不包括0(0代表无脉冲),则可以认为X是Y的领先指标。应用实例中,我们检测PMI生产作为脉冲、工业增加值作为响应的结果,其置信区间均大于0,即PMI生产对工业增加值具有显著领先性。反之,如果检测工业增加值作为脉冲、下期PMI生产作为响应的结果,则置信区间包括0,即工业增加值对下月PMI生产并不具有领先性。
图表15:领先滞后关系判断方法对比
资料来源:Wind,中金公司研究部
2. 引入宏观预期数据
图表16:宏观预期数据在资产配置中的应用流程
资料来源:中金公司研究部
图表17:宏观预期数据在资产配置中的应用效果
资料来源:Wind,中金公司研究部
图表18:宏观预期数据在板块轮动中的应用流程
资料来源:中金公司研究部
图表19:宏观预期数据在板块轮动中的应用效果
资料来源:Wind,中金公司研究部
图表20:宏观预期数据在因子择时中的应用流程
资料来源:中金公司研究部
图表21:宏观预期数据在因子择时中的应用效果
资料来源:Wind,中金公司研究部
3. 判断宏观主要矛盾
图表22:市场主要矛盾存在动态变化
资料来源:Wind,中金公司研究部
图表23:准确判断宏观主要矛盾,可以较为显著的增厚择时效果
资料来源:中金公司研究部
我们在前述报告《量化配置系列(10):如何利用市场主要矛盾辅助大势研判》中,介绍了两种宏观主要矛盾的判断方法,分别为敏感型行业法和文本分析法,感兴趣的投资者可参考我们前述报告。
图表24:敏感型行业法判断宏观主要矛盾
资料来源:中金公司研究部
图表25:文本分析法判断宏观主要矛盾
资料来源:中金公司研究部
图表26:宏观主要矛盾对股市择时有一定帮助
资料来源:中金公司研究部
宏观数据的建模应用场景
宏观数据在实际投资中有着丰富的应用场景,本部分对业界常用的应用方式进行归纳,并展示中金量化团队的已有应用实践成果。
1. Nowcast
图表27:GDPNow建模流程
资料来源:Wind,中金公司研究部
下图展示了GDPNow在历次GDP公布前的最后一次预测情况。可以看到,2020年因新冠疫情的因素导致美国GDP出现较大变动,使得GDPNow在该年的预测误差较大,而在其他年份,GDPNow表现出了相对较好的预测能力,平均预测误差仅为0.05%。从历史预测效果看,GDPNow具有一定的实际应用价值。
图表28:GDPNow预测准确率相对较高
资料来源:Wind,中金公司研究部
2. 资产择时与配置
图表29:股市宏观流动性驱动指数择时效果
资料来源:Wind,中金公司研究部
图表30:债券宏观流动性驱动指数择时效果
资料来源:Wind,中金公司研究部
图表31:商品宏观流动性驱动指数择时效果
资料来源:Wind,中金公司研究部
逻辑线2:经济指标预期值。相比于经济指标实际值的低频性、滞后性和状态刻画性,经济指标预期值具有高频性、实时性和瞬时增量性,具体来说,经济指标预期值可以实现每天的实时动态更新,且经济指标实际值公布时的超预期情况是较大的瞬时信息增量。因此,我们认为经济指标预期值在战术资产配置中有更为重要的应用意义。我们在之前报告《量化配置系列(7):捕捉经济预期差,顺势配置资产》中,以国内重要经济指标的预期差数据为出发点,量化筛选对资产未来走势有显著影响的预期差数据,并构建了国内各资产的“预期差指数”,指数对国内股、债、商品短期的单资产择时以及多资产轮动具有良好的应用效果,感兴趣的投资者可参考我们前述报告。
图表32:股市预期差指数择时效果
资料来源:Wind,中金公司研究部
图表33:债券预期差指数择时效果
资料来源:Wind,中金公司研究部
图表34:商品预期差指数择时效果
资料来源:Wind,中金公司研究部
关键点:判断宏观主要矛盾。如我们在前文中所述,经济增长、宏观流动性、通胀等因素,都会在特定情景下成为影响当时股票市场走势的主要宏观矛盾。当不同宏观维度对资产未来走势的指示方向相反时,我们可以以主要矛盾维度的观点方向为准,从而提升资产择时准确率,对宏观数据在择时与配置中的应用效果起到“锦上添花”的作用。具体做法可参考上一章节相关内容。
图表35:宏观主要矛盾对股市择时有锦上添花的作用
资料来源:Wind,中金公司研究部
图表36:宏观数据在择时与配置中的“两条逻辑线”和“一个关键点”
资料来源:中金公司研究部
3. 行业轮动
图表37:在不同宏观经济状态下,给行业轮动因子不同的打分权重
资料来源:Wind,中金公司研究部
宏观数据预期值:选择当前超预期状态所利好的板块。我们认为近期公布宏观数据的超预期情况会影响投资者对于未来板块走势的观点,因此我们针对每个板块,量化筛选出了对其未来走势有显著预测效果的宏观预期数据,并根据宏观数据近期的超预期情况来判断各板块未来的相对表现。基于宏观超预期数据的板块轮动策略2013年至今超额收益稳定,日胜率较高。
图表38:使用宏观预期数据进行板块轮动的流程
资料来源:中金公司研究部
图表39:使用宏观预期数据进行板块轮动的效果
资料来源:Wind,中金公司研究部
4. 风格轮动
图表40:宏观状态影响成长/价值相对收益
资料来源:Wind,中金公司研究部
5. 行业景气度
图表41:利用中观数据判断行业景气度
资料来源:Wind,中金公司研究部
6. 因子选股
图表42:宏观预期数据的因子择时效果
资料来源:Wind,中金公司研究部
文章来源
本文摘自:2023年2月15日已经发布的《量化配置系列(12):宏观数据建模应用手册》
分析员 宋唯实 SAC 执证编号:S0080522080003 SFC CE Ref:BQG075
分析员 周萧潇 SAC 执证编号:S0080521010006 SFC CE Ref:BRA090
分析员 刘均伟 SAC 执证编号:S0080520120002 SFC CE Ref:BQR365
分析员 王汉锋 SAC 执业编号:S0080513080002 SFC CE Ref:AND454
法律声明
向上滑动参见完整法律声明及二维码
特别提示
本公众号不是中国国际金融股份有限公司(下称“中金公司”)研究报告的发布平台。本公众号只是转发中金公司已发布研究报告的部分观点,订阅者若使用本公众号所载资料,有可能会因缺乏对完整报告的了解或缺乏相关的解读而对资料中的关键假设、评级、目标价等内容产生理解上的歧义。订阅者如使用本资料,须寻求专业投资顾问的指导及解读。
本公众号所载信息、意见不构成所述证券或金融工具买卖的出价或征价,评级、目标价、估值、盈利预测等分析判断亦不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。该等信息、意见在任何时候均不构成对任何人的具有针对性的、指导具体投资的操作意见,订阅者应当对本公众号中的信息和意见进行评估,根据自身情况自主做出投资决策并自行承担投资风险。
中金公司对本公众号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。对依据或者使用本公众号所载资料所造成的任何后果,中金公司及/或其关联人员均不承担任何形式的责任。
本公众号仅面向中金公司中国内地客户,任何不符合前述条件的订阅者,敬请订阅前自行评估接收订阅内容的适当性。订阅本公众号不构成任何合同或承诺的基础,中金公司不因任何单纯订阅本公众号的行为而将订阅人视为中金公司的客户。
一般声明
本公众号仅是转发中金公司已发布报告的部分观点,所载盈利预测、目标价格、评级、估值等观点的给予是基于一系列的假设和前提条件,订阅者只有在了解相关报告中的全部信息基础上,才可能对相关观点形成比较全面的认识。如欲了解完整观点,应参见中金研究网站(http://research.cicc.com)所载完整报告。
本资料较之中金公司正式发布的报告存在延时转发的情况,并有可能因报告发布日之后的情势或其他因素的变更而不再准确或失效。本资料所载意见、评估及预测仅为报告出具日的观点和判断。该等意见、评估及预测无需通知即可随时更改。证券或金融工具的价格或价值走势可能受各种因素影响,过往的表现不应作为日后表现的预示和担保。在不同时期,中金公司可能会发出与本资料所载意见、评估及预测不一致的研究报告。中金公司的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本资料意见不一致的市场评论和/或交易观点。
在法律许可的情况下,中金公司可能与本资料中提及公司正在建立或争取建立业务关系或服务关系。因此,订阅者应当考虑到中金公司及/或其相关人员可能存在影响本资料观点客观性的潜在利益冲突。与本资料相关的披露信息请访http://research.cicc.com/disclosure_cn,亦可参见近期已发布的关于相关公司的具体研究报告。
本订阅号是由中金公司研究部建立并维护的官方订阅号。本订阅号中所有资料的版权均为中金公司所有,未经书面许可任何机构和个人不得以任何形式转发、转载、翻版、复制、刊登、发表、修改、仿制或引用本订阅号中的内容。