机构调研特征:调研数量稳步上升,调研股票偏中小市值,存在行业偏向
设置回测区间为2013/8/30~2023/1/31,机构调研数量因子认为调研次数越多意味着机构投资者的关注度越高,越有可能获得机构投资者买入,回测区间内因子多头超额收益显著。在被机构调研的股票中,需要规避前期上涨过多的股票,同时更多关注股价还在低位的股票,可根据该逻辑构建机构调研股票池内的反转因子,回测区间内因子的负向剔除效果显著。我们还对机构调研问答的文本进行利用,意在提取调研问答中的正负面信息,遗憾的是在尝试了多种文本学习方法后,均未构建出效果较好的因子。
风险提示:因子测试、机器学习模型和量化选股模型是历史经验的总结,存在失效可能。机构调研股票总体偏中小市值,在大市值股票占优的极端行情中,策略可能表现不佳。
01 研究导读
02 A股机构调研概况
机构调研数量呈稳步上升趋势
证券公司、基金公司和投资公司是市场调研主力
机构调研股票偏中小市值,市值中位数接近中证1000
机构调研数据存在行业偏向性,电子、计算机、医药等行业关注度较高
03 机构调研相关的因子构建和测试
机构调研数量因子
基础机构调研股票池内的反转因子
基础机构调研股票池内的分析师研报文本因子
基础机构调研股票池内的一致预期因子
机构调研问答文本因子
04 机构调研选股策略构建和测试
选股策略1构建和测试
选股策略2构建和测试
05 总结
风险提示
06 附录:Barra风格因子
01 研究导读
机构调研信息反映了上市公司接待投资机构上门调研或是通过策略会、业绩发布会等形式进行信息披露的具体情况。上市公司的机构调研次数越多也意味着机构投资者的关注度越高,更可能获得机构投资者买入。但在实际调研中,并非所有调研内容都传达出关于上市公司的正面信息,如何甄别调研相关的正负面信息是值得研究的问题。本文将从3个方向展开研究:
本文使用的数据如下图所示。
02 A股机构调研概况
机构调研数量呈稳步上升趋势
我们首先统计A股市场中调研数量随时间的变化情况,原始数据来自于Wind数据库中的AshareISActivity(中国 A 股机构调研活动)和AShareISParticipant(中国A股机构调研参与主体)两张表。由于有大量多对一调研(即多个机构调研同一家上市公司)的存在,我们将分别展示多对一调研合并与否的统计结果。
对每月的调研总次数进行统计,可以看出对于不合并多对一调研的统计结果,月度调研次数自2011年以来持续上升,2020年后调研次数增加速度加快。而对于合并多对一调研的统计结果,在2013年至2020年期间数量变化不大,2020年以后也出现明显增长。
证券公司、基金公司和投资公司是市场调研主力
参与调研的投资机构主要包括保险公司、基金公司(公募基金)、外资机构、投资公司(私募基金)和证券公司等。从调研数的占比来看,证券公司、基金公司和投资公司三种机构的调研次数总占比在2014年至2022年均保持在80%以上,是参与上市公司调研的主要投资机构。通过调研机构的占比变化趋势可以看出,自2020年开始证券公司的调研次数占比开始下降,与此同时基金公司的调研次数有所增加。
从具体调研活动类型来看,特定对象调研的占比最高,2018年以前占比达到70%以上,2018年以后比例开始下降但仍处于50%以上。特定对象调研主要是指从事证券交易或者能够传播有关信息的机构或个人对上市公司的调研活动。以特定调研为主的机构调研活动都必须记录在案,但是并不强制进行公开。不同类型的调研活动都值得参考,都能够反映投资机构对上市公司的关注程度,后文在进行统计和因子构造时将使用所有类型的调研活动数据。
机构调研股票偏中小市值,市值中位数接近中证1000
从被调研股票市值中位数的月度变化趋势来看,被调研股票的市值中位数保持在100亿元左右,说明各类投资机构偏好对中小市值股票进行调研,机构调研股票的市值中位数接近中证1000。
机构调研数据存在行业偏向性,电子、计算机、医药等行业关注度较高
从行业层面对被机构调研的股票进行分析,可知不同行业之间的受关注度存在差异,电子、计算机、医药、家电等行业关注度较高,2014年至2022年的年平均被调研次数都在30次以上,2021年以来年平均被调研次数在90次以上。相比之下,非银行金融、综合、煤炭、交通运输等行业关注度较低,年平均被调研次数均在10次以下。
各行业之间调研数据的差异也反映了投资者对于不同行业的偏好,调研次数较高的电子、计算机等成长行业和家电、食品饮料等消费行业正是2020至2021年的投资热门,而随着疫情的来临,医药行业也从2020年开始受到机构投资者的关注。
同时需要注意的是,个股的被调研次数不仅与市场的投资偏好有关,同样受到行业的经营模式和投资逻辑的影响。煤炭、石油化工等周期性行业以及金融类行业的投资逻辑相对清晰,可以通过年报和财务报表等公开数据对公司的盈利进行估计,因此调研需求也较少。相比之下,电子、计算机等行业的经营模式较复杂,需要大量调研以对上市公司进行深入研究。
03 机构调研相关的因子构建和测试
本章将在给定的机构调研股票池内,对多个因子进行测试。基础的机构调研股票池使用如下方式确定:
1.考虑调研信息的时效性,只保留调研日期和公布日期在10个自然日内的调研事件。
2.对于机构的类型,本文不做筛选。部分机构调研相关研究只筛选公募基金参与的调研,我们统计发现由于大量多对一调研的存在,实际上公募基金参与了约80%的调研活动,因此本文不对机构类型进行挑选。
3.对于调研活动的类型,本文也不做筛选。
4.对于多对一调研,本文只统计一次调研事件。
5.在每月第一个交易日,回看过去60个交易日的调研事件,满足上述4个条件的股票进入基础机构调研股票池。
由以上方式确定的基础机构调研股票池股票数量如下图所示。将基础机构调研股票池内股票进行等权配置,该组合相对沪深300和中证500具有一定超额收益,但超额收益并不稳定。
接下来我们将对多个机构调研因子进行测试,以求在现有股票池内得到更高的收益。因子测试方法如下:
1. 股票池:基础机构调研股票池,剔除ST类股票,剔除每个截面期下一交易日停牌的股票。
2. 回测区间:2013/8/30~2023/1/31。
3. 调仓周期:月频调仓,每个月第一个交易日以vwap价格成交。
4. 因子预处理:因子进行去极值、标准化。
5. 测试方法:IC值分析,因子分5层测试,分层测试中交易费用为双边千分之三。
机构调研数量因子
机构调研数量因子的逻辑简单清晰,即认为上市公司的机构调研次数越多意味着机构投资者的关注度越高,越有可能获得机构投资者买入。我们在前期报告《行业配置策略:机构调研视角》(2021.3.28)中已经通过事件测试的方式,验证了机构调研次数越多的股票,未来一段时间超额收益为正的概率越高。本节将测试机构调研数量因子的选股效果。
在每个月末截面,我们统计过去90个自然日个股的机构调研次数作为股票的因子,该因子的测试结果如下。可知因子的多头组合(组合1)超额收益显著,但在2021年后有明显回撤。单独使用机构调研数量因子构建策略可能提升有限,我们接下来将测试更多因子。
基础机构调研股票池内的反转因子
有些情况下,可能是由于股价前期已出现上涨从而吸引了机构投资者的注意力,才会发生针对该股票的调研事件,此时股票的上涨预期已部分兑现,调研后是否会延续上涨存在较大不确定性。因此在发生机构调研的股票中,可能需要规避前期上涨过多的股票,而更多关注股价还在低位的股票,这实际上是机构调研股票池内的一种股价反转效应。本节将使用因子测试的方式验证该效应的存在。
基础机构调研股票池内的反转因子构造方法是:在每个月末截面,计算过去60个交易日个股的收益率并取相反数,该因子的测试结果如下。
可知基础机构调研股票池内反转效应较显著,特别是前期涨幅较大的股票(对应组合5)超额收益表现最差,但组合1超额收益不明显,因此可使用反转因子在股票池内进行负向剔除。
基础机构调研股票池内的分析师研报文本因子
参加机构调研的卖方分析师可能会在调研后撰写相关公司的研究报告,挖掘分析师在报告中传达的信息能为机构调研选股提供增量信息。本节我们将参照《文本 PEAD 选股策略》(2022.1.7)中的方法,构建并测试基础机构调研股票池内的分析师研报文本因子,步骤如下:
1. 训练集和测试集研报筛选:以年度为单位构建训练集和测试集。例如若2022年的数据为训练集,则先确定2022年公布调研事件的股票,再筛选出这些股票2022年的研报文本数据作为训练集。类似地可构建出2023年的研报文本数据作为测试集。
2. 词频矩阵特征X构建:对训练集的每篇研报的标题和摘要计算词频矩阵,分别得到200词的标题词频矩阵和1000词的摘要词频矩阵。同理生成测试集的词频矩阵。
3. 标签y构建:计算研报对应股票在研报入库时间前后一个交易日相对中证500的超额收益。令超额收益排名前50%的股票标签为1,排名后50%的股票标签为0。
4. 模型滚动训练和测试:使用训练集的数据训练XGBoost模型,并在测试集上测试。每年滚动训练测试,滚动区间为2013年至2023年。
分析师研报文本因子的测试结果如下。长期来看,因子的分层效果较好,多头组合(组合1)超额收益较显著。
基础机构调研股票池内的一致预期因子
对于机构调研股票池内分析师信息的挖掘,除了利用研报文本,还可利用分析师一致预期数据,例如股票在调研期间的一致预期EPS发生变化,可能表明分析师根据调研信息对盈利预测做出了调整。本节将测试一致预期EPS季度环比变化率因子的表现,测试结果如下。可知因子的多头组合(组合1)超额收益显著,但在2021年后有一定回撤。
机构调研问答文本因子
在实际调研中,并非所有调研内容都传达出关于上市公司的正面信息,如何甄别具体调研的正负面信息是值得研究的问题。本节对机构调研问答的文本进行了利用,意在提取调研问答中的正负面信息。对于文本信息的学习,我们使用了《基于BERT的分析师研报情感因子》(2021.1.8)中的情感模型打分方法以及《文本 PEAD 选股策略》(2022.1.7)中的收益率为标签的模型方法,另外还尝试了正则表达式法,但遗憾的是,均未构建出效果较好的因子。其中正则表达式法的逻辑较为简单,我们将对方法进行说明,供读者参考。
本文使用Wind数据库中的中国A股机构调研问答明细(AShareISQA)表来构建机构调研问答文本因子。因子构建方法如下:
1.将机构调研问题和内容拼接。
2.针对每段拼接的文本,匹配23条代表正负面信息的正则表达式,求和得到正则表达式得分。下方为4条正则表达式的举例,其中正面表达式得分为1,负面表达式得分为-1。
"((盈利)|(利润)|(业绩)|(营收)|(业务)).*((增长)|(增加)|(提升)|(上升)|(创新高)|(提高))" 正面
"((盈利)|(利润)|(业绩)|(营收)|(业务)).*((降低)|(减少)|(大跌)|(下滑)|(下降)|(创新低))" 负面
"((财政)|(政策)|(政府)|(监管)).*((支持)|(扶持)|(补贴)|(推动)|(红利))" 正面
"((财政)|(政策)|(政府)|(监管)).*((整改)|(调整)|(不确定))" 负面
3.在每个交易日T,对个股过去60个交易日的正则表达式得分求均值,得到T日的机构调研问答文本因子。
下图为双星新材(002585 CH)的某次调研问答信息和正则表达式得分举例。
机构调研问答文本因子的测试结果如下。
从以上测试中可知机构调研问答文本因子的分层测试并不单调,未体现出显著的选股能力。
04 机构调研选股策略构建和测试
本章中,我们将基于上一章中测试的因子,构建机构调研选股策略。由于机构调研股票池包含的股票有限,我们将不使用常规的因子选股方法构建策略,而是使用因子对股票池进行层次式筛选,最终形成一个逻辑简明的量化选股策略。
选股策略1构建和测试
考虑到分析师类因子和反转因子较好的负向选股能力,首先使用这些因子对机构调研股票池进行负向股票剔除,再用调研数量因子正向选股。选股策略1构建步骤如下:
1.将研报文本因子和一致预期EPS季度环比变化率因子标准化后等权合成,在每个调仓日剔除合成因子排名后ratio1的股票。
2.在第1步筛选的股票中,计算过去60个交易日个股相对中证500的累积超额收益,在每个调仓日剔除超额收益排名前ratio2的股票。
选股策略1中有ratio1和ratio2两个参数,我们对两个参数进行遍历,策略的年化超额收益率和超额收益最大回撤如图表23和图表24。反转效应的引入对于策略超额收益的提升非常明显,即随着ratio2的减小,策略的年化超额收益率整体呈现提升趋势。使用研报文本因子和一致预期因子进行负向剔除也呈现出一定优化效果,当ratio1=0.1时策略的年化超额收益率整体更高。但不同参数组合下策略的超额收益最大回撤没有体现出明显的规律。
我们选择几组参数的结果,将详细回测结果展示如下。
当ratio1=0.1,ratio2=0.6时,选股策略1的回测净值和超额收益如下。
当ratio1=0.1,ratio2=0.6时,选股策略1的Barra风格因子暴露和排名前10的行业暴露如下。从Barra风格因子暴露上来看,策略具有高估值、高成长、高Beta的属性。Barra风格因子的说明请参见附录。
选股策略2构建和测试
选股策略1使用研报文本因子和一致预期EPS季度环比变化率因子进行负向股票剔除。考虑到这两个因子的多头也有较好表现,我们在选股策略2中将使用这两个因子进行正向股票筛选。选股策略2的构建方式如下:
1.在每个调仓日计算过去60个交易日个股相对中证500的累积超额收益,在每个调仓日剔除超额收益排名前ratio的股票。
2.在第1步筛选的股票中,将调研次数因子、研报文本因子和一致预期EPS季度环比变化率因子标准化后等权合成,选取合成因子排前30的股票,等权配置。
3.策略在每月第一个交易日以当日vwap价格调仓,交易成本为双边千分之三。
我们将选股策略2中参数ratio进行遍历,策略的年化超额收益率和超额收益最大回撤如下图。相比选股策略1,选股策略2的年化超额收益率随参数的波动范围更小。选股策略1的收益弹性更强。
不同参数的详细回测结果展示如下。
当ratio=0.1时,选股策略2的回测净值和超额收益如下。
05 总结
随着A股市场成熟度逐渐提高,机构投资者的行为对市场影响不容忽视。机构调研信息记录机构投资者对上市公司调研的具体情况,可实时得知机构的关注热点,获得传统市场信息之外的增量信息。但在实际调研中,并非所有调研内容都传达出关于上市公司的正面信息,如何甄别并利用调研相关的正负面信息是值得研究的问题。本文使用文本分析方法,构建基于机构调研问答文本和调研相关的分析师研报文本的因子,并测试了一致预期和反转因子。最后我们利用前期测试的因子,使用层次筛选法构建了机构调研选股策略,相对中证500长期超额收益显著。
机构调研特征:调研数量稳步上升,调研股票偏中小市值,存在行业偏向。2012年以来A股机构调研数量稳步上升,2020年后呈现加速上涨趋势,机构调研活动日趋频繁。从调研数的占比来看,证券公司、基金公司和投资公司三种机构的调研次数总占比在2014年至2022年均保持在80%以上,是参与上市公司调研的主要投资机构。机构调研股票的市值分布接近中证1000,偏向中小市值股票。此外,机构调研数据存在行业偏向性,电子、计算机、医药等行业关注度较高。
调研数量因子和反转因子表现较好,调研问答文本因子选股效果不佳。设置回测区间为2013/8/30~2023/1/31,机构调研数量因子认为调研次数越多意味着机构投资者的关注度越高,越有可能获得机构投资者买入,回测区间内因子多头超额收益显著。在被机构调研的股票中,需要规避前期上涨过多的股票,同时更多关注股价还在低位的股票,可根据该逻辑构建机构调研股票池内的反转因子,回测区间内因子的负向剔除效果显著。我们还对机构调研问答的文本进行利用,意在提取调研问答中的正负面信息,遗憾的是在尝试了多种文本学习方法后,均未构建出效果较好的因子。
机构调研股票池内的分析师研报文本因子和一致预期因子表现较好。参加机构调研的卖方分析师可能会在调研后撰写相关公司的研究报告,挖掘分析师在报告中传达的信息能为机构调研选股提供增量信息。本文分别测试了基础机构调研股票池内的分析师研报文本因子和一致预期因子。设置回测区间为2013/8/30~2023/1/31,分析师研报文本因子和一致预期因子均有较好的选股能力,因子多头具有显著超额收益。
使用层次筛选法构建机构调研选股策略,相对中证500长期超额收益显著。基于前期测试的因子,我们使用层次筛选法构建了2个月频调仓的机构调研选股策略。选股策略1首先使用分析师类因子和反转因子对机构调研股票池进行负向股票剔除,再用调研数量因子选择30只股票构建组合。选股策略2首先使用反转因子对机构调研股票池进行负向股票剔除,再用调研数量因子和分析师类因子选择30只股票构建组合。总体来看选股策略1的收益弹性比选股策略2更大。设置回测区间为2013/8/30~2023/1/31,在最优参数组合下,选股策略1的年化收益率为29.03%,相对中证500的年化超额收益率为22.17%,信息比率为2.09。
风险提示
因子测试、机器学习模型和量化选股模型是历史经验的总结,存在失效可能。机构调研股票总体偏中小市值,在大市值股票占优的极端行情中,策略可能表现不佳。
06 附录:Barra风格因子
本文使用的Barra USE4模型包含十个风格因子,其具体定义如下:
相关研报
研报:《华泰金工:利用文本和反转改进机构调研选股》2023年02月09日
林晓明 S0570516010001 | BPY421
李子钰 S0570519110003 | BRV743
何 康 S0570520080004 | BRB318
关注我们
https://inst.htsc.com/research
访问权限:国内机构客户
https://intl.inst.htsc.com/mainland
免责声明
▲向上滑动阅览
本公众号不是华泰证券股份有限公司(以下简称“华泰证券”)研究报告的发布平台,本公众号仅供华泰证券中国内地研究服务客户参考使用。其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,且若使用本公众号所载内容,务必寻求专业投资顾问的指导及解读。华泰证券不因任何订阅本公众号的行为而将订阅者视为华泰证券的客户。
本公众号转发、摘编华泰证券向其客户已发布研究报告的部分内容及观点,完整的投资意见分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本公众号内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华泰证券所发布的完整报告。
本公众号内容基于华泰证券认为可靠的信息编制,但华泰证券对该等信息的准确性、完整性及时效性不作任何保证,也不对证券价格的涨跌或市场走势作确定性判断。本公众号所载的意见、评估及预测仅反映发布当日的观点和判断。在不同时期,华泰证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。
在任何情况下,本公众号中的信息或所表述的意见均不构成对任何人的投资建议。订阅者不应单独依靠本订阅号中的内容而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。订阅者若使用本资料,有可能会因缺乏解读服务而对内容产生理解上的歧义,进而造成投资损失。对依据或者使用本公众号内容所造成的一切后果,华泰证券及作者均不承担任何法律责任。
本公众号版权仅为华泰证券所有,未经华泰证券书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。如因侵权行为给华泰证券造成任何直接或间接的损失,华泰证券保留追究一切法律责任的权利。华泰证券具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。