多因子选股模型系列一:因子筛选与综合打分1102.ppt
《多因子选股模型系列一:因子筛选与综合打分1102.ppt》由会员分享,可在线阅读,更多相关《多因子选股模型系列一:因子筛选与综合打分1102.ppt(15页珍藏版)》请在三一办公上搜索。
1、,陈健宓,陈,个指,(2,指数,选取,90,1,证券研研究报告/海海外研究/数数量化选股,日期:2012 年 10 月 31 日金融工工程袁冠群021-执业证书编号号:S08705120090001021-报告编号号:YGQ12-XXG01首次报告告日期:2012.10.31,多因子子选股模模型系列一一:因子子筛选与综合打分模型型概述因子选取本模型整整理计算得到能能反映未来股股价变动的五五大类指标:估值类(7个指标)、财务成长类类(14 个指标标)、财务质量量类(10 指标)、价量类(6 个指指标)、分析析师预期类(个指标),并对各因子子在不同的股票池中的的显著程度作了了判别,筛选选出对未来股
2、股价具有影响响力的因子。股票池划分模型用第 n-1 个月的各各项因子指标标来给股票池池中的每个股股票综合打分分,给出第 n 个月的选股股名单,因此模模型的股票池池为所有 A 股。我们又对代表大大盘股的沪深 300 指数和中中小盘股的中中证 500 数进行了单独研究。兼顾顾股票池中必必须保持一定定样本数量,和周期性行行业具有的波动性特点点,我们把所有有股票、沪深 300 和中证 500 三个股股票池进一步划分为周周期性行业和非非周期性行业业,股票分类类细化到三级级行业。得到9 个股票池池。模型时间选择考虑到样样本数据的有效效性,过早的的数据代表性性差,我们选 2005 年4 月-2011 年 1
3、0 月为分分析建模区间间,2011 年 11 月至 2012 年 9 月为模型检验区区间,分析建模模区间和模型型检验区间随随着时间的推推移而每月更新。,模拟拟组合结果,该组合每每月均能跑赢基基准指数,且且抗系统性风风险的能力相相当强,在绝大部分月月份中都取得了了正收益率,具有良好的的实际应用价价值。表 1:2005 年 4 月至 2012 年 9 月各模拟组合收益益率,所有 A股,所有周期性 A 股,所有有非周期性 A 股,HS300,HS300 非周期,HS300 周期,ZZ5000,ZZ500 非周期,ZZ500 周期,跑赢基准等权指数胜率月收益率差平均值绝对月收益率平均值负收益率概率,1
4、00%23.73%26.32%3/90,100%24.64%27.34%3/90,100%22.61%25.10%3/90,100%200.27%222.22%3/90,100%19.03%20.75%3/90,1000%20.117%22.228%5/90,1000%21.533%23.933%6/90,100%20.16%22.47%6/9,100%23.00%25.55%6/90,数据来源:上海海证券研究所重要提提示:请务必必阅读尾页分分析师承诺和和重要声明。,RGS,RGP,CFGS,2,数量化选股多因子选股模型简介多因子选股模型的要点在于通过收集大量的股票基本面、技术面和市场预期类数
5、据,对这些数据进行计算和筛选优化,找出对未来股价具有影响力的指标,这些指标也称为因子;并通过一系列统计方法确定各因子在给股票打分时的权重,从而给股票池中的所有股票打分,选出评分前列的股票作为模拟组合,观察这些股票相对于基准指数的收益,考察模型的有效性。1、因子计算方法我们从 wind 中导入各月度的单因子数据,经筛选整理计算得到能反映未来股价变动的五大类指标:估值类(7 个指标)、财务成长类(14 个指标)、财务质量类(10 个指标)、价量类(6 个指标)、分析师预期类(2 个指标)。各因子的计算方法如表 1 所示。对于估值类因子中的负值,我们将该指标剔除。在计算涉及增长率的指标时,我们取分母
6、的绝对值,避免了两期均为负数的指标的增长率转正。表 2:因子计算方法列表,因子指标估值类PETTMPETTMCUTPEGTTMPSTTMPCFTTMPBTTMEVEBITDA财务成长类RGTTMNPGSNPGPNPGTTM2012 年 10 月 31 日,名称市盈率扣除非经常损益的市盈率市盈率相对盈利增长率市销率市现率市净率企业价值倍数营业收入增长率-单季营业收入增长率-同比营业收入增长率-1 年(TTM)净利润增长率-单季净利润增长率-同比净利润增长率-1 年(TTM)经营性现金流增长率-单季,计算方法市值/最近 4 个季度归属母公司净利润市值/最近 4 个季度扣除非经常收益的净利润PE/最
7、近 4 个季度净利润增长率市值/最近 4 个季度营业收入市值/最近 4 个季度净现金流量市值/最近 4 个季度归属母公司权益剔除货币资金后的企业价值/最近 4 个季度税息折旧及摊销前利润当年单季度营业收入/上年同期营业收入-1当年当期营业收入/上年同期营业收入-1最近 4 个季度营业收入/上期 4 个季度营业收入-1当年单季度归属母公司利润/上年该季度归属母公司利润-1当年当期归属母公司利润/上年同期归属母公司利润-1最近 4 个季度归属母公司利润/上期 4 个季度归属母公司利润-1当年单季度经营性现金流/上年该季度经营性现金流-1,CFGP,ROE,ROA,3,数量化选股,经营性现金流增长率
8、-同比,当年当期经营性现金流/上年同期经营性现金流-1,CFGTTMROEGSROEGPROEGTTMROAGSROAGP财务质量类GPMPGPMTTMNPMPNPMTTMEMDRCF/NPEBITDA/revenue价量类PM1PM3PM6TM1TM3TM6分析师预期类INSNUMRATENUM,经营性现金流增长率-1 年(TTM)ROE 增长率-单季ROE 增长率-同比ROE 增长率-1 年(TTM)ROA 增长率-单季ROA 增长率-同比资本回报率(TTM)资产回报率(TTM)毛利率-同比毛利率-TTM净利率-同比净利率-TTM股权乘数有息负债率单位净利润现金流含量税息折旧及摊销前利润率
9、1 个月收益率3 个月收益率6 个月收益率1 个月换手率3 个月换手率6 个月换手率机构覆盖数量评级调整,最近 4 个季度经营性现金流/上期 4 个季度经营性现金流-1(本年单季度归属母公司净利润-上年该季度归属母公司净利润)/平均归属于母公司的净资产(本年当期归属母公司净利润-上年同期归属母公司净利润)/平均归属于母公司的净资产(最近 4 个季度归属母公司净利润-上期 4 个季度归属母公司净利润)/平均归属于母公司的净资产(本年单季度归属母公司净利润-上年同期归属母公司净利润)/平均总资产(本年当期归属母公司净利润-上年同期归属母公司净利润)/平均总资产最近 4 个季度归属母公司净利润/平均
10、归属于母公司的净资产最近 4 个季度归属母公司净利润/平均总资产当年当期营业毛利润/当年当期营业收入最近 4 个季度营业毛利润/最近 4 个季度营业收入当年当期净利润/当年当期营业收入最近 4 个季度净利润/最近 4 个季度营业收入当期总资产/当期净资产(当期短期借款+一年内到期借款+长期借款)/当期净资产单季度经营性现金流量/当期净利润最近 4 个季度税息折旧及摊销前利润/最近 4 个季度营业收入当前收盘价/1 个月前收盘价-1当前收盘价/3 个月前收盘价-1当前收盘价/6 个月前收盘价-1过去 1 个月平均换手率过去 3 个月平均换手率过去 6 个月平均换手率该季度内覆盖该只股票的卖方机构
11、总数该季度内分析师评级上调次数减下调次数,数据来源:Wind;上海证券研究所2、月度匹配原则我们用第 n-1 个月的各项因子指标来给股票池中的每个股票综合2012 年 10 月 31 日,4,数量化选股打分,给出第 n 个月的选股名单。考虑到财务报表数据取得的滞后性,每个月选择的最新财务季报日期有所不同,具体见表 2。表 3:财务报表数据匹配方法,月份t 年 1-3 月t 年 4-7 月t 年 8-9 月t 年 10-12 月,所用财务数据t-1 年 3 季报及之前数据t 年 1 季报及之前数据t 年半年报及之前数据t 年 3 季报及之前数据,数据来源:上海证券研究所3、股票池我们建立的多因子
12、选股模型可以给每一个股票进行因子评分,因此模型的股票池为所有 A 股。考虑到股票的市值不同对因子指标本身的影响,和后续指数研究的需要,我们又对代表大盘股的沪深 300指数和中小盘股的中证 500 指数进行了单独研究。兼顾股票池中必须保持一定样本数量,和周期性行业具有的波动性特点,我们把所有股票、沪深 300 和中证 500 三个股票池进一步划分为周期性行业和非周期性行业,股票分类细化到三级行业。得到 9 个股票池。表 4:周期性行业划分,行业分类一级行业二级行业三级行业,非周期行业采掘、黑色金属、建筑建材、房地产、金融服务石油化工、有色金属冶炼与加工、电气设备、通用电力、机械、金属制品、交运设
13、备服务、汽车零部件、汽车整车、港口、机场、航空运输、航运、物流、铁路运输、景点、酒店、旅游综合金属新材料、工程机械、重型机械、冶金矿采化工设备、楼宇设备、航空航天设备、船舶制造、铁,路设备、珠宝首饰数据来源:Wind;上海证券研究所2012 年 10 月 31 日,5,我们,分析,分析,数量化选股,图 1:模模型股票池划分,数据来源源:上海证券研研究所,4、时间间选择,考虑虑到样本数据的的有效性,过早的数据代代表性差,们选取 2005年 4 月-20011 年 10 月为分析建模区区间,2011 年 11 月至 2012 年 9 月,为模型检检验区间,析建模区间和和模型检验区区间随着时间间的推
14、移而更新。,5、单因因子有效性分,(1)将股票池里里的样本股票票按每一个待待测因子由高高到低的顺序排列,平均均分成五组。每组的因子子数值排序为 1,2,3,4,5。每月排列一次,分别计计算每一组的的次月平均收收益率,按从从高到低排序序,为 R1,R2,R3,R4,R5。,(2)计算组间月月平均收益率差差,分别是 R1-R5;(R1+R2-R4-R5)/2。,(3)计算 2005 年 1 月-2011 年 10 月间所所有月平均收收益率差的平,均值。如果果平均值0,则该因子的的影响总体是是正向的,即即因子值越大收益趋于于越大;如果平平均值0,则则反之。,(4)计算每个因因子的有效性,正向向(负向
15、)因子的的有效性=月月平均收益率差差为正(负)的月份数/,总月份数数。,(5)计算每个因因子的相关系系数和 P 值:,根据据每一组的自变变量因子数值值排序 1,2,33,4,5 和因变变量收益率按,2012 年 10 月 31 日,6,数量化选股,其数值大小顺序编号 1-5 进行一元回归可得该回归的相关系数和 P 值。,6、度量因子有效性的标准,(1)收益率差有效性标准:,在收益率排序和因子排序相关性检验 P 值0.05 的前提下,,“+”表示第 1 组-第 5 组和第 1、2 组-第 4、5 组平均收益,率差均大于 0.5%,有效性大于 60%。,“-”表示第 1 组-第 5 组和第 1、2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子 模型 系列 筛选 综合 打分 1102
链接地址:https://www.31ppt.com/p-2967158.html