来自 原油期货 2022-10-23 18:41 的文章

【深度报告——金融工程】基于机器学习的股指

  【深度报告——金融工程】基于机器学习的股指期货周频跨期套利策略构建咱们选用两合约众空跨期组合的收益率行动宗旨变量,从A股市集危机收益、套保需求、合约成交持仓境况、基差价差、跨期组合特色五个方面采纳特色,利用OLS、XGBoost、随机丛林算法辨别创办了预测模子,每周正在收益率预测绝对值最高组合中的两个合约上筑仓,由此修筑了周度调仓的跨期套利计谋。

  预测模子看待分别的输入变量以及分别的参数取值均浮现出了较好的稳重性。呆板研习集成算法的预测结果明显优于遍及线性回归,预测R方与计谋收益均是呆板研习算法占优,此中随机丛林的预测结果最好。咱们以为跨期组合特色与价差之间具有非线性的干系干系,使得树模子的浮现正在此场景中优于遍及线性模子。

  不加杠杆、不思考往还挫折本钱的境况下,中证500股指期货跨期套利计谋年化收益7.39%,年化振动1.84%,最大回撤1.05%,收益危机比4.02,收益回撤比7.03,换手率年均79倍。因为分别种类的振动不同,IC、IF、IH上的跨期套利计谋收益空间依序递减。沪深300股指期货跨期套利计谋年化收益4.63%,收益危机比3.25;上证50股指期货跨期套利计谋年化收益3.92%,收益危机比2.88。

  因为计谋换手率较高,测试了计谋对往还本钱的敏锐性:IC、IF、IH单边往还挫折本钱辨别抵达约6bp、4bp、3bp时,计谋的收益危机比将降至1以下。

  本文修筑的跨期套利计谋一方面适合谋求绝对收益、往还挫折本钱较低的小范畴资金,计谋危机较小;另一方面跨期信号对套维持仓的展期也有必然向导旨趣。

  跨期套利是基于对分别合约间价差的预测,正在分别合约上创办倾向相反、数目相当的头寸,获取合约间价差蜕化的收益。跨期套利计谋的经典思绪为统计套利与无危机套利,即正在价差偏离寻常区间或无危机套利区间时,给出套利信号。然而我邦的股指期货合约间价差受到较众外生变量影响,仅依托价差的史籍数据举行统计套利结果较差;此外融券做空本钱较高,期现套利机制不完备,无危机套利区间的上下界难以界定,也局限了无危机套利计谋的外现。

  贯串我邦股指期货而今的市集处境与行情,股指期货低频的中长周期跨期套利仍有必然的剩余空间。咱们回归到跨期套利的素质,基于对价差的预测修筑低频的跨期套利计谋,对往还本钱的容忍度更高,同时对展期计谋也有必然的参考价格。

  股指期货同时存续的4个合约组成6组价差,为了确保预测宗旨与计谋修筑的划一性,咱们选用两合约众空跨期组合将来个往还日的年化收益率行动预测的宗旨变量:

  设定分别的宗旨变量收益率的策画周期,取k=5、10、20,将跨期组合将来5日、10日、20日的收益率行动预测的宗旨变量;收益率预测窗口长度与最终落实到计谋的调仓周期则是彼此独立的,例如能够凭据将来5日收益率的预测结果举行日度的调仓,也能够凭据将来20日收益率的预测结果举行周度的调仓。

  预测模子方面,采纳OLS、XGBoost、随机丛林(Random Forest)三种模子举行教练与预测,三种算法辨别正在各自的算法种别中具有较强的代外性:OLS行动线性模子的代外;XGBoost与随机丛林则辨别是基于非线性的研习器的两种外率集成研习形式的代外。集成研习形式有两大类外率算法,一是个别研习器间存正在强依赖干系、串行教练一系列分类器的的Boosting形式,XGBoost算法是Boosting中比力外率和高效的算法;二是个别研习器之间不存正在强依赖干系、通过自助采样同时教练众个分类器的Bagging形式,随机丛林则是Bagging形式中的外率算法。

  创办预测模子对宗旨变量分散的安靖性有必然的央浼,所以起初视察宗旨变量的分散境况。看待一个订价较为充满的期货市集,到期克日分别的合约间价差该当顺服均值为0的正态分散;从史籍数据看,我邦的股指期货订价阅历了从不充满到较为充满的发达经过。

  时序维度上看,2015年至今股指期货的基差价差分散产生了宏壮蜕化:2015-2016年股指期货上市初期遭受股灾限仓,期指订价极不充满,跨期组合的收益率分散特别聚集,乃至无法酿成正态分散;2016年后跟着股指期货的慢慢松绑,股指期货的订价效能慢慢普及,跨期组合的收益率分散也慢慢向正态分散接近,分散样子的尾部有越来越薄的趋向,代外着套利收益空间正在逐渐缩减。能够看到2015-2016年宗旨变量的分散特色与2017年后的分散特色有明显不同,所以设定教练样本的开始年华从2017年发轫。2017年后的收益率分散特色较为划一,这也为咱们筑模预测奠定了底子。

  截面维度上看,合约间的到期克日相差越大,则价差以及价差的振动越大,跨期组合收益率的分散也就越平整,尾部越厚,代外着套利收益空间会跟着合约到期月份之差的添补而添补。这也饱动咱们正在后续的筑模中,有须要将合约到期月份之差行动一个特色,用以区别到期月份不同分别的跨期组合。

  除此以外,正在合约交割日当天,因为收盘价会向合约结算价接近,收盘基差与价差容易大幅偏离寻常水准,为了制止卓殊值影响模子的稳重性,涉及交割日收盘价的数据做了删除打点。

  正在之前的专题陈说中咱们总结了股指期货基差剖判的三因子框架,斟酌了股指期货基差克日机闭的特质,获得了股指期货的基差与价差蜕化具有划一性的结论,所以正在采纳特色时,咱们参考基差的影响成分,并异常插足了跨期组合特有的特色,组成预测跨期组合收益率的因子池。预测跨期组合收益率所选特色能够分成五大类:A股市集危机收益特色、套保需求、合约成交持仓境况、合约基差与价差、跨期组合特色。

  A股市集的短期以及长久危机收益特色对股指期货基差价差均有明显影响。短期来看,当A股市集振动较大,格外是超预期事宜驱动宽基指数映现大涨和大跌时,股指期货上的渔利力气往往会猛然添补,实在展现为合约的成交持仓比攀升,此时不再是套保移仓换月而是渔利往还更易驱动基差价差蜕化。

  长久来看,A股市集的危机收益特色也会影响到Alpha收益、中性计谋收益、CTA计谋收益,进而影响到股指期货的套保、渔利以及套利收益,间接地对股指期货的基差价差发作影响。

  最终咱们从收益、振动、换手率、市集气概四个方面采纳了量度A股市集危机收益特色的变量,如外3所示。收益方面,采纳期货标的指数的收盘价、收益率数据和全A指数的收盘价与收益率数据;振动方面,采纳期货标的指数的史籍振动率,以及指数因素股收益率的横截面程序差(因素股收益率之差能够外征潜正在的Alpha收益空间);换手率方面,采纳了全A指数的换手率与期货标的指数的换手率目标;市集气概方面,采纳了紧要宽基指数之间的收益率之差、收益率之差的振动率以及换手率的比值。

  Alpha收益会影响到中性计谋的浮现,进而影响到中性计谋的范畴,最终影响到中性计谋产物的股指期货空头持仓范畴。与直觉相悖的是,当市集连续下跌时,股指期货的空头套保力气并不会添补,基差有时反而有收敛趋向,这是因为中性计谋进献了股指期货紧要的空头持仓,市集下跌时Alpha计谋往往也浮现不佳,导致中性计谋范畴的萎缩,反而会导致股指期货的空头套保需求低重。所以采纳A股市集Alpha收益、中性计谋收益、中性计谋范畴干系的目标行动预测变量是有须要的。实在采纳目标时,一方面采纳了公募与私募的指数巩固基金相看待跟踪指数的逾额收益外征Alpha收益境况,另一方面采纳了公募与私募的中性计谋产物的收益、范畴与数目干系的目标。此外ETF的范畴、资金流入、融券余额等目标也与市集套保需求干系,也纳入了特色筛选中。

  成交持仓数据也许反应股指期货的往还机闭,进而对股指期货的基差价差有必然的预测才干,所以采纳了会员持仓众空净头寸、种类总持仓、种类总成交、成交持仓的环比蜕化、成交持仓比、期现成交比等目标纳入特色筛选。会员持仓众空净头寸也许反应紧要会员的众空强弱力气,该值消重往往对应着空头套保需求的添补;持仓量与成交量的蜕化能够反应众空差异水准、市集渔利激情等,对股指期货基差价差发作间接影响;成交持仓比与期现成交比能够反应期货种类的渔利力气强弱,A股振动率的添补往往伴跟着成交持仓比的攀升。

  股指期货的基差与价差走势也流露必然的趋向与反转特色,短期内价差振动较大或处于史籍尽头值,往往很疾会迎来反转;中长久内基差与价差走势则有必然的趋向性。贯串咱们对基差价差蜕化顺序的侦察,采纳了剔除分红的年化基差率、跨期升贴水率、百分位数以及基差克日机闭干系目标纳入特色筛选。

  咱们的宗旨变量是实在到2个合约的收益率差,两个实在合约的量价目标会对价差发作影响:

  (1)合约滚动性的不同会对价差发作影响,咱们用两合约成交量、持仓量、成交持仓比的比值或差值来量度这种不同;

  (2)合约隔绝到期日的天数会对价差发作影响,合约邻近到期时基差会加快收敛,假若远期合约不跟班收敛,则价差会有所蜕化,咱们用两合约隔绝到期日天数来量度这种影响;

  (3)价差的蜕化有必然的时节性特色,咱们策画了跨期组合两合约对应月份、对应到期克日史籍同期将来收益率的均值,用来外征跨期价差的时节性顺序;

  (4)前文咱们也提到了,两合约之间的到期克日相差越大,价差的振动往往越大,咱们用两合约之间到期月份之差来量度这种不同的影响。

  从上述五个能够对价差有影响的方面起程,叠加单个目标能够有分别的参数,咱们开端获得了200众个特色,有须要做进一步的筛选打点。咱们盼望用于预测的特色既与宗旨变量有较强的干系性,也能从逻辑上有必然的经济寄义,以是咱们起初贯串单变量与宗旨变量的干系性做了开端的手动筛选,筛选的程序为:起初看待有众个策画参数的变量,保存与宗旨变量干系性最强的参数,或辨别保存一个较小与一个较大参数;看待统一种别内部干系性较高的变量,仅保存主观上蓄志义的或者与宗旨变量干系性较强的变量;每个细分种别须要留下起码一个变量。手动筛选后保存了约70个驾御的特色。

  随后咱们利用目标聚类对这70众个特色做进一步的降维打点。实在算法咱们利用了自底而上的目标聚类法(Agglomerative):初始每个变量自成一类,起初策画类两两之间的隔绝,依照隔绝最短或者耗费最小的法则举行兼并,然后策画新的类与未兼并的类的隔绝,并一再迭代这一进程。类间隔绝能够有分别的策画形式,这里咱们利用Ward法行动兼并类的标准,与直接策画类间隔绝有少许区别,Ward法界说了ESS(Error Sum of Squares)行动量度音信耗费的标准,每次兼并的程序是,使得新兼并后新类的ESS之和相较于兼并前的ESS之和的伸长最小。此中类的ESS的策画公式为:

  凭据聚类的进程音信,咱们能够指定最终思要获得的类的数目,然后正在每一类落选择与宗旨变量干系性最高的变量,告竣最终的降维。

  咱们对全体特色重心做了降维、程序化和滞后打点。第4章节中咱们依然通过聚类已毕了特色的降维,正在举行拟合之前,咱们联合对全体特色做了zscore程序化打点,测试集利用教练集的均值与方差举行程序化;看待日度目标通盘做滞后一期打点,确保咱们正在往还日当天用于预测的变量正在上一往还日收盘后是能够拿到的;看待公募以及私募产物的数据,通盘凭据数据布告年华做了滞后打点。

  本文采用重叠滚动窗口的体例划分教练集与测试集,正在每个往还日,利用过去X个往还日的数据教练模子,然后利用当日可得数据预测每一组跨期组合将来K个往还日的收益率,于是咱们正在每个往还日都能够获得每一个跨期组合将来收益率的预测值。这里X咱们测验取值125、250、375与500,辨别对应利用半年、一年、一年半、两年的数据样本行动教练集;K咱们这里取5、10、20,辨别对应将将来约1周、2周和1个月的收益率行动宗旨变量。正在后续的调参和滚动预测中咱们利用同样的样本划分形式。

  利用OLS、XGBoost与随机丛林创办价差组合收益率的预测模子。模子教练中的耗费函数以及预测结果评议均利用均方偏差。举行预测之前,咱们依照上节所述样本划分形式对XGBoost和随机丛林模子举行了调参。

  咱们凭据获得的跨期组合将来5日、10日、20日收益率的预测结果辨别修筑日度、周度以及月度调仓的跨期套利计谋,比力分别模子与分别参数下的计谋结果。下面依然先以中证500股指期货为例显示回测结果。

  看待跨期套利计谋而言,日度调仓的换手率过高,月度调仓容易错过少许往还时机,所以咱们优先视察周度调仓下的计谋结果。图外11-14显示了分别模子以及分别参数下的跨期套利计谋回测结果,模子看待分别的输入变量以及分别的参数取值均浮现出了较好的稳重性:

  比力分别模子的预测结果,呆板研习集成算法明显优于遍及线性回归,预测R方与计谋收益均是呆板研习算法占优,此中随机丛林的预测结果是最好的;

  比力分别参数下的回测结果,起初模子对滚动窗口长度不敏锐,利用过去半年至2年的数据行动教练集对结果影响不大,所以能够折落选择一年长度的滚动窗口;模子看待输入的特色浮现出了较好的稳重性,然而能够察觉输入的特色数目较众时模子浮现较优;咱们也测验利用了5日、10日、20日收益率预测结果向导周度调仓,结果察觉利用20日收益率预测值的计谋浮现不睬思,凭据5日、10日收益率的预测值调仓浮现较好;最终测试了计谋看待调仓时点的稳重性,结果显示周一至周五调仓下计谋均有明显收益,周一和周五调仓计谋浮现略差,周二至周四调仓计谋浮现较好,能够与周五周一涉及交割与新合约上市相闭。

  归纳以上参数敏锐性测试结果,通过聚类抉择60个特色行动模子输入,利用随机丛林预测跨期组合将来5日收益率,滚动利用过去一年的样本行动教练集拟合模子,并正在每周三调仓,能够修筑浮现较优的股指期货跨期套利计谋,不加杠杆、不思考往还挫折本钱的境况下,2018年今后中证500股指期货跨期收益率预测样本外R方39.7%,据此修筑的跨期套利计谋年化收益7.39%,年化振动1.84%,最大回撤1.05%,收益危机比4.02,收益回撤比7.03,换手率年均79倍。

  上节咱们看到呆板研习模子浮现出了明显优于线性模子的预测结果,于是咱们辨别罗列了2022年OLS、XGBoost、RForest模子拟合中首要性排名前10的特色,测验剖判此中的道理。

  能够看到OLS的首要特色与XGB、RF有明显的分别。呆板研习模子排名前10的特色中,跨期组合特色干系的变量占比力高,蕴涵时节性、近月合约隔绝到期日的天数、近远月合约持仓比值等,此外跨期价差率的首要性排名也比力靠前,这与咱们对跨期套利时机的主观鉴定高度划一;而跨期组合特色干系的变量简直没有映现正在OLS首要性排名前10的特色列外中。直觉上咱们以为跨期组合特色干系的变量看待预测价差来说是很首要的,然而跨期组合特色干系的变量确实更适适用来“分类”而不是“线性外推”,所以跨期组合特色干系变量与跨期收益率的线性干系性也不会格外高,树模子浮现出了更好的预测职能便也能够分解了。

  除了特色正在分别模子中的首要性不同,咱们也闭切分别年华段首要特色的不同。图外17罗列了2018年今后每年随机丛林模子首要性排名前10的特色,能够看到分别年份的首要特色确实有少许不同。跨期价差率的史籍数据与百分位数看待价差预测来说向来比力首要,比力适宜咱们的主观直觉;2019年发轫私募基金发达比力连忙,私募中性计谋干系变量也从2019年发轫首要性有所晋升;2021年发轫受场外衍生品影响,IC的基差与指数流露出较昭着的负干系,顺序与往年有所不同,能够看到指数与当季合约基差的干系性变量首要性正在2021年有所晋升。

  仍然利用上节的回测参数,咱们将该计谋拓展至沪深300股指期货与上证50股指期货,也博得了较好的收益。沪深300股指期货跨期套利计谋年化收益4.63%,最大回撤-0.76%,收益危机比3.25,收益回撤比6.06,换手率年均83倍;上证50股指期货跨期套利计谋年化收益3.92%,最大回撤-0.74%,收益危机比2.88,收益回撤比5.29,换手率年均86倍。

  中证500股指期货是振动最大、成交最活动的种类,价差的更高振动带来了跨期套利计谋的更高收益,从IC、IF至IH,跨期套利计谋的收益空间逐次递减。咱们留心到假使是周度换仓,计谋的换手率也非凡高,下面咱们调能手续费,测试计谋对往还本钱的容忍度。IC、IF、IH对往还本钱的容忍度辨别大约为6bp、4bp、3bp,逾越这个本钱计谋夏普比将小于1。

  本文改进性的操纵呆板研习集成算法修筑了股指期货跨期组合收益率的预测模子,跨期组合特色与价差之间的非线性干系,使得呆板研习修筑的跨期套利计谋明显优于遍及的线性模子。周度换仓的跨期套利计谋换手率仍然较高,适合谋求绝对收益、往还挫折本钱较小的小范畴资金操纵,计谋危机较小;此外对跨期信号对套维持仓的展期也有必然向导旨趣。

  冲破性发扬 新一代“人制太阳”鼎新运转记录!核聚变行业参加将连续加大 这些公司希望受益

  千亿蓝海待升起 世界全体地级市将扩充可降解塑料 市集空间希望大幅晋升!2只观点龙头市盈率缺乏10倍

  近4亿元,罗永浩的“最终一次创业”拿到融资了!估值10-15亿,这个大厂领投,要做下一个苹果

  万亿“宁王”亮功绩!第三季度净利润大增188% 动力电池与储能“双翼齐飞”

  万亿“宁王”亮功绩!第三季度净利润大增188% 动力电池与储能“双翼齐飞”

  投资者干系闭于同花顺软件下载功令声明运营许可相干咱们交谊链接雇用英才用户体验安排涉未成年人违规实质举报算法推选专项举报

  不良音信举报电话举报邮箱:增值电信营业策划许可证:B2-20090237