本篇文章5531字,读完约14分钟
在遇到突发事件时,通过运用arma和多元回归模型,可以更好地把握价格的走势
建模目的
本文包含两个计量模型——arma预测模型和多元回归模型。树立arma预测模型的目的在于明确模型的系数之后,根据相对较少的数据集对comex黄金期货价钱走势进行预测,但arma预测模型的缺点也同样明显,那就是未考虑其他关联变量的影响。在市场经济活动中,黄金价钱的一些变化往往受多种因素的影响,一个因变量和一个或几个自变量有存在依存关系的情况,而且有时几个影响因素主次难以区分,一般使用多元回归模型进行拆析。

模型一:arma
arma模型是一类常用的随机时间序列模型,是研究时间序列的重要方式之一,其基本思想是:某些时间序列是依靠于时间t的随机变量,构成该时间序列的单个序列值虽然具有不明确性,但整个序列的一些变化却有一定的规律性,可以用相应的数学公式近似描述。arma模型表达式为:yt=β0+β1yt-1+β2yt-2+……+βpxt-p+εt+a1εt-1+a2εt-2+……+aqεt-q。

变量选择
数据选取上,以comex黄金期货月度收盘价为研究标的,并选择年1月至年10月一共82个数据。
平稳性评估
首先对样本序列预解决,评估该序列是否为平稳非纯随机序列。若为非平稳序列,需要对该序列解决使其符合arma模型建模的条件,即解决后的序列是平稳序列。
从上图可以看出,该序列呈下降趋势,直观显着非平稳,需要进一步平稳性检测。
序列的关联拆析结果显示,自关联系数波动较大,comex黄金期货价钱缓慢递减趋于零,并随着时间的推移,在0附近波动并呈发散趋势,初步判定该时间序列非平稳。
为验证这组数据是非平稳的初步评估,需对其进行单位根检验,也称adf检验。adf检验是为了检验序列中是否存在单位根,因为如果存在单位根,过程就不平稳,序列也就是非平稳时间序列,会使回归拆析中存在伪回归。
adf检验显示,t统计量为-2.118141,大于10%置信水平下的t值,可以明确comex黄金期货价钱的时间序列是非平稳序列,需要差分。
数据平稳化
对数据一阶差分后再次进行adf检验,结果如下:
adf检验的t统计量为-8.908062,比1%的置信水平下的t值小,且p值小于0.05。可以明确,经过一阶差分的comex黄金期货价钱的时间序列是平稳序列。
模型构建
arma模型的识别与定阶可以通过样本的自关联与偏自关联函数的注意获得。例如:ar(p)模型自关联函数拖尾,偏自关联函数p步截尾;ma(q)模型自关联函数q步截尾,偏自关联函数拖尾;而arma模型的自关联函数与偏自关联函数均具有拖尾性。

下图所示ac与pac都基本控制在两个标准差范围之内,可认为该序列在零轴附近波动,具有短期关联性,样本的自关联和偏自关联都呈现一定的拖尾特征。
综合上图可大致考虑arma(3,1)模型和arma(2,1)模型(见下图)。通过比较r2,最终选定arma(2,1)模型并导出。
输出模型为:yt=0.987870yt-1+ut+0.982829ut-1。
适应性检验
参数估计后,应对拟合模型的适应性进行检验,实质是对模型残差序列进行白噪声检验。若残差序列不是白噪声,证明还有一点重要新闻没被提取,应重新设定模型。同样的,用adf检验来对残差进行单位根检验,结果如下:
t统计量小于1%、5%和10%三个显着性水平的临界值,可评估该模型的残差序列不存在单位根,模型检验通过。
总结
通过针对arma模型预测结果与实际价钱,我们发现两者差值较小,模型较为比较有效,模型的输出结果对实际预测comex黄金期货价钱走势有较强指导意义。
模型二:多元回归
多元回归拆析法是指通过对两个或两个以上的自变量与一个因变量的关联拆析,树立模型进行的做法。当自变量与因变量之间存在线性关系时,称为多元线性回归拆析。多元线性回归方程应该为:y=β0+β1x1+β2x2+β3x3+……+βnxn+ε。
变量选择
影响黄金价钱变动的因素较多,根据经验和因素拆析选取美联储银行总负债、美国核心cpi(环比)、美国5年期国债实际收益率、美国1至3年公司债利差和美元指数收盘价作为自变量,comex黄金期货价钱作为因变量,原因如下:
一是与众多中央银行一样,美联储也需要保持资本的储备,用以支撑美国的债务。这些储备或资产以外币或黄金等形式存在,记录在美联储资产负债表上,同时每周在美联储的网站上公布。黄金储备可用于外借以获取盈利,或被用于处理国际事务。然而美联储储备这些黄金的初衷,与利用黄金分散风险的长线投资者的目的大同小异。黄金作为一种资产,可以增加人们对货币供应的信心或在必要时调控货币政策。

二是核心cpi即核心花费价钱指数,是指将受气候和季节因素影响较大的产品价钱剔除之后的居民花费物价指数。我国对核心cpi尚未确定界定,而美国是将食品和能源价钱剔除后的居民花费物价指数作为核心cpi。通常认为,核心cpi能更真实地反映宏观经济运行情况。如果美国核心cpi数据较市场预期越来越强劲,美元有望展开强劲反弹;反而反之,黄金或迎来新助攻。

三是美债是美国联邦政府财政支出首要手段之一。目前美债水平已经接近20.07万亿美元的规模。拥有固定利率的美债,因为强大的美国gdp保障,以及良好的信用评级,一直是国际资金追捧的对象。年10年期美债收益率不断逼近3%,引起了国际社会的担忧,加上美国对外实施贸易战和美联储渐进式加息,美元指数不断上涨,导致了美债的抛售潮和黄金的下跌。

四是信用利差为信用债收益率中高于无风险利率的收益,用来补偿信用债的违约风险。决策信用利差的因素首要有两个,即违约风险以及流动性。其中违约风险首要来自于发行人的信用风险,受宏观经济形势和货币市场环境影响。大环境好,公司运行顺利,信用风险小,信用利差小;大环境不好,公司运转不畅,信用风险较大,信用利差大。

五是美元指数是综合反映美元在国际外汇市场的汇率情况的指标,用来衡量美元对一篮子货币的汇率变化程度。它通过计算美元和对选定的一篮子货币的综合的一些变化率,来衡量美元的强弱程度,从而间接反映美国的出口竞争能力和进口价钱的变动情况。美元指数上涨,证明美元与其他货币的比价上涨也就是说美元升值,那么国际上首要的商品都是以美元计价,所对应的商品价钱应该下跌,黄金也具有商品属性,亦遵循此规律。

建模
开始选择的是逐步法,逐步法是“向前”和“向后”的结合体,最先进入“线性回归模型”的是“美联储银行总负债”树立了模型1,紧随其后的是“美国5年期国债实际收益率”树立了模型2,再其次是“美国1至3年公司债利差”树立了模型3,最后进入的是“美国核心cpi(环比)”。

模型中用此做法有个概率值,当小于等于0.05时,进入“线性回归模型”,最先进入模型的,关联性最强,关系最为密切。当大于等0.1时,从“线性模型中”剔除。
可以看出,根据所给出的自变量,一共树立有四个模型(1、2、3、4),从模型r2和调整r2的拟合度考虑,明显模型4要更好一点(0.843>0.832>0.823>0.806)。
“模型4”中的回归平方和为2194693.361,残差平方和为386443.035。总平方和=回归平方和+残差平方和,其中残差平方和指随即误差或不可解释的误差,由于回归平方和占总平方和的85%,所以,此线性回归模型只解释了总平方和的大部分,需要进一步拆析。

根据后面的“f统计量”的概率值为0.00,由于0.00<0.01,随着“自变量”的引入,其显着性概率值均远小于0.01,所以可以显着地拒绝总体回归系数为0的原假设,通过anova方差拆析可以看出comex黄金期货价钱与美联储银行总负债、美国5年期国债实际收益率、美国1至3年公司债利差以及美国核心cpi(环比)之间存在着线性关系,至于线性关系的强弱,需要进一步进行拆析。从系数a中可得:多元线性回归方程为y=2270.3-0.00022378098967720453×x1-71.434×x2-96.853×x3+132.679×x4,y=comex黄金期货价钱;x1=美联储银行总负债;x2=美国5年期国债实际收益率;x3=美国1至3年公司债利差;x4=美国核心cpi环比。

“共线性统计量”vif(variance inflation factors)检验法是通过检查指定的解释变量能够被回归方程中其他所有解释变量所解释的程度来检测多重共线性。方程中各个解释变量有一个vif,该vif是关于多重共线性使相应的系数估计值的方差增大了多少的一个估计值。高vif表明多重共线性增大了。“共线性统计量”显示:美联储银行总负债、美国5年期国债实际收益率、美国1至3年公司债利差、美国核心cpi(环比)的vif分别为3.622、3.383、1.573和1.013,且均小于5,所以各个自变量之间没有出现共线性。

共线性诊断
共线性诊断使用的是“特征值”的方法,特征值首要用来刻画自变量的方差。诊断自变量间是否存在较强多重共线性的做法是利用主成分拆析法,基本思想是:如果自变量间确实存在较强的关联关系,那么它们之间必然存在新闻重叠,于是就可以从这些自变量中提取出既能反应自变量新闻(方差),而且有相互独立的因素(成分)来,从自变量间的关联系数矩阵出发,计算关联系数矩阵的特征值,得到相应的若干成分。

“共线性诊断”显示:从自变量关联系数矩阵出发,计算得到了5个特征值(模型4中),最大特征值为3.682,最小特征值为0.003。条件索引=最大特征值/相对特征值,再进行开方,(即特征值3的条件索引为3.682/0.350,再开方=3.243),每一个特征值都可以够刻画某自变量的一定比例,全部的特征值能将刻画某自变量新闻的所有,结论如下:

x1在方差标准化后,第一个特征值解释了其方差的0.00, 第二个特征值解释了0.00,第三个特征值解释了0.00,第四个特征值解释了0.03,第五个特征值解释了0.97;x2在方差标准化后,第一个特征值解释了其方差的0.00, 第二个特征值解释了0.27,第三个特征值解释了0.00,第四个特征值解释了0.25,第五个特征值解释了0.48;x3在方差标准化后,第一个特征值解释了其方差的0.00, 第二个特征值解释了0.00,第三个特征值解释了0.01,第四个特征值解释了0.79,第五个特征值解释了0.20;x4在方差标准化后,第一个特征值解释了其方差的0.02, 第二个特征值解释了0.00,第三个特征值解释了0.97,第四个特征值解释了0.01,第五个特征值解释了0.00。

可以看出,没有一个特征值能并且解释全部自变量,自变量之间存在较弱的共线性关系。
上图显示,自变量的残差总体符合正太分布,但呈现尖峰厚尾的特征。
总结
综合t、r2、vif、特征值以及残差等检验,模型相对比较有效。comex黄金期货价钱走势与美联储银行总负债、美国核心cpi(环比)、美国5年期国债实际收益率以及美国1至3年公司债利差呈现显着的关联性。
模型一、二针对
为验证上述两组模型的拟合度,需对两组模型回测比对。结果显示,以中美贸易摩擦期间的comex黄金期货价钱为样本,arma模型对于comex黄金期货价钱的预测效果较多元回归模型拟合度更优。
comex黄金期货价钱走势与美联储银行总负债、美国核心cpi(环比)、美国5年期国债实际收益率以及美国1至3年公司债利差呈现显着的关联性。
在多元回归模型中,美元指数被剔除,但并非表示美元指数对comex黄金期货价钱走势没有影响,相反,美元指数与comex黄金期货价钱关联性为-0.9,意味着美元指数与comex黄金期货价钱有非常高的负关联性,只是在其他变量中已经涵盖了美元指数的影响因素,因为此被剔除。

中美贸易摩擦期间,样本内arma模型对于comex黄金期货价钱的预测效果较多元回归模型拟合度更优。
回测中美贸易摩擦这一突发事情的数据发现,模型并没有偏离实际价钱走势,反而拟合度更高。中美贸易摩擦属于突发事情,常识和经验上在模型中应该表现为发散或者更大的无规律波动,但是回测结果却是显示为更加拟合实际价钱,模型的预测效果更优,这不得不引发我们的极大有趣,对此进一步拓展研究。

拓展研究
基于结论可以发现,在遇到金融危机、局部军事冲突或地缘政治等突发事情时,模型的拟合度优于常态。
由此,选取2003年美伊战争以及2008年金融危机前后的comex黄金期货价钱作为样本,运用同样的做法进行建模拆析,结果输出如下:
2003年3月20日,美国以伊拉克藏有大规模杀伤性武器并暗中支持恐怖分子为由,绕开联合国安理会,单方面对伊拉克实施军事打击。战争爆发大约三个星期之后,美军顺利进入巴格达市区。战争爆发38天后,“沙漠军刀计划”实行。这段时间内,不论是arma模型还是多元回归模型,拟合度均优于其他时间段。

2008年3月,美元兑欧元刷新历史新低。9月,雷曼兄弟申请破产保护,巴克莱银行以2.5亿美元低价收购了雷曼兄弟北美市场的投资银行及资本市场业务。美国保险巨头aig陷入困境,美林证券被美国银行以503亿美元的价钱收购。这段时间内,不论是arma模型还是多元回归模型,拟合度均优于其他时间段。

通过以上拓展研究,同时综合上文中结论的回测,证实了我们的拆析:在遇到金融危机、局部军事冲突或地缘政治等突发事情时,运用arma模型和多元回归模型能够比较有效地帮助我们更好地拆析和预测comex黄金期货价钱走势。
(作者单位:华鑫期货)
来源:零点娱乐时刊
标题:“基于预测模型的COMEX黄金期价实证拆析”
地址:http://www.02b8.com/yjdyw/33262.html










