运用基础指标对深证综指的短期预测

时间:2022-09-18 12:36:47

运用基础指标对深证综指的短期预测

[摘 要] 应用支持向量机方法对股票市场趋势性变动进行预测是金融市场行为研究领域里一个重要的研究课题。技术指标是证券投资分析的有效工具。收盘价和成交量是作为基础指标,它们能组合成许多复杂的技术指标。本文采用日收盘价和日成交量作为输入向量,根据不同的日期的日收盘价和日成交额选取9组输入向量,根据指标的对比,找出预测精度最高的试验组。实验结果现实日收盘价和日成交额在预测股价方面有3天的有效性。

[关键词] 支持向量机 时间有效性 技术指标 短期预测

证券市场具有高收益与高风险并存的特性,关于证券市场分析与预测的研究一直为人们所关注。但是由于影响市场的因素众多,而且它们之间的相互作用是非线性和时变的,因此建立完整的动力方程来描述其内部相互作用因素或状态变量之间的关系是非常困难的,也是证券分析研究领域的热点之一。如果将股票价格序列看作系统的输出,则可以缓解无法建立市场动力方程的遗憾。作为系统的输出,价格序列毕竟是影响市场各因素相互作用的结果,因此,价格序列必定承载着关于系统状态变量的信息。

众多股市分析方法的应用效果都难如人意。常用的预测方法有时间序列法、灰色模型法、证券投资分析方法、专家评估法等。随着非线性科学的发展,人们提出了神经网络方法,通过综合系统的不确定性和工程经验,来解决复杂的设计问题。神经网络方法存在最终解过于依赖初值,存在过学习的现象,训练过程中存在局部极小问题,且收敛速度慢,网络的隐节点难以确定等问题。

支持向量机 (Support Vector Machine,简称SVM)方法基于统计学习理论,由Vapnik等人在90年代中期提出。支持向量机目前已成为机器学习界的热点,成功应用于分类和回归问题。当前,SVM已经在模式识别领域取得了很好的应用效果,广泛应用于文本识别、语音识别、人脸识别。近年来,人们发展了回归型支持向量机,它可以按任意精度逼近非线性函数,具有全局极小值点和收敛速度快的优点。与神经网络方法相比有显著的优越性,且在非线性时间预测方面取得很好的效果。

最近的研究指出股票市场受宏观经济形势、行业周期、公司财务等多方面因素影响,股票市场是一个复杂多变的系统。很多的因素影响着股票价格,在一定时间宏观经济变量和股市技术指标被证明对股票价格走势有一定的预测作用。比如:市场容量和信心被证明在预测期货交易价格的作用。

股价和成交额作为基础性技术指标,许多复杂的技术指标都是根据它们转换而来。本文以日收盘价和日成交价作为研究对象,根据输入变量时间长短不同,设计9组方案。通过SVM建模,进行9组对比试验,将试验结果指标化,找到预测精度最高的那组试验。根据精度最高的试验组,确定收盘价、成交额在影响未来股价方面的最佳时刻。该时间点可以反映股价波动的短期周期性

支持向量机理论

支持向量机

支持向量机广泛应用于函数回归,模式识别以及密度估计等问题中,与传统的神经网络不同,SVM应用的是结构风险最小化原则,而不是经验风险最小化原则,即SVM寻求的是一般误差上界的最小化而不是单纯训练误差的最小化,由于SVM 具有模型的自动选择(参数,基函数的位置等),可以将训练转变为二次规划问题(有全局最优解)以及对于小样本良好的学习能力等特性"引起了越来越多研究者的兴趣。SVM在回归(Support vector regression, SVM)尤其是股票价格等非线性时间序列预测中的应用近年来颇受人们的关注。

SVMs回归函数的形式如下:

式中是一个高维的特征空间(feature space)中的函数,系数b是一个常数。 和b通过将下式最小化来求解。

其中第一项是经验风险,第二项是正则化的风险,是全部的风险。参数C称为正则化参数,调整它的大小可使上述两种风险取得折衷。函数称为损失函数。损失函数有多种形式,常用的损失函数是不敏感损失函数,即

式中称为管道大小,它反映函数逼近的精确程度。参数C和 都是使用者定义的自由参数。

为求解和b,引入正松弛变量将公式()转换为最小化的原规划问题。

St.

最后,对上面的约束条件引入拉格朗日乘子,可以得出方程(2)中的决策函数:

St.

公式(8)中,是拉格朗日乘数。它们满足如下公式:

公式(12)中是核函数。核函数的值等于两个向量在特征空间的内积。常用的多项式核函数的表达式为:

对于核函数我们选择高斯径向核函数:。高斯核函数是普遍使用的核函数,因为它对应的特征空间是无穷维的,有限的数据 样本在该特征空间中肯定是线性可分的。

实际预测过程中使用SVMs回归方法对经过预处理过的样本数据进行训练,计算出支持向量xi,参数。将它们代入(1)式,再代入经过预处理的测试集样本,就可以计算出映射到[-1,1]区间的预测值,把这个结果作逆映射到原来的区间就得出了所求的预测值。

实证研究

试验设计

图1 SVM 预测流程图

数据处理:

预测过程要经过选择研究样本,选取数据;数据预处理;设定模型参数;输入训练数据,生成模型;预测输出预测值;计算评价指标并对结果进行分析等过程。整个过程见图1。

对象选择:

本文以深证综指作为研究对象。指数短期波动期间,研究收盘价和成交量在指数预测中的时间有效性。收集日收盘价、日成交额、涨跌比率作为研究数据。训练数据集总共有120组数据(2009.07.03到2009.10.25),预测数据集共有55组数据(2009.10.28到2010.03.23)

表1 股价数据集

Xij表示输入向量,Yij表示输出值。Xij表示第i(1~9)个方案,第j天的输入向量。Yij值是第i个方案第j天的涨跌比率。ai表示第i天的收盘价,vi表示第i天的成交量。

数据预处理:

数据预处理中采用的办法是转换数据的尺度,将全部数据线性映射到[-1,1]的区间内。之所以这样做,输入变量不同其数值的大小也不同,只有将它们都映射到相同的区间内,才有利于衡量它们对因变量的影响。经过这样处理以后,需要在数据后处理时把[-1,1]上的数据逆映射到原来的区间之内。线性转换公式如下:

参数的选择:

SVM回归预测的参数选择面临二个问题:一是决定核函数的类型,二是选择合适的自由参数c、g、p。通常如果函数是光滑的,高斯核函数有优良的逼近效果。在对数据没有更多的附加信息。因此,本实验中采用了高斯核函数。公式如下:

不同的输入向量,对c、g、p的取值会产生不同的影响。在输入变量确定的前提下,所有的方案都使用gridregression.py寻找回归最优参数。所有方案的参数确定标准一样,避免不同的参数选择过程对预测结果产生影响。这样各个方案的预测结果只受有输入向量的影响。通过将预测结果对比,找出最佳的输入向量。

评价指标:

预测结果采用2个指标。第一个指标v1是平均绝对差。第二个指标v2是方向一致性指标。其中v1是对预测值偏离实际值的一种度量,它的值越小表示预测的结果越准确。v2则能衡量出预测价格方向的正确比率,它的值则是越大越好。指标的计算公式如下:

其中是实际值,是预测值。

实验结果分析

下图2可以明显看出方案7、8的预测结果都为负值,方案9的预测结果都为正值。在实际情况中连续涨(跌)10日是极其少见的。更何况是连续涨(跌)55天在实现情况下不可能的。方案7、8、9更能体现是在股价中期预测,本文研究的是股价短期波动。所以剔除方案7、8、9。

图2 实际值与方案7、8、9的预测值

图3 实际值与方案1、2、3、4、5、6的预测值

表4显示:方案3的v1值(0.524015)最小,说明方案3的预测精度最高。同时方案3的v2值(0.537)最大,说明方案3预测股价涨跌方向的能力是最强的。方案3是以提前3天的收盘价、成交额作为输入向量x3j(aj-1,vj-1,aj-2,vj-2 aj-3,vj-3)。试验结果显示当天的收盘价、成交额对预测未来3天的股价有一定的指导意义。当天收盘价、成交额在预测第4、5、6、7、8、9天股价方面就失去有效性,甚至对预测结果产生负面影响。

结论

从技术分析的角度分析,试验证明通过分析提前3天的收盘价,成交额可以有效预测当前的股价。该结论反映股价的短期波动周期为3天。方案1、2、4、5、6的预测结果跟跟方案3的预测结果相差不是很大,说明股价的短期波动周期不是很明显。在实现生活中股价的影响因素是多方面的比如:宏观经济、行业周期、企业的经营水平等等。从不同的角度分析股价的波动的时间有效性是不一样的。股价的周期有一个季度、一年、4年、8年、10年等等。技术分析在预测价格短期波动是比较有效地方法。以后的研究重点:

(1)研究不同影响股价的因素如:宏观因素、行业周期、企业财务状况等对股价影响的时间有效性。综合中期、长期指标,再对各个指标时间周期进行组合分析。

(2)日开盘价、日最高价、日最低价等技术指标对股价也有一定的影响作用。分析它们在股价预测中的时间有效性。

尽管试验结果取得一定的成效,但还有很多可以改进的地方。研究不用指标的时间有效性,并对各个周期进行组合分析,能对股票市场投资有很好的指导意义。

参考文献:

[1]胡蓉:多输出支持向量回归及其在股指预测中的应用,计算机技术与发展[J],2007,10

[2]吕淑萍 赵咏梅:基于小波神经网络的时间序列预测方法及应用[J]. 哈尔滨工程大学学报,2004, 25(2):180-182

[3]高玮:基于进化神经网络的股市预测研究[J] 计算机科学.2004,31(B09): 191-l93

[4]Vapnik V. The nature of statistic learning theory. New York:Springer;1995

[5]Matilla-Garcia,G.,&Arguellu,C.(2005).A hybrid approach based on neural networks and genetic algorithm to the study of protability in the Spanish stock market. Applied Economics Letter, 12,303-308

[6]Black,A.J.,&Mcmillan,D.G. Non-linear predictability of value and growth stocks and economic activity.Journal of Business Finance and Accounting, (2004).31,439474

[7]Zhang Xue-gong(张学工). Introduction to Statistical Learning Theory and Support Vector Machines(关于统计学习理论与支持向量机)[J]. Acta Automatica Sinica(自动化学报), 2000,26(1):37-47

[8]Liu Jiang-hua(刘江华), Cheng Jun-shi (陈佳品). Support Vector Machine Training Algorithm Review (支持向量机训练算法综述)[J]. Information and Control (信息与控制), 2002,31(1):45-50

[9]Cao Li-juan, Tay Francis E H. Financial Forecasting Using Support Vector Machines [J]. Neural Comquting &Applications, 2001, 10(2): 184-192

[10]Tay Francis E H, Cao Lin-juan. ε-Descending Support Vector Machines for Financial Time Series Forecasting [J]. Nwural Processing Letters, 2002, 15(2): 179-195

[11]Deng-Yiv Chiu,&Ping-Jie Chen, Dynamically exploring internal mechanism of stock market by fuzzy-based support vector machines with high dimension input space and genetic algorithm. Expert Systems with Applications 36, 12401248, 2009

上一篇:国有商业银行风险能力控制的强化 下一篇:美国次贷危机对中国经济的影响