基于支持向量机的股票投资价值研究

时间:2022-08-28 01:59:14

基于支持向量机的股票投资价值研究

摘要:随着中国股票市场的发展和日趋成熟,股票投资价值的研究方法也日趋完善。非线性方法在股市研究中取得了快速的发展,其中支持向量机是近几十年来一个较新的发展分支,研究的是小样本问题下的机器学习方法。基于支持向量机方法研究上市公司年度财务数据对未来股价的变化的预测能力,同时通过预测结果选出股票投资组合,判断收益率是否能战胜市场。

关键词:股票;投资价值;研究方法

中图分类号:F83 文献标志码:A文章编号:1673-291X(2011)17-0082-03

前言

随着近代计算机技术的飞速发展,信息化程度越来越高,所以研究者现在面对的不再是缺乏研究数据,而是在庞大的数据中挖掘出有价值的信息为投资者提供参考。目前对股票投资价值的预测主要使用的方法有基本分析、技术分析、金融模型方法、时间序列法和非线性系统分析方法。从20世纪80年代以来,非线性方法在股票指数以及股价变化趋势的研究中发展迅速,代表理论有神经网络、小波分析、自回归神经网络等、支持向量机方法等,其中,支持向量机方法近年受到越来越多的关注,在处理非线性问题方面有一定的优越性。首先,支持向量机研究的是有限样本条件下的问题,很好地解决了小样本问题,在小样本条件下能够得到相对精确的估计结果;其次,支持向量机的算法避免了很多复杂情况下的维数灾难问题;同时,支持向量机解决了神经网络方法中容易遇到局部极值的问题,有效地得到全局最优解。本文使用支持向量机方法研究股票的选择并验证其有效性。

一、支持向量机的理论介绍及本文的研究设计

支持向量机是基于统计学习理论发展出的一种分类方法。系统学习是指根据已知的训练样本的输入向量x和输出向量y,估计输入x和输出y之间的函数关系,进而对未知样本的输入值x,尽可能精确地预测输出值y。支持向量机是Corinna Cortes和Vapnik等于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。

根据支持向量机的原理,利用支持向量机对股票是否有投资价值进行分类,大体上来说分为两个过程: 分类器的设计和分类的实现,即:分类器的设计:取一定数量的样本,称为训练集或学习集合,进行分类器的设计;分类的实现即用设计的分类器对待识别的样本进行分类决策。

在本文的实证研究中,具体的研究步骤如下:

1.数据获取。首先决定样本的输入和输出值。利用公司价值对股票是否有投资价值分类,输入向量选择能体现公司价值的数据,输出值则根据收益率大小判断投资价值。

2.数据处理。为了排除异常值对分类结果的影响,对样本数据进行预处理。

3.分类器设计。我们利用训练集选择合适的模型,主要是选择核函数以及相关参数。基本方法是在训练集内部进行模型选择的检验。

4.分类的实现。利用上个步骤中选择的分类器,对待识别的样本进行分类决策,得到分类结果,即股票是否有投资价值。

5.分类结果的检验。在本文中,分类的结果检验分为两个部分,一部分是检验分类的准确率,一部分是比较根据分类结果得到投资组合的收益率和市场平均收益率之间的关系。

二、数据获取和处理

公司的内在价值包括公司的盈利能力、成长能力、风险状况和对股东的回报。

企业的盈利能力考察的是一个企业运用其所持有的资源创造最大价值的效率水平,也是考察一个企业价值的核心指标。衡量企业盈利能力的总指标为净资产收益率,同时根据杜邦分析法,净资产收益率可以分解为总资产收益率和财务杠杆的乘积,因此,净利润率和资产周转率也反映了企业的盈利能力。

企业的成长能力考察的是企业现有财务指标的增长情况,根据不同的现期财务指标,有不同的成长能力的指标,例如,净利润增长率、资产增长率、营业收入增长率等等。企业的成长能力越强,其未来发展前景越被看好,公司价值也越大。

衡量一个企业的风险状况,主要是考察该企业的长期和短期的流动性状况。衡量企业长期经营风险的指标一般是企业的资产负债比,即财务杠杆率;而衡量企业短期经营风险的指标主要是流动比率和速动比率。同时我们还加入Beta值衡量个股对于市场的风险。

每股收益反映了企业给普通股股东带来的获利水平的指标主要是每股收益,每股收益越高,则该公司能够带给普通股股东的投资收益越好,企业价值相对较高。

我们选择反映公司盈利水平、成长水平、风险状况、股东获利水平以及行业特点的相关财务指标,作为支持向量机分类模型中的样本输入向量。这些指标为:每股收益、净资产收益率、总资产收益率、利润率、总资产周转率、净利润增长率、资产增长率、营业收入增长率、资产负债比、流动比率、速动比率、Beta值以及行业市盈率。

样本输出值y是代表该股票是否具有投资价值。由于上市公司年报必须在下一年的五月之前公布,我们选择五月第一个交易日后6个月期间的收益率作为评价股票是否有投资价值的标准。将收益率排名前20% 的股票标记为y=1,其余的标记为-1。财务数据取自A股上市公司2005年至2009年的年报数据,Beta值来源于Wind咨询数据库。

用前一年的样本作为训练集,利用生成的模型对本年度样本进行预测,将预测结果与本年度样本实际的y值进行对比,分析预测的准确程度。数据预处理的方法为:剔除数据缺失样本;剔除异常样本,将新上市公司的样本和部分特殊股票样本如ST股进行剔除。同时,剔除净资产收益率为负的公司;将每个公司的资产负债比、流动比率和总资产周转率除以行业平均水平,得到他们在行业中的相对水平;剔除极端值对于模型的影响,计算出每个变量的平均值和标准差,设平均值为μ,标准差为σ,则将所有变量的值控制在[μ-3σ,μ+3σ]范围之内;剔除小规模的上市公司。

三、实证结果

在支持向量机的模型选择中,主要是核函数的选择和参数的选择。不同类型问题中的核函数和参数选择可能存在较大的差异,本文选取的核函数为RBF,在选择了核函数的同时,对每年的分类模型,我们也通过该方法选择参数μ和C。

我们使用2005年的样本做训练集,对2006年的样本做预测;用2006年样本做训练集预测2007年样本;依次类推,直到用2008年样本预测2009年。

支持向量机得到的预测结果是股票是否在接下来半年具有投资价值,有价值的标记为y=1,其余的分类为y=-1。

对于实际上y=1的样本,预测正确率记为a,对于实际上y=-1的样本,预测正确率记为b,总的预测正确率记为c。

对于值得投资的股票来说,我们可以达到百分之十以上的正确率,即通过分类得到的优异的股票中,的确能挑选到优异的股票。对y=-1的样本,正确率在百分之八十以上,即我们可以剔除大部分的普通股票。总体来说,我们选用的支持向量机的分类结果预测正确率为70%左右(见表1 )。

我们将预测值为y=1的股票按照市值比例进行投资,构建投资组合,比较6个月内的收益率与市场收益率比较。

1.利用2005年样本预测2006年财务数据为依据的投资价值

经过2005年样本内的核函数选择测试,我们选择 C=300,μ为0.01。根据2006年的财务数据进行预测,将支持向量机分类所得到的y=1的公司组成投资组合,所得的收益率与上证综指收益率比较如图1。

可以看到,通过支持向量机选择的投资组合战胜了大盘,6个月内的累积收益率均高于市场平均收益率,由表10可以看到预测的准确率也比较高。即利用2005年样本作为测试集所得到的模型能较好地根据2006年财务数据预测股票是否具有投资价值,选择出较为优秀的投资组合。

2.利用2006年样本预测2007年财务数据为依据的投资价值,以及利用2007年样本预测2008年财务数据为依据的投资价值,我们选用的参数均为C=200, 均为0.01,得到的投资组合收益率如图2和图3所示。

可以看到,虽然这两年的预测准确度还较令人满意,但是我们所选的投资组合收益情况较差,可能是由于金融危机的影响使得不同行业和不同公司受到不同程度的打击。在支持向量机的输入向量选取中,我们没有考虑市场因素的影响。所以金融危机对宏观经济的影响和对不同公司的冲击的差异可能是导致支持向量机分类效果不具意义的原因之一。

3.利用2008年样本作为训练集, 根据2009年财务数据预测投资价值

我们选取的参数是C=200,μ为0.01。根据分类结果得到的投资组合获得了比较好的投资回报率。即支持向量机做出了较好的分类判断。可以看到,投资组合在刚开始的时候低于平均水平,但是在之后的四个月赶超了市场平均水平。

四、结论

本文用财务数据作为支持向量机的输入向量,同时利用财务数据公布后半年的股票收益率的高低判断股票是否具有投资价值,作为输出变量。基于支持向量机分类的结果进行投资组合的构建验证有效性。

1.虽然2005年至2009年中国股票市场经历了熊市到牛市再到熊市的波动过程,但是预测的准确性总体均能达到70%左右,即能挑选出一部分具有投资价值的股票并剔除一部分没有投资价值的股票。也就是利用支持向量机进行分类,能有效地对股票的选择范围进行缩小。

2.2006年和2009年预测结果所得到的投资组合回报率能跑赢大盘,比较令人满意。而2007年和2008年的预测结果得到的投资组合并不理想,可能是由于金融危机对整个股市产生的负面冲击,并且对不同行业不同类型的公司的影响有较大差异。在分类模型中,输入向量仅仅是代表公司价值的基本财务指标,默认市场因素对各个公司的影响相当,当这个默认条件不成立,市场又面临比较大的变化时,可以预见不能取得令人满意的结果。

参考文献:

[1] 李波.SVM在企业财务困境分析中的应用[J]. 现代管理科学,2004,(12): 12-14.

[2] 刘松.股票内在投资价值理论与中国股市泡沫问题[J].经济研究,2005,(2):45-53.

[3] 张晨希,张燕平,张迎春,陈洁,万忠.基于支持向量机的股票预测[J].计算机技术与发展,2006,16(6):35-37.

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文

上一篇:低品位油藏经营财税政策调研分析 下一篇:浅议金融风险的种类及其防范