时态关联规则在股市走势分析中的应用研究

时间:2022-09-02 09:33:09

时态关联规则在股市走势分析中的应用研究

[摘要] 近年来,时态数据挖掘的研究对商业、金融、医疗诊断、科学与工程等领域的数据分析具有重要意义,因此时态数据的挖掘方法已经成为数据挖掘的一个研究热点。本文主要讨论时态关联规则在股市走势中的应用。选取相对强弱指标RSI,收集交易数据进行实证分析,得出了若干条有用的关联规则。

[关键词] 时态关联规则 技术分析 股价走势

一、引言

近年来对关联规则的探讨一直是数据挖掘中的热门研究课题。关联规则的挖掘对象一般是事务型数据库,其中的一个主要应用是在零售或交易数据库中关联规则的采掘。由于大部分的关联规则挖掘都没有考虑数据库中所包含的时态语义,因而可称之为传统的或静态的关联规则。事实上,由于数据的获得都随时间变化,时间是数据本身固有的因素,许多数据库中的记录都带有时间标记,如交易记录中的交易时间,病历信息库中的诊断时间等。时态数据库的出现必然要求在知识发现过程中考虑时间因素。

二、技术分析理论

技术分析法(Technical Analysis)是通过对证券的历史数据,如过去交易所发生的价格、时间、成交量的思考来推算未来行情,从而建立起买卖证券的规则,以优化收益、规避风险的一种投资理论。技术分析中涉及预测股价走势的部分都类似于关联规则中的前件后件关系。而交易数据库中存储的数据多是连续型的数据,因此在应用数值型关联规则分析时需要先将其离散化,将数据转化为二值型,再利用二值型规则的挖掘方法来实现。

本文以RSI(相对强弱指标)为例。RSI(Relative Strength Index)指标以一特定时期内股价的变动情况推测价格未来的变动方向,并根据股价涨跌幅度显示市场的强弱。

三、数据预处理

根据技术分析理论,我们采用从国泰君安大智慧行情系统下载的价格数据和技术指标数据来挖掘有时态约束的数值型关联规则。我们选择的个股是工商银行(601398)从2006年10月27日上市起至2008年2月29日的318个交易数据。本文验证的是RSI(6)的预测力。首先对价格中的收盘价数据计算每日涨跌幅,并将连续的属性值进行离散化分类后得下表1:

相对强弱指标RSI的数据可以直接从行情系统的技术分析版块下载得到。系统中可以得到RSI(6)、RSI(12)、RSI(24),这里我们选择变化灵敏的RSI(6),并从2006年11月2日开始记录。RSI的连续属性值划分为4种布尔型的数据,利用SPSS做变量计算得到表2所示的数据:

为了挖掘数值型关联规则,将两表合并,并把RSI属性作为前件,涨跌幅属性作为后件,得下表3:

四、当日RSI和当日涨跌幅间的规则挖掘

使用表3的数据,我们可以分析和计算当日RSI数值和当日涨跌幅之间的关联关系。上文中已指出技术指标RSI数值处于不同的阶段对应不同的操作,这些操作是基于对股价走势的预测。表4是当日RSI与当日涨跌幅之间不同属性取值的支持度和置信度。

①当RSI属性值为“极强”时:

由于RSI为“极强”本身出现的次数有限(为41次),所以相对应的涨跌幅支持度都较小。但是在技术指标取极端值的情况下,我们更关心它的预测力,即相对应规则的置信度。由表4可见,当日RSI处于“极强”区域中时,当日股价下跌的概率很小(2.44%),大跌几乎不可能出现;而震荡即小幅波动的概率为24.39%;上涨(包括小涨和大涨)的概率很高,总和为73.18%,说明当日股价走势较好的概率较大。总之,当RSI为“极强”时,我们可以得出结论:当日股价将震荡或上升,而且上升的概率更大。

②当RSI属性值为“极弱”时:

与RSI为“极强”相反的极端情况为RSI“极弱”的情形。与“极强”相比,“极弱”出现次数更少(4次),导致其在研究期间各规则的支持度极低,但确有不容忽视的高置信度。由表5可见,当RSI为“极弱”时,当日股价有50%的可能是大跌,50%的可能是小跌,而震荡、小涨、大涨的情形在本例中未曾出现。因此我们可以得出结论:当RSI为“极弱”时,当日股价有非常大的可能下跌。

③当RSI属性值为“强”时:

RSI为“强”的属性共出现142次,相对应的涨跌状况中,震荡的概率较高为40.85%,其次为小涨24.65%,接下来为小跌和大涨,最后是大跌。由表6可知各种情况没有明显区别,相对来说震荡上升的可能性更大些,说明这是一个多头的市场,可以进行买入操作。

④当RSI属性值为“弱”时:

RSI为“弱”的属性共出现131次,相对应的涨跌状况中,小跌的概率较高为34.35%,其次为震荡32.06%,接下来为大跌和小涨,最后是大涨。由表7可见各种情况没有明显区别,相对来说震荡下跌的可能性更大些,说明这是一个空头的市场,应进行卖出操作。

五、关联规则分析

综上所述,如果不考虑支持度,并设定40%的置信度阀值,在涨跌幅被划分为5个属性区间的基础上,我们只能挖掘出3条有效的数值型关联规则:

(1)RSI=“极弱”=>当日股价“大跌”(confidence=50%)

(2)RSI=“极弱”=>当日股价“小跌”(confidence=50%)

(3)RSI=“强”=>当日股价“震荡”(confidence=40.85%)

如果将“大跌”、“小跌”和“”大涨、“小涨”分别合并为“下跌”和“上涨”,那么在置信度阀值为40%的情况下,我们可以得到更抽象的5条规则:

(1)RSI=“极强”=>当日股价“上涨”(confidence=73.18%)

(2)RSI=“极弱”=>当日股价“下跌”(confidence=100%)

(3)RSI=“强”=>当日股价“震荡”(confidence=40.85%)

(4)RSI=“强”=>当日股价“上涨”(confidence=40.14%)

(5)RSI=“弱”=>当日股价“下跌”(confidence=51.14%)

六、结论

本文在引入股市技术分析理论的基础上,选取相对强弱指标RSI,把时态关联规则挖掘引入到股市走势分析中,通过收集交易数据进行了实证分析,验证了技术指标的预测力,给投资者提供重要的参考意义。

参考文献:

[1]J.M.Ale,G.H.Rossi.An Approach to Discovering Temporal Association Rules[C].In:Proc.of the 2000 ACM Symposium on Applied Computing,2000:294~300

[2]欧阳为民,蔡庆生.在数据库中发现具有时态约束的关联规则[J].软件学报,1999,10(5):527~532

[3]李少年孟志青:双事件时态关联规则的知识发现问题[J].计算机科学, 2001,29( 8):71~73

[4]陈成王永县:股市技术分析理论研究发展综述[J].经济师,2005年第5期:13~15

[5]韩杨:对技术分析在中国股市的有效性研究[J].经济科学,2001年第3期:49~57

上一篇:基于马尔可夫链的股价预测 下一篇:我国商业银行私人银行及财富管理业务研究