基于Delphi的多元线性回归系统

时间:2022-10-07 09:07:20

基于Delphi的多元线性回归系统

[摘 要] 根据多元线性回归的原理和实现方法,采用Delphi和ADO数据引擎开发出了一个集数据采集、样本剔除、统计检验与预测功能于一体的多元线性回归系统。该系统操作简单、功能强大,具有很强的鲁棒性和适应性,可以方便地进行多元线性回归和一部分非线性回归,具有广泛的应用价值。文章对系统的设计与构建作了详细的阐述,并用一个实例对该系统的使用及回归结果的解读进行了详细说明。

[关键词] 多元线性回归 非线性回归 数据处理 系统设计

一、引言

多元线性回归分析是一种重要和具有广泛应用价值的数据处理方法,主要用来测度具有相关关系的变量之间数量变化的一般关系,以便运用估计或者预测的统计方法。目前,多元线性回归在很多领域,比如经济、管理等领域得到了广泛的应用。但目前的一些实现方法,在功能、可视性、易用性、系统性、稳健性、程序的适应性以及运行速度等方面都还有待探索。鉴于此,笔者根据多元线性回归的原理和实现方法,利用Delphi6.0和ADO数据引擎开发了一个多元线性回归数据处理系统,用来对大型数据进行回归处理,相比其他的软件,该程序具有提高了数据处理的高效性、针对性和可操作性等特点,并且操作简单明了,上手容易。

二、系统设计

本系统包括以下四个模块:数据获取、数据及变量处理、回归分析、结果输出。主要的工作内容是通过数据库或者Excel获得基本数据,然后对基本数据进行处理,存放在数据库中,接着利用最小二乘法进行线性回归,最后将结果进行保存。

根据以上分析,本系统的总体结构如图1所示。

根据回归计算的要求及本程序的特点可以得到具有二范式的数据库概念模型,来满足系统开发所需要的性能,达到设计要求。由于每次回归运算解释变量的数目不一定相同,本系统采用动态建立数据表,及动态增减变量的方法。

三、程序实现

1.系统界面。系统界面如图2所示,为全中文图形用户界面。GUI集成度高,将最重要的回归分析部分的数据处理、回归结果,以及回归图形等用选项卡列在程序的主界面上。

2.模块功能和程序实现。(1)数据输入。在进行多元线性回归之前,首先要建立一个多元回归项目。可以通过点击文件菜单的新建回归项目菜单或者直接双击主界面上的表格直接输入数据来完成该操作。回归项目建立完成后,可以在主界面的Spreadsheet里面输入数据。另外,还可以通过点击“文件”菜单上的“获取外部数据”菜单项,从Excel文件获取数据。(2)数据处理。在完成数据的输入之后,可以在主界面上的Spreadsheet里面对不符合要求的样本进行剔除。通过点击主界面上右下角的“剔除”、“添加”按钮可以进行剔除和添加变量的操作。对变量进行计算是本系统的特色之一,这样可以将部分非线性回归转化成线性回归。在表达式栏输入相应的公式,就能对变量进行处理。目前,本系统支持包括加减乘除、求余、指数运算、三角函数、对数运算、反三角函数及定积分等常用计算。(3)回归分析。本系统采用最小二乘法对模型参数进行估计。在“操作”菜单点击“开始回归”或者在工具栏点击“开始回归”按钮就能完成相应的操作。(4)结果输出。本程序产生的结果分成两个部分,一部分是一般的回归结果,将在下文详细说明;另一部分为图形结果,输出的是各个自变量和因变量的关系图以及差方图,这些图形可以帮助我们直观的理解线性回归的结果。(5)其他功能。本程序还能对现存的回归项目进行管理,并对其数据库做相应的操作,比如修改、删除等。另外,本程序还可以将回归结果保存成Excel表格的形式,以便于日后查看回归结果。

四、应用实例

下面用一个实例来说明本系统的使用过程、数据处理结果以及结果的解读。首先,建立一个名为“TEST”回归项目,来研究某省工业产值()、农业产值()、固定资产投资()对运输业产值()的影响。点击主界面上的“开始回归”按钮,输出如下回归结果。

本软件的回归结果由回归统计、方差分析、回归参数、残差表和DW检验等五部分组成。回归统计部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目等。在表中与之对应的分别是Multiple R、R Square、标准误差和观测值。

在第二部分方差分析中,df、SS、MS和F格列分别代表自由度、误差平方和、均方差和F值。

第三部分回归参数表中包括回归模型的截距、斜率及其有关的检验参数。第一列对应的是回归模型的系数,由此可以建立回归模型:;第二列为回归系数的标准误差,误差值越小,表明参数的精确度越高;第三列t Stat对应的是统计量t值用于对模型参数的检验。

第四部分为残差输出结果。残差输出中包括观测值序号(第一列,用i表示),因变量的预测值(第二列,用i表示)以及残差(第三列)。由于该回归的样本较多,限于篇幅上表仅列出三个样本点。

回归结果的最后一部分为DW检验,用于检验随机误差项具有一阶自回归形式的序列相关问题。

五、结论

本文采用Delphi和ADO数据引擎开发了一个从数据的收集整理和处理,到回归计算以及回归结果的输出和可视化结果的多元线性回归系统。该系统不仅能完成线性回归,还能通过对变量进行运算,完成一部分非线性回归。

参考文献:

[1]贾俊平:统计学[M].北京:清华大学出版社,2004

[2]李全彬 黄 昶:基于Delphi的高效数据库应用系统开发方法[J].微计算机信息,2006,4~3:235~237

上一篇:“三鹿奶粉事件”拷问企业良知 下一篇:基于“建构主义”的“TCSP”教学模式探索与研...