浅谈理化检测数据的多元回归

时间:2022-08-04 02:55:19

浅谈理化检测数据的多元回归

摘 要: 在钢铁生产领域,控制质量的主要依据为理化检测数据。结合宣钢生产的实际,构建理化检测数据多元回归模型,并对多元回归分析步骤进行深入分析,借助该模型能够对机械性能与化学成分之间的关系进行分析。

关键词: 理化检测数据;多元回归分析;运行环境

中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2013)0110171-01

0 前言

对于钢铁生产领域而言,对质量进行有效控制的依据主要是理化检测数据,因此要注意在生产实践中对理化检测数据进行收集和整理。本文结合宣钢生产的实践,借助计算机构建理化检测数据回归分析模型并展开相应分析,以对钢材机械性能与化学成分之间的关系展开深入分析,实现对数据资源的有效利用。

1 理化检测数据的多元回归模型及分析

1.1 模型

先检验各个自变量之间的相关性。两个变量的相关性表示其数值变化趋势的相似程度,相关性高的变量在回归方程中的解释能力相似,在极端的情况下,两个变量的相关性系数为1,那么在回归方程中必须去掉其中一个变量。因此,变量之间的相关性越大,其在回归方程中的综合解释能力越小,这时候就有必要将其中某个变量剔除掉了。

利用MATLAB软件的corrcoef函数可以很方便地得出各变量的相关系数。corr是correlation的缩写,coef是coefficient

的缩写,corrcoef表示协相关系数。对于一般的矩阵X,执行R=corrcoef(X)后,R中每个值的所在行a和列b,反应的是原矩阵X中相应的第a个行向量和第b个列向量的相似程度(即相关系数)。计算公式是:C(1,2)/SQRT(C(1,1)*C(2,2)),其中C表示矩阵[f,g]的协方差矩阵,假设f和g都是列向量,则得到的数就是f和g的协方差。

有 个变量 ,随机变量 ,且有变量的变化会带动随机变量的变化,二者间的线性关系可以描述为:

,这就是回归方程,在上述公式当中,

为回归系数, 表示随机变量,也叫剩余误差。开展回归分析主要是以 为主要依据,得到 组针对随机变量 的观测数据,即: ,这也是开展回归分析的主要目的所在。 是与回归系数

相对应的估值,为准确确定估值的可靠性,需要对所有估值进行统计检验。

1.2 分析

图1 多元回归分析步骤框架图

多元回归分析步骤详见图1所示。

根据上述多元回归分析步骤框架图可以得知,开展多元回归分析的第一步就是理化检测数据库的构建。笔者所举的宣钢的全部检验站都是借助计算机来进行检验和判定,并在计算机中对相应的检测数据进行保存;第二步,对分析数据进行筛选,在对理化检测数据进行选择时主要是以冶炼单位、轧制单位、生产日期、钢种及具体的规格为主要依据;第三步,确定分析参数。变量可以由 以及 等钢材机械性能来充当,化学成分元素以及具体的规格等可以作为自变量;第四步,将其中的异常数据予以剔除,这里所谈及的异常数据主要涉及以下几类数据:第一类是变量值为空或者零的数据;第二类是变量值恒定的记录,还有就是变量值和其均值之差的绝对值是其三倍甚至更多;第五步就是分步骤开展回归性分析。所谓逐步回归,就是以相关变量自身的重要性程度为主要依据,在一组变量当中按照既定步骤选出一个重要变量并将其带入到回归方程中;于此同时,在开展回归计算的过程中,对于最先被引入回归方程的变量而言,存在着这样一种可能性,即在其余变量被引入回归方程之后,最先引入的变量的重要性会相应降低,对于这些变量,也需要及时将其剔除出回归方程。为确保被引入回归方程中的变量确实具备重要性,或者被剔除出回归方程的变量确实是不重要的,还需要针对被引入或剔除出回归方程的变量进行显著性检验,检验合格方可继续进行下一步计算。在每一步计算过程中,变量的剔除是首先需要考虑的内容,只有确保变量有必要予以保留的情况下才考虑将其引入到回归方程中,如果无法对其进行剔除和引入,则需要结束逐步回归计算。

显著性检验临界值为服从F分布的 ,自由度为

,以样本数量为依据,结合所确定的显著水平系数,可以通过查表的方式将的数值确定下来,回归方程方程的可靠性取决于显著水平及选入的变量数量,当F值为0的情况下,意味着所有变量均被选入。在检验显著性的时候, 的作用分别是引入及剔除,并且前者不能小于后者,常使二者相等,但因为利用计算机进行计算存在舍入误差,这就存在出现 后果的可能性,所以,通常情况下常使

。逐步回归框图详见下图所示。最后一步就是将分析结果输出,将最大值、最小值、平均值以及标准偏差等相关变量统计值进行打印。

1.3 程序运行环境及特点

程序运行的硬件环境为:主机是不低于80586的微处理器;以及32MB Free Space 20MB内存;软件环境为:不低于Windows'95版本的操作系统以及V isual FoxPro 3. 0 或更高版本的应用软件。

程序运行主要有以下特点:第一,对数组、宏替换功能简化程度予以充分有效运用;第二,拥有优越的扩展性能,对于

所添加的变量开展多元回归分析,只需要对主数据库的结构进行相应修改即可实现,其用途相当广泛;最后,针对非线性模型而言,可以通过对主数据库进行更改或者是转换变量等方式完成转化,进而开展多元线性回归分析。

2 结语

综上所述,要想实现对钢铁生产领域质量关的严格有效把控,基本前提条件之一就是具备准确且完整的理化检测数据,在钢铁生产实践中要对理化检测数据进行收集和整理。钢铁生产企业要从自身实际情况出发,广泛收集并整理理化检测数据,同时要注意结合具体的生产状况来编制理化检测数据多元回归分析应用程序,此理化检测数据多元回归分析应用程序最大的优势在于运算速度快,并且便于进行数据的筛选,是实现质量有效控制的有力工具,有助于促进企业质量信息处理现代化的尽快实现。

上一篇:模块化移动机械臂控制体系结构分析 下一篇:基于可视化查询系统的设备零备件管理