将数据挖掘应用于大学生心理问题研究的初探

时间:2022-01-18 11:30:14

将数据挖掘应用于大学生心理问题研究的初探

摘要:本文通过搜集和查阅大量相关文献资料,对将数据挖掘技术应用到大学生心理健康问题研究中的可行性进行分析,并提出了相应的算法和分析思路。

Abstract: In this paper, by collection and accessing to a large number of relevant documents, analysis the feasibility of applying Data Mining to the study of mental problems of college students, and the corresponding algorithms and analysis of ideas.

作者简介:代林玲,性别:女 ,出生年月:1988年10月23日,籍贯:四川泸州,所在单位:西南财经大学统计学院,最高学历:本科

关键词:数据挖掘 心理健康 决策树 关联规则

Key words:Data Mining Mental health Decision Tree Association Rules

一、引言

(一)大学生心理问题的现状

大学生正处在青春发育的后期,其自身生理、心理活动变化较大,常有较多的负性情绪体验,而他们的自我调节和自我控制能力还不强,因此,在处理学习、社交、友谊、爱情等问题时,常引起心理矛盾的激烈冲突,造成心理发展中的失调和不平衡。据调查,大学生因病退学的学生中,有74%是因为社会心理因素所导致。因此,大学生的心理健康研究在国内外受到广泛关注。

(二)数据挖掘的定义

数据挖掘是先从巨大的数据体系或数据库里提炼出我们感兴趣的东西,或者说,从庞大的观察数据集中提炼分析出不能轻易察觉或断言的关系,最后给出一个有用的并可以理解的结论。数据挖掘的一般流程分为数据清洗或准备、提取训练集、进行数据挖掘工作、将挖掘出的成果回馈到原始数据中加以验证并应用于实践等几个步骤。数据挖掘技术已应用于许多领域,如在学校、银行、电信、股市、保险、交通、零售等领域已得到广泛的应用。

(三)将数据挖掘技术应用于大学生心理健康问题研究的优势

目前国内对于心理问题的研究,多使用国际上通用的心理测试量表,如MMPI、SCL-90、EPQ等。其中SCL-90量表应用尤其广泛。但绝大部分的量表调查,往往是简单地停留在传统的分析和统计阶段,并未对数据潜在价值进行深度挖掘,对问题的说明也仅停留在表象阶段。将数据挖掘技术应用与大学生心理健康问题的研究,通过设计一个完整的数据挖掘系统,结合大量已有的数据,为开展高校心理健康教育的规划、决策提供依据,进一步探索学生心理障碍的早期预防、干预的新办法,使学校的心理辅导工作更有针对性和目的性。

二、数据挖掘技术的应用说明

(一)数据收集和处理

目前各大高校针对大学生心理问题进行了大量的心理健康问卷调查,积累了大量的数据,这些数据可以作为数据挖掘的信息来源。具体说来,对数据的处理包括:(1)在数据采集之后,需要进行抽样和清理工作。数据清理工作就是将一些不适合用来训练和学习的数据排除在系统之外,这些数据包括不完全数据、噪声数据以及矛盾数据等,从而得到数据样本集。(2)数据规范:将数据分为各个属性,并对不同属性的数据范围进行划分、标号,将各个属性变量转换称为规范格式,使之后的分析简便易行。如对性别标号为:男11,女10,是否为独生子女标号为:是21,否20。

(二)适用的算法

在数据挖掘技术中,有多种可供采用的具体算法,包括决策树算法、神经网络算法、基因算法、基本统计分析方法、贝叶斯网络算法、关联规则挖掘等。在对大学生心理健康问题的研究中,我们建议使用决策树算法和关联规则挖掘算法。

1.决策树算法

决策树算法是一种常用的数据挖掘算法,采用自顶而下的递归方式构造决策树。决策树算法的分类模型是一棵有向无环树,由根节点、父节点、子节点及叶节点组成。运用决策树进行分析,有ID3算法、C4.5算法、CART算法等。其中运用ID3算法生成决策树研究心理问题是一个比较常见的手段。决策树算法主要运用于大学生心理问题进行数据预测分析,一般思路为:先计算出哪种属性与心理问题最为相关,以此作为决策树的根节点,然后采用迭代递归的方法将剩余的属性同样地采用该算法进行分类,形成决策树,建立一个分类树状模型,用以进行预测分析。

2.关联规则挖掘

关联规则是发现事情之间的联系,以分析事件结果。关联规则最成功的应用之一是对超市的货篮数据进行分析,即通过发现顾客放入货篮中的不同商品之间的关系来分析顾客的购买习惯。其主要算法有Argon算法、Apriori算法,其中Apriori算法在发现关联规则领域具有很大影响力,利用了先验(prior)知识。运用此算法,在大学生心理问题中应用关联规则挖掘,可以找出引起某一心理现象的原因及影响程度,找出属性间的关系,从而为决策提供参考。如经关联规则发现农村的非独生子女中有69%的学生有社交退缩症状,从而将对自闭问题的观察对象,重点放在农村的非独生子女上。

三、结论

数据挖掘作为一种新型的数据分析技术,其研究成果令人瞩目,并且已成功应用到了许多领域。本文分析了当前我国大学生心理问题的现状和高校心理咨询工作的重要性,描述了数据挖掘技术在研究大学生心理问题上的应用前景,并简单阐述了数据挖掘技术的基本原理、过程、方法等,说明了如何运用数据挖掘的具体算法对海量的大学生心理数据进行分析,提取精炼信息,充分说明了这一技术的可行性。相信在21世纪科技高度发达的今天,任何一种优秀的技术都将为人们所实用,数据挖掘技术的广阔前景,无疑是我们所最看重的。

参考文献:

[1]梁.数据挖掘算法与应用[M].北京:北京大学出版社,2006

[2]杨雪花,戴梅竞.学生心理健康状况及其研究进展[J].国外医学社会医学分册2000,17(2)

[3]任丽君,大学生心理问题数据挖掘系统的设计与实现[J].东莞理工学院学报,2008,15(5)

上一篇:回归课本 决胜高考 下一篇:英语翻译中定语从句的翻译