基于决策树的心理危机预警模型研究

时间:2022-10-13 04:49:47

基于决策树的心理危机预警模型研究

摘 要: 网络文化的飞速发展,社会变革的强烈冲击等给大学生造成的心理危机已成为当前高校和社会面临的严峻挑战。通过调查研究,从网络、性格、学习、经济等方面分析了当前高校大学生心理危机产生的各种原因和关键因素,利用决策树C4.5算法对产生心理危机的各种信息进行分析,找出关键因素,建立基于C4.5的大学生心理危机预警模型,以帮助建立、健全危机预警和危机干预机制,并预防大学生心理危机的产生。

关键词: 心理危机; 关键因素; C4.5; 危机预警

中图分类号:TP301 文献标志码:A 文献标志码:1006-8228(2013)01-03-03

Research on psychological crisis alert model based on decision tree

Zhang Limin, Jin Xinmin

(Zhanjiang Normal University, Zhanjiang, Guangdong 524048, China)

Abstract: With the rapid development of network culture and the strong influence of social transformation, the psychological crisis of college students has become a serious challenge to the universities and society. Through the investigation and study, various factors of the psychological problems from several aspects, such as character, learning, economy and so on, are analyzed. Psychological crisis information is examined by means of decision trees (C4.5 algorithm). The critical factor is searched in order to establish a psychological crisis alert model of college students, to perfect the mechanism of crisis alert and crisis intervention and to prevent the psychological crisis.

Key words: psychological crisis; critical factor; C4.5; crisis alert

0 引言

危机系指因内、外环境因素所引起的一种对组织生存具有立即且严重威胁性的情境或事件[1],心理危机则可以定义为当个体面临突然或重大生活逆境时出现的心理失衡状态[2]。大学生心理危机有深刻的社会文化根源,其核心是异质文化的冲突所导致的价值观念的冲突,突出地体现为文化整合中社会主体文化的内在分裂导致大学生亚文化的贫困、文化转型中家庭功能的失调、文化冲突中传统教育的偏颇等[3]。大学生心理危机已成为当前校园危机产生的重要原因,正在威胁着高校的正常教学和管理工作。英国危机管理专家迈克尔·里杰斯特曾经说过:“预防是解决危机的最好办法”。分析大学生心理危机产生的各种因素有利于构建心理危机预警机制和教育干预体系。

计算机技术的飞速发展,信息系统的大量应用,海量数据背后大量的隐藏信息,迫切需要人们对现实数据进行统计分析以发现其中存在的关系和规则,从中获取有用的知识并对未来的发展趋势作出预测。决策树(Decision Tree)是数据挖掘分类方法中最常用的方法之一,能够以图形化的形式表现挖掘的结果,从而方便于使用者快速作出决定或预测。决策树在各行业有广泛的应用,本文将决策树C4.5算法应用于心理危机相关信息的数据挖掘中,旨在分析影响当前高校大学生心理危机的关键因素,为高校有针对性地开展心理健康教育工作提供支持,同时也为建立信息化的校园心理危机预警系统提供理论支撑。

1 高校大学生心理危机产生的关键因素

当代大学生心理危机的产生可以用社会环境、家庭影响、个人性格等多种因素,以及与之关联的各种关系的集合来描述,特别是在当前的社会转型期,社会变革对大学生造成强烈的冲击,价值观念的多元化、人际交往的复杂化、各种压力的并存化极大地增加了大学生的心理负荷,集中表现在客观环境的外在挤压力和个体心理的内在驱动力[4]。

性格缺陷是导致心理健康失衡的重要因素,性格缺陷产生的原因很多,我们采用来源于中国心理卫生协会大学生心理咨询专业委员会组织修订的UPI(University Personality Inventory)调查问卷对入学新生进行调查。根据UPI测试结果,我们对19.11%心理健康状态严重的学生进行邀约面谈并进行甄别,通过与学生的邀约面谈发现,大部分学生通过谈心可以舒缓压力并表现正常,仅有极少数性格偏执,观察发现这部分性格偏执的学生在日后的学习生活中产生了诸多问题。家庭环境是造成各类性格问题的最大原因,尤其是离异家庭和单亲家庭对子女的伤害极大,此类家庭的教育会出现相应的缺失或问题。

学习压力的上升正成为影响大学生心理健康的重要因素,招生规模的不断扩大,学生之间学习能力和成绩水平存在的差异也进一步拉大,还有竞争对手的突然增多,学习环境的相对自由等,让一部分学生陷入了学习困境,导致了学习成绩直线下滑,心理压力也随之增大。此外,学生对专业的满意度也值得关注,兴趣是最好的老师,然而很多就读于一般本科院校的学生却无法选择自己喜欢的专业进行学习。我们在对师范院校的工科学生调查时发现,只有42.66%的学生对自己所学的专业满意,近五成的学生不喜欢自己的专业,心理压力的加剧导致学习和心理双重压力恶性循环,成绩的下滑和补考的增多进一步加深了学生的学习压力。

网络文化的冲击正急速地影响着当代大学生的心理健康状况。在相对封闭的校园环境下,网络在以其自身特有的形式和手段推动着文化的丰富与创新的同时又承载并传播大量文化垃圾。形形的网络游戏对自制力尚不健全的大学生构成了严重的影响,充斥着色情和暴力的网络游戏,会对大学生的心理健康产生负面影响。人类的心理病态主要是由于人际关系的失调而来,沉湎于网络虚拟世界容易造成对现实世界缺乏正常的认知,自我封闭会导致缺乏自我认同,不能正确地评价自己与他人,从而造成人际关系紧张,缺乏应对冲突和危机的能力,色情与暴力元素的存在则会进一步加深心理缺陷。

经济因素在心理健康中的影响力正逐步上升。当前部分高校已有超过30%的学生家庭经济困难,昂贵的学费和生活费对于这部分学生来说是沉重的负担。贫富差距的持续拉大,来自不同家庭的学生在消费观念和消费方式上存在着巨大反差,许多原本相对平衡的心态出现失衡。在调查中我们发现,有29.36%的学生选择“过于担心将来的事情”,这是对未来工作的担忧,也是对未来经济状态的担忧,高额学费的投入已不能产生高额的经济回报,过重的家庭经济压力带来严重的心理压力,最终可能导致危机事件的发生。

2 C4.5算法描述

数据挖掘是一个从大规模数据库的数据中抽取有效的、隐含的、未知的、有潜在使用价值的知识的过程,数据挖掘的结果往往只有统计学上的意义,用户需要寻找的是有意义的、相对部分数据有效的知识,而非一定要考虑所有的数据。目前,数据挖掘的方法和技术主要包括统计分析方法、关联规则方法、决策树方法、粗糙集理论方法、神经网络法、遗传算法、可视化技术等。

分类作为数据挖掘的方法之一,它根据带类标号的历史数据建立模型,进而使用该模型来预测类标号未知的数据所属的类。最知名的分类算法是决策树方法,决策树是用于分类的一种树结构,决策树方法的起源是概念学习系统,发展到ID3方法为高潮,最后又演化为能处理连续属性的C4.5。本文设计并实现用C4.5分类算法来挖掘学生心理危机相关信息数据,通过分类方法较全面地分析学生心理危机与各种因素之间隐藏的内在联系,从大量数据中发现潜在规律,找出隐含的模式,准确掌握学生的心理动态,为心理危机预警提供更多有价值的信息。

J.R Quinlan在1993年提出了C4.5算法[5],他针对基于ID3算法利用信息增益作为分类评价函数来选取最优属性而导致容易倾向于选择取值较多的属性的缺陷,适当地修改了分类评价函数,挑选具有最高信息增益率的属性作为测试属性。对样本集T,假设变量a有n个属性,属性取值a1,a2,…,an,对应a取值ai出现的样本个数分别为ni,若n是样本的总数,则应有n1+n2+…+nk=n。Quinlan利用属性a的熵值H(X,a)来定义为了获取样本关于属性a的信息所需要付出的代价,即

I(X,a)定义为平均互信息,选择属性a作为分类属性之后信息熵的下降程度,即不确定性下降程度,在ID3算法中选择使得I(X,a)最大的属性作为分类属性。

C4.5则选择信息增益率来作为评价指标,信息增益率定义为平均互信息与获取a信息所付出代价的比值,即

信息增益率是单位代价所取的信息量,是一种相对的信息量不确定性度量,以信息增益率作为测试属性的选择标准,即选择E(X,a)最大的属性a作为测试属性[6]。

3 基于C4.5的心理危机预警模型

在高校中,可供我们挖掘的与学生心理健康相关的数据非常多,依据前面的分析我们选择相关性较大的性格指数、游戏指数、贫困指数、志愿指数和补考指数作为建立心理危机预警分类决策树的依据,测试数据表的各字段属性如表1所示。

表1 测试表字段属性

[字段名称\&数据类型\&取值范围\&备注\&ID\&自动编号\&\&记录ID号\&upi\&文本\&ultra/normal\&性格指数\&game\&文本\&indulgence/normal\&游戏指数\&poverty\&文本\&poor/rich\&贫困指数\&volunteer\&文本\&like/dislike\&志愿指数\&test\&文本\&much/few\&补考指数\&alert\&文本\&high/low\&预警级别\&]

关于性格指数,依据UPI测试的分类结果分别约谈可能存在心理健康问题的学生来确定其性格指数,ultra代表存在相对严重心理问题,normal代表心理健康状况相对良好。游戏指数依据学生日常生活中沉湎于游戏的情况分类,indulgence代表沉湎于游戏,并由此产生逃课、成绩下降等现象,normal代表相对正常。贫困指数则主要依据学校的贫困生认定情况分类,通过贫困生认定的即认为是poor,没有通过的为rich。关于志愿指数,依据入学时所选志愿分类,凡学校和专业为第一志愿选择的为like,否则为dislike。关于补考指数,依据自入学起的累积补考课数分类,补考课数大于3的为much,否则为few。预警级别则依据对学生的综合评价分类,评价依据主要来自负责管理该班级的辅导员和班主任的评价,需要指出的是,预警级别高并不代表一定会产生心理危机突发事件,只代表产生各类心理危机的可能性更高。

我们选取了具有典型意义的17条记录作为样本数据进行C4.5的算法实现,表2是经过预处理的数据,也是决策树算法的输入数据,采用由SPSS生产商推出的数据挖掘软件Clementine进行模拟实现。在Clementine中支持两个决策树模型调用,其中C5.0是对算法C4.5的实现,通过实验得出的决策树如图1所示。

图1中,补考指数成为各种属性中信息增益率最大的属性,这说明当前在评价学生时往往把成绩作为第一要素,成绩的好坏决定了学生在老师眼中的优劣标准。与此同时,少数性格偏执的学生成为关注的重点,这类学生往往会提出各种非常规问题,给学校管理带来一定的困难。另外,沉湎于游戏已成为学生产生心理危机的决定性因素之一,沉湎于游戏带来的直接后果是成绩下滑,性格内向,网络游戏正严重地影响着当代大学生的身心健康。我们还发现专业喜好程度和家庭贫困程度并不是产生心理危机的直接影响因素,但仍值得我们关注。

4 结束语

在网络文化飞速发展的今天,大学校园正承受着物质文明和精神文明的巨大冲击,大学生正面临着日益严峻的各种挑战,产生各种各样的困惑,如果不能得到及时的帮助或引导将可能产生非常严重的心理危机,进而影响正常的教学和管理活动。

本文通过调查研究,分析了大学生心理危机产生的种种因素,重点分析了关键因素的产生原因和可能影响,通过引入决策树C4.5算法建立了大学生心理危机预警模型,实验结果验证了心理危机产生的各种因素的可能作用,为建立健全心理危机预警和干预机制,有效预防心理危机的发生提供了理论支持。我们下一步研究的重点是如何从海量的心理危机相关数据中高效地挖掘出学生可能产生心理危机的数据,从而更有效地预防大学生心理危机的产生。

参考文献:

[1] Lichtenstein R, ec al. School Crisis Response: Expecting the Unexpected[J].Educational Leadership,1994.52(3):79-83

[2] Caplan G. (1964) The Principles of Psychiatry.New York: Basic.

[3] 黄建榕,陈建新.论我国大学生的心理危机及其干预系统的建构[J].华南理工大学学报,2004.6:73-77

[4] 吕杰.跨世纪新生代的社会心理承受能力及培养机制[J].当代青年研究,1995.6:11-14

[5] Quinlan J R. C4.5:Programs for Machine Learning[M]. San Mateo:Morgan Kaufmann Publicshers,Inc,1993:17-42

[6] 廖芹,郝志峰,陈志宏.数据挖掘与数学建模[M].国防工业出版社,2010.

上一篇:操作系统教学改革探析 下一篇:“Java程序设计”课程教学思考