数据挖掘技术在高校人力资源管理中的应用

时间:2022-06-30 02:38:09

数据挖掘技术在高校人力资源管理中的应用

摘 要: 本文探讨了一种基于分类和关联规则挖掘的数据挖掘方法:利用相似性分析将教师分为若干类型,对每一类型应用关联规则挖掘其中隐含的规则;并应用于高校人才引进、任用等管理工作中。

关键词: 数据挖掘技术 高校人力资源管理 应用

1.引言

数据挖掘(Data Mining,DM)也称为“从数据中挖掘知识”,就是从大量的数据中,找出隐藏其中的、有用的信息和知识的过程。“啤酒加尿布”的故事,是数据挖掘的一个典型应用。目前,高校都建立了完善的人事信息管理系统,并积累了大量数据[1]。对高校人力资源数据运用数据挖掘技术进行分析,抽取其中有用的信息,对高校教师的引进、任用等管理工作能起到一定的辅助作用[2]。

2.高校人力资源的数据模型

在高校人力资源挖掘中所使用的数据表的模式为:人力资源表(职工编号,职务,学历,职称,身份,政治面貌,性别,专业代号,考核成绩,毕业学校,出生年代,本校兼职,学历培训,来源类别,来校年龄,工作年龄,业务培训,科研论文,科研立项)。

由于人力资源中的属性大多具有有限个不同值,为了便于对被评测教师进行分类,我们对部分相应指标进行编码如下:

・职工编号:教师的主码,不参加分类和规则挖掘。

・职务:无(0)、副科(1)、正科(2)、副处(3)、正处(4)、副厅(5)、正厅(6)。

・学历:初中(0)、高中(1)、中技/中专(2)、大专(3)、学士(4)、双学位(5)、硕士(6)、博士(7)、博士后(8)。

・职称:无(0)、初级(1)、中级(2)、副高(3)、正高(4)。

・身份:行政(1)、工勤及其他(2)、教辅(3)、教师(4)、科研(5)。

・政治面貌:群众(1)、共青团员(2)、共产党员(3)、派(4)。

・性别:女(0)、男(1)。

・专业代号:哲学/社会学政治法律(1)、经济管理(2)、文化教育(3)、自然科学(4)、农业科学(5)、医药卫生(6)、工程技术(8)。

・考核成绩:95―100分(5)、85―94分(4)、75―84分(3)、60―74分(2)、<60分(0)。

・毕业学校:重点院校(5)、一般院校(4)、进修(3)、专科(2)、中技/高中(1)、初中(0)、留学(6)。

・出生年代:两位整数,如60,指1960年―1969年出生的人。

・本校兼职:兼职教师(1)、本校教师(0)。

・学历培训:有(1)、无(0)。

・专长:有(1)、无(0)。

・学科:重点(1)、一般(0)

・来源类别:毕业分配(1)、调入(2)、博士后出站(3)、回国人员(4)。

・来校年龄、工作年龄、业务培训、科研论文、科研立项:为数量指标。

3.高校人力资源数据挖掘中使用的算法

(1)教师群体分类方法

在人力资源表中设置了很多属性,用于体现教师的各方面特征指标,便于对教师从各方面进行分类。常用的分类法是:基于相似度的计算。

设两个教师;人力资源表征指标个数为m;Y≤i≤m)表示第i个特征指i个指标T

4)根据分类对象的实际情况和分类要求确定分类强度p和各指标从而可以计算教师两两之间的整体相似度,在强度p下把教师群体分为若干类[3]。

(2)关联规则挖掘

关联规则从本质上讲是条件概率:A发生时,B同时也出现的概率是多大[2]。记为A=>B,其中,A?奂Y,B?奂Y,且A∩B=Φ。A和B称为数据项集,Y=(Y为m个指标的可能取值。运用关联分析的目的是寻找数据项的相关性。本文采用兴趣度的关联规则挖掘算法,挖掘每类人员不同属性间的相关性。

支持度、置信度两个指标来描述一条关联规则成立的可能性。

1)支持度(Support):数据集D中同时包含A和B的记录所占整个数据集的百分比。

Support(A)= Support(A=>B)=Support(A∪B)

2)置信度(Confidence):数据集D包含A的记录中同时也包含B的百分比;反映了在规则成立的条件下结果成立的概率。

(Confidence)(A?圯3)兴趣度(interesting):反映了关联规则中元素关系的密切程度。兴趣度大于1才有意义,越大说明该规则中的元素的关系越密切,该规则的实际利用价值越

(Interesting)(A?圯B在数据集D中的关联规则挖掘是寻找大于最小支持度、最小置信度和最小兴趣度的所有规则,因而可以由用户和行业专家设置支持度、置信度和兴趣度的下限s、c、i,从而发现有意义的规则。

4.关联规则在高校人才引进中应用

以近4年引进的200人作为数据集,对其出生年代、职称、学位、专业、学科、科研项目、科研论文、专长等属性字段进行分析,其中部分数据如表1所示[4]。

表1 高校人力资源数据表

对人力资源数据进行关联规则挖掘,得出如表2所示的关联性。

表2 关联规则

此例中以s>65%,c>24%,i>1作为规则的筛选下限。则对规则进行分析:

Rule1:职称(“教授,副教授,讲师”)=>学科(“重点”),s=70%,c=32%,i=1.06

Rule2:学科(“重点”)=>职称(“教授,副教授,讲师”),s=75%,c=66.7%,i=1.07

对比后发现,“教授或副教授或讲师属于重点学科人员”的可能性(32%)低于“重点学科的人员为教授或副教授或讲师”的可能性(66.7%)。说明关联规则Rule2学科(“重点”)=>职称(“教授,副教授,讲师”)是一条更有意义的关联规则。而关联规则学历(“硕士”)=>学科(“重点”)的i=0.98<1,则没有意义。

5.结语

本文运用数据挖掘对高校人才引进策略进行分析,说明数据挖掘算法的应用。我们将在后续的研究中将数据挖掘技术应用到高校人事管理的诸方面,对高校人力资源管理工作提供更多的客观依据。

参考文献:

[1]白菲,孟超英.数据挖掘技术在高校人事信息建设中的应用[J].教育信息化,2005.8:75-76.

[2]安淑芝.数据仓库与数据挖掘[M].北京:清华大学出版社,2005.6.

[3]接励,王虹.高校人事管理信息中的关联规则挖掘[J].天津师范大学学报(自然科学版),2004.6,(2):64-66.

[4]高建伟,罗省贤.数据挖掘在人才引进中的应用[J].四川师范大学学报(自然科学版),2005.1:123-126.

[5]陈安,陈宁,周龙骧.数据挖掘技术及应用[M].北京:科学出版社,2006.3.

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

上一篇:关于4G移动通信系统关键技术的多入多出技术研... 下一篇:新课改下的初中体育课教学反思