规则提取在民航领域中的应用

时间:2022-06-13 07:58:15

【前言】规则提取在民航领域中的应用由文秘帮小编整理而成,但愿对你的学习工作带来帮助。0 引言 形式概念分析,又称为概念格理论,由Wille R于1982年提出,它是数据挖掘的一种有效方法,也是数据分析的一种有力工具。概念格的每个结点是一个(形式)概念,它由两部分组成:内涵(即概念的描述),外延(即内涵所涵盖的对象)。概念格的Hasse图则实现了数据...

规则提取在民航领域中的应用

摘要:提升客户满意度,是增强航空公司竞争力的有效方法。但是有效收集客户满意度可能成本高,时间长。而数据挖掘为挖掘客户满意度提供了便利的方法。本文主要运用面向对象与面向属性概念格的规则提取方法,挖掘出客户的满意度,并在民航领域中的应用做了探索。

Abstract: To improve customer satisfaction is an effective method to increase the competitiveness of airlines. But effective collection of customer satisfaction may cost lots of time and money. Data mining provides a convenient method of customer satisfaction mining. In this paper, the object-oriented and attribute-oriented concept lattice rules extraction method is used to dig out the customer satisfaction, and the exploration application in the field of civil aviation has been made.

关键词: 民航;数据挖掘;概念格;规则提取

Key words: civil aviation;data mining;concept lattice;rules extraction

中图分类号:V261 文献标识码:A 文章编号:1006-4311(2015)20-0165-03

0 引言

形式概念分析,又称为概念格理论,由Wille R于1982年提出,它是数据挖掘的一种有效方法,也是数据分析的一种有力工具。概念格的每个结点是一个(形式)概念,它由两部分组成:内涵(即概念的描述),外延(即内涵所涵盖的对象)。概念格的Hasse图则实现了数据的可视化。因此,它被认为是数据分析与知识获取的一种强有力工具,已被广泛应用于信息检索,机器学习,软件工程和知识发现等领域。

基于概念格的规则提取是数据挖掘中的一项重要内容,它的研究内容是从一个已知数据库中挖掘一组规则(又称规则集)来描述各类数据的特征依赖,并通过此规则集预测其它数据的未知类别。截至目前,该研究方向已取得一系列的理论成果。然后,基于概念格的规则提取技术的实际应用方面尚未见到相关报道,这不利于理论研究的进一步推进。

为了使得基于概念格的规则提取研究得到进一步地完善和发展,本文探索面向对象与面向属性概念格的规则提取方法在民航领域中的应用。

1 预备知识

定义 1[1] 三元组T=(U,A,I)是形式背景,其中U={x1,x2…xn}为对象集,每个xi(i?燮n)称为一个对象,A={a1,a2…am}为属性集,每个aj(j?燮m)称为一个属性,I是对象集U和属性集A之间的二元关系,即I?哿U×A。

定义 2[1] 对于任意X?哿U,X={b│b∈A,?坌x∈X,xIb};对于任意B?哿A,B={x│x∈U,?坌b∈B,xIb}。即,X表示对象集X中所有对象所共同具有的属性集,B表示属性集B中所有属性所共同具有的对象集。

定义 3[1] 在形式背景T=(U,A,I)中,对于X?哿U,B?哿A,满足X=B且B=X,则称(X,B)是一个形式概念,简称概念。其中,X称为概念的外延,B称为概念的内涵。用LW(U,A,I)表示形式背景T=(U,A,I)的全体Wille概念。

3 面向对象与面向属性概念格的规则提取技术在民航领域中的应用

3.1 数据准备

在民航的客户满意度调查过程中,分析员将收集订座系统中存储的大量历史数据,包括序号、团队标识、姓名前缀、姓名、订座记录、舱位、订座状态、订座人数、OFFICE、订座日期等数据。并将其整理成如下数据:完整姓名,订座OFFICE号,订座工作号,订座日期,订座时间,客票类型,票号人信息,出票OFFICE号,出票工作号,票价付款方式,航班配备的阅读材料、飞机是否晚点、飞行状况的通报、客舱卫生间清洁程度、乘务员的精神面貌、客舱座位舒适程度、乘务员的广播、客户满意度等数据。其中1表示满意,0表示不满意。对象部分x1,x2,…,x10分别表示10名乘客,属性部分用下标的字母代替。

3.2 数据处理

数据准备完毕后,整理成决策形式背景,开始对决策形式背景运用数据挖掘的技术进行规则提取。主要按照以下五步进行:

3.2.1 提取Wille概念格

根据定义3,可以提取出决策形式背景F=(U,A,I,D,J)的决策部分的Wille概念(x1、x4、x5、x8、x9、x10,d)。

3.2.2 提取面向对象概念格

从提取的规则r2和r3可以看出,顾客对航班配备的阅读材料满意、乘务员的广播、客舱卫生间清洁程度、乘务员的精神面貌、飞机是否晚点,飞行状况通报中任意事项感到满意,并且对客舱座位舒适程度情况不满意,则乘客满意度为满意。

顾客对航班配备的阅读材料、客舱座位舒适度、客舱卫生间清洁程度、乘务员的精神面貌、飞机是否晚点,飞行状况通报中任意事项感到满意,并且对乘务员的广播不满意,则乘客满意度为满意。

4 结语

针对现有的基于概念格的规则提取技术缺乏实际应用,本文探讨了面向对象与面向属性概念格的规则提取方法在民航领域中的应用。具体结论是,实现了将民航数据转化成决策形式背景,构建Wille、面向对象与面向属性概念格,在此基础上成功挖掘出客户对民航服务满意度的关联形式,从而说明所研究技术在民航领域中的应用初步取得成效。

实际上,优质的空中服务质量对增加航空公司的竞争力具有重要作用,它是追求高质量、高标准、高要求的服务,时刻以消费者的利益为首要服务标准,为人民群众提供与其他交通运输行业完全不同的服务。因此,空中服务质量对民航经济效益具有深远影响。鉴于此,如何提高空中服务质量的研究有一定的效益价值。而本文通过面向对象与面向属性概念格的规则提取方法研究了空中服务满意度问题,为不断提高空中服务质量奠定了理论基础,也间接地体现了所开展工作的使用价值。

此外,本文研究成果为后续开展更多应用研究提供了有价值的参考,也为丰富现有的规则提取技术做出了一定贡献。

参考文献:

[1]Wille R. Restructuring lattice theory: an approach based on hierarchies of concepts[C].in: I. Rival (Ed.), Ordered Sets, Reidel, Dordrecht-Boston, 1982:445-470.

[2]Ganter B, Wille R. Formal Concept Analysis: Mathematical Foundations, Springer, New York, NY, USA, 1999.

[3]鄂旭,邵良杉,张毅智,杨芳,李晗,杨佳欣.一种基于粗糙集理论的规则提取方法[J].计算机科学,2011(01).

上一篇:STEWART通用平台的设计与研究 下一篇:预紧力对接触网套管双耳强度的影响分析