数据挖掘在广电行业的应用探讨

时间:2022-10-02 04:01:58

数据挖掘在广电行业的应用探讨

摘 要 目前,广电行业正面临着前所未有的挑战。网络媒体的兴起给广电行业,特别是无线广播电台业务开展带来了压力。基于此,本文对数据挖掘在广电行业中的应用进行了分析,着重探讨了广电行业客户流失的原因及数据挖掘技术的相关应用,以供参考。

【关键词】数据挖掘 广电行业 应用

1 数据挖掘概述

数据挖掘的定义为:根据企业既定的任务目标,对大量的企业数据进行筛选、转换,探索、验证其中的规律性,并进行模型化处理。换言之,数据挖掘是以大数据为基础的深层次数据分析法,是新兴的商业信息处理技术,能够在海量的数据中获取商业决策的关键信息。将其应用到潜在客户发掘当中,将为有效开展业务带来巨大支持。

2 广电行业客户流失因素分析

相关调查表明,广电行业吸引新客户所需要的花费是维持现有客户的十倍以上。随着我国市场竞争激烈程度不断加剧,广电行业客户流失问题也就愈来愈受到关注。造成客户流失的原因主要包括自然流失、竞争流失和过失流失。自然流失是客户搬迁或死亡造成的流失,竞争流失是因价格战、服务战等市场竞争造成的流失,过失流失是企业服务质量不足或品牌形象差造成的流失,其中竞争流失占广电行业所有客户流失中的比重最大,造成这一现象最主要的因素在于互联网媒体的兴起。要将客户流失的影响降到最低,广电行业应当在努力维持原有客户的基础上,优化营销结构,调整业务策略,并对用户需求、互联网的优劣等进行准确分析,创新服务产品与服务理念,积极吸引新的客户。

3 数据挖掘应用分析

3.1 构建数据仓库

3.1.1 数据仓库的特点

数据仓库的特点主要表现为以下方面:

(1)主题性。数据仓库是以企业中的固有业务为主题对数据进行处理,并从整体的角度对该主题在企业中的价值进行判断。主题也是用户在运用数据仓库辅助决策时重点关注的部分。

(2)集成性。数据仓库中的数据是对大量数据进行筛选、整合后,再通过系统加工、整理、汇总所得。这就需要彻底清除数据的差异性,确保数据仓库内的信息将企业实际状况全面反映出来。

(3)稳定性。在数据仓库中,数据是由相当长一段时期的历史信息所组成。数据仓库中的数据仅在抽取或装载时进行更新,具有较好的稳定性。

(4)反映历史变化。数据仓库中的数据包含准确的时间元素,可对企业的发展历程进行详细记录,并对未来的发展方向进行预测。

3.1.2 数据仓库的建立

建立数据仓库主要包括以下流程:

(1)设计。在确定决策主题的基础上,对数据仓库的结构进行设计。通常情况下,主要采用星型或雪花模型设计数据模型。在设计时还应当确保数据仓库的规范性与各元素之间的联系。

(2)数据筛选、填入。该过程中,需要利用数据库中的主题表定义、数据源定义等规则对异地异构的数据源进行二次加工,并将加工后的数据填入至目标库中。

(3)数据维护。数据维护包括目标数据维护和原数据维护。数据维护是根据原数据的更新任务刷新数据仓库,并根据时间相关性进行相应处理,以及时、准确地反映出数据源的变化。

3.2 数据挖掘在客户流失分析中的应用

广电行业面临的市场竞争愈来愈大,尤其是移动网络的兴起,造成客户数量在短时间内急剧下降。当然,无线广播电台经过长期发展,还是积累了一批受众,这些受众便是无线广播开展业务的重要基础。因此,无线广播电台在确保服务质量的同时,还要创新服务产品,根据客户实际需求对业务进行有效调整,才能扩大业务范围,维持老客户,发掘新客户。上述过程中,数据发掘技术发挥了重要作用:

3.2.1 提出了客户流失分析的主题,如客户流失的原因、流失客户存在的主要特征等

主题是数据挖掘的核心部分,因此必须对客户流失分析中的主题进行准确分析、定位。

3.2.2 数据选择

数据选择过程中,应当在保证客户信息完整性的前提下,收集价值含量高的信息,剔除不必要的信息,降低数据维度。在分析客户流失的原因时,建立数据仓库是为了调查客户信息的变化。因此,需要设置合理的采集时间间隔。若时间间隔过长,则容易造成数据失效,若时间间隔过短,则对硬件和软件系统的要求较高,容易造成资源浪费。

3.2.3 数据处理

对预测影响较大的数据要进行必要的加工处理。数据处理过程中,只有选择合适的流失客户数据,才能建立有效模型。数据处理包括数据清理、数据预处理、数据抽样和数据转换。数据清理与数据预处理是必要的前提工作,包括采集、缺损处理等。数据抽样是在数据库中抽取样本,以减少数据分析的工作量,提高工作效率。数据样本包括训练样本与测试样本。训练样本主要用于建立模型,测试样本则是对模型进行必要的调整。数据转换能够进一步调高数据质量,加强数据分析的准确性。

3.2.4 建立模型

数据仓库建立完成后,利用模型对其中的数据进行分析。初始阶段,分析的结果和结论可能难以达到预期目标,此时应当尝试利用多种模型进行测试,直至筛选出最适合的模型。

3.2.5 客户流失分析

客户流失分析过程中存在两种错误情况。第一是弃真错误,即客户已经流失,而模型未能对客户流失进行准确预测。第二是存伪错误,即客户不存在流失倾向,但模型分析显示客户有流失的可能。通过客户流失分析,可对模型进行进一步完善,使得数据发掘发挥实质性作用。

4 结语

在移动互联网等新兴传媒的冲击下,以无线广播为代表的广电行业正受到前所未有的挑战,客户流失是无法避免的。为维系老客户,发掘新客户,让业务得以正常开展,可运用数据发掘技术,对客户信息进行整合性分析,根据客户特点对业务内容进行调整,以此来捕捉客户的敏感点,让传统业务能够在市场竞争中占据一席之地。

参考文献

[1]涂乔逵.数据挖掘在广电客户流失分析中的应用[J].西部广播电视,2013,(18):60-61.

[2]杨秀萍.数据挖掘技术及其在收视行为分析中的应用[J].福建电脑,2013,(04):124-126+59.

[3]王惠中,彭安群.数据挖掘研究现状及发展趋势[J].工矿自动化,2011,(02):29-32.

作者单位

国家新闻出版广电总局二0二二台 新疆维吾尔自治区喀什市 844000

上一篇:虚拟现实技术在数字图书馆的应用研究 下一篇:基于AVR单片机的智能养鱼控制系统设计与开发