综述数据挖掘在现代物流领域的应用

时间:2022-08-14 02:30:27

综述数据挖掘在现代物流领域的应用

摘 要 本文首先介绍了数据挖掘应用最为广泛的CRISP-DM工作流,然后综述了当前现代物流业的数据挖掘技术的应用情况,最后阐述了我们现阶段在物流行业应用数据挖掘技术应当注意的几方面的问题。

关键词 数据挖掘 现代物流 物流管理

中图分类号:TP311 文献标识码:A

近年来,随着信息技术的广泛应用,各种理论研究和商业应用不断深入,数据挖掘技术也得到了前所未有的发展。现在现代智能物流的提出,也推动着物流业向信息化、自动化、智能化的方向发展,数据挖掘技术在现代物流业的应用也势在必行。目前在仓储、配送、拣货、选址等领域,数据挖掘已经开始得到应用。横向来看,物流业涉及社会的各个行业;纵向来看,物流业贯穿社会生产的各个环节。随着信息技术在物流业的大力推广,物流业各方面的数据会成指数级的增长,如何利用好这些数据为企业服务,提升企业的竞争水平就成了一个重要的课题。

一、数据挖掘的步骤CRISP-DM介绍

数据挖掘流程很多,但是目前流程的挖掘标准流程是CRISP-DM,跨行业数据挖掘标准流程(Cross-Industry Standard Process for Data Mining,CRISP-DM)是数据挖掘方法论,相对于现存的其他数据挖掘方法论,更具有优越性,因而被广泛地采用。CRISP-DM将数据挖掘分成如下六个阶段:

(一)商业理解阶段。

商业理解是明确项目需要达到的业务目的,将其影身为数据挖掘的主题,并从商业角度对业务部门的需求进行理解,将业务需求转化为数据挖掘的定义。同时对现有资源进行评估,以及对项目的可行性进行评估,确定数据挖掘目标并制定相应的项目计划。

(二)数据理解阶段。

数据理解是找出可能影响主题的因数,并确定这些影响因素的数据载体、数据体现形式和数据存储位置。数据理解从数据收集开始,然后熟悉数据,具体包括以下工作内容:检测数据质量,对数据进行初步理解,简单描述数据,探测数据意义,并对数据中潜藏的信息和知识提出拟用数据加以验证的假设。

(三)数据准备阶段。

由于数据可能是不完全的、有噪声的、随机的,有着复杂的数据结构,数据准备是为了建模整理收集到的数据,是数据挖掘最重要的阶段之一,实际的数据准备工作通常占 50-70% 的工程时间和工作量。数据准备阶段具体的工作包含合并数据集、汇总记录、导出新的属性、排序数据、删除或替换空值或缺失值、分类数据等。

(四)建立模型阶段。

建立模型是应用软件工具,选择合适的建模方法,处理准备好的数据集,找出数据中隐藏的规律。在建立模型阶段中,将选择和使用各种建模方法,并将模型参数进行优化。建立模型阶段的具体工作包括:选择合适的建模技术、进行检验设计、建造模型。

(五)模型评估阶段。

模型评估是要从业务角度和统计角度进行模型结论的评估。要求检查建模的整个过程,以确保模型没有重大错误,并检查是否遗漏重要的业务问题。当模型评估阶段结束时,应对数据挖掘结果的计划达成一致。

(六)模型阶段。

模型又称为模型部署,建立模型本身并不是数据挖掘的目标,虽然模型使数据背后隐藏的信息和知识显现出来,但数据挖掘的根本目标是将信息和知识以某种方式组织和呈现出来,并用来改善运营和提高效率。把数据挖掘模型的结果送到相应的管理人员手中,对模型进行日常的监测和维护,定期更新数据挖掘模型。

二、数据挖掘在物流业的应用

(一)市场预测与物流计划。

数据挖掘主要体现在市场的预测以及建立在预测基础上的企业物流计划两个方面。基于数据挖掘的市场预测,是通过各种预测模型,利用数据挖掘工具,对数据进行研究。分析客户的运输习惯和其他的战略性信息。如通过对最近一段时间的数据物流数据进行挖掘,可以从货物的季节性、运输量、库存以及品种等维度进行挖掘分析,形成有价值的分析报告,为企业了解市场提供有效的支持。在物流企业规划和控制活动的预测分析问题上,时间序列分析模型是一种有效的分析模型。

(二)物流中心选址问题。

物流中心主要包含流通中心和配送中心,物流中心的选址直接影响到物流的各项活动的成本,同时也直接关系到物流中心的正常运作与发展,因此物流中心的选址问题是学术界和实业界一直探讨的问题,选址问题即为求解运输陈本、变动处理成本和固定成本之和为最小的最小化问题。选址问题考虑的为中心点数量与分布得的情况,目前更多的是通过假设、简化的方式进行研究。而数据挖掘的应用,可以更好结合实际的情况进行分析,如分类树的应用。分类树 (classification)的目标是连续的划分数据,使依赖变量的差别最大。

通过分类树,可以计算出最终的中心点的位置,并且各中心之间的运输量。在保证业务的同时,使得企业的长期运营的成本是最小的。

(三)仓储存库优化。

仓储库存的优化包含如下几个层级的优化,仓容利用的优化、储存搬运分拣效率的优化、以及高效库存等。仓容优化主要是针对仓库容积的优化,仓库是以存储为基础,而对仓容的优化即表现在相同单位面积的仓库,尽可能的存放更多的物品,通过对仓储环境和物品本身的分析,得出最优的仓储方式。如针对货物的存放问题,我们可以通过数据挖掘模型中关联模式来寻找货物之间潜在的关联规则。通过这样的关联分析,确定了货物集之间的关系,结合企业本身的情况和企业的战略目的,来决定货物的存放。对生产性资料存放,生产过程中的相关的,或者在紧邻的时间流程上的应该存放在一起,对于消费品的存放可以基于交叉销售或者某类交易模式来决定货物的存放。

(四)运输配送优化。

物流配送工作流中,会产生大量的业务数据,而如何分析利用这些数据,来对物流配送进行相应的优化是数据挖掘处理的,物流配送的优化可以分为运输优化以及配送优化。

遗传算法将进行局部优化得到的最优路径继承,并应用到整理,并逐步将其他的区域并入,最后得出最优策略。蚁群算法则是通过信息的积累和更新来寻找最优解,将蚂蚁替代车辆,当遇到运载总量超出额定重量或者运输距离超过额定距离时,返回配送中心,然后服务其他的顾客,直到完成一次循环,并根据巡游记录计算信息素增量,并更新相关路径上的信息素,最终寻找到最优路径策略。这两种算法在路径配送的研究上得到越来越广泛的应用,并且结合其他的顾客信息、运输信息等其他的信息,可以更进一步的完善路径优化问题。

(五)顾客管理。

根据市场营销理论,不同类型的顾客为企业带来的利益是不同的,所以现代企业都在建立与企业利益关联的顾客分层体系,通过对不同层次的顾客提供具有针对性的服务来提高客户满意度以及企业本身的利益。现代物流企业也需要对顾客进行分层体系的建设,通过分析顾客对物流服务的频率、持续性等指标来衡量客户的忠诚度,并通过数据挖掘分析来鉴别用户价值,为企业进一步的战略提供参考。如通过分类模型,进行顾客分类,使得企业能分层营销以及满足客户的服务需求,通过决策树建立客户流失模型,就可以让企业客户未流失之前进行针对性的策略保持客户。

三、数据挖掘在物流业应用注意的问题

(一)挖掘目标的确认。

任何数据挖掘项目的立项,都要基于一个明确的业务目标,只有明确了商业的目标,才能确定数据挖掘的主题,才能计算开展数据挖掘项目的投入产出。

(二)数据准备。

数据挖掘的基础是基于业务数据,业务数据需要企业在业务过程中进行积累,因此企业应该重视日常业务数据的收集、分类和整理,建立企业的数据中心。对于数据挖掘的准备度是建立拥有大量的、真实的数据,数据不足会影响数据挖掘项目的开展,数据不准确,会影响到数据挖掘结论的可靠性。

(三)工具和模型的选择。

数据挖掘首先要选择合适的数据挖掘工具,开展数据挖掘工作,在选择工具时一定要结合企业本身的特点。其次,对于不同的物流领域的问题,应当合理的选择适当的数据挖掘模型,对于任何一种数据挖掘模型,都不是万能,都有其适用的问题类型。对于同一个分析主题,可以采用多种模型,通过预先的评估,以及后期评估来决定模型的选择。

(四)团队的建设。

数据挖掘是对业务的理解、分析和优化,所以数据挖掘不是一个独立的团队,而是业务与技术人才结合的团队,只有通过各个岗位的通力合作,才能完成数据挖掘的任务。对于数据挖掘岗位的人员,不仅仅要求会数据挖掘技术,也一样需要了解业务流程才能更好的完成任务。

四、结束语

我国物流处于一个蓬勃发展的阶段,也是一个竞争日益激烈的行业。同时数据挖掘作为一门新兴的多学科交叉的技术在多个领域取得了令人满意的效果。数据挖掘技术已经在我国的物流企业中开始得到小规模的应用。随着对数据挖掘本身研究的不断深入,以及物流企业的不断发展和对运营绩效的追求,数据挖掘在物流行业的应用一定会有更广阔的空间。

(作者单位:北京物资学院研究生部)

参考文献:

[1]郭献山,乐业. 我国企业物流发展现状及对策的思考. 集团经济研究,2006(12月下旬刊):122~123.

[2]黄绍川. 数据挖掘在物流管理系统中的应用研究. 电脑知识与技术. 2012(20).

[3]黄毅. 数据挖掘技术在物流决策系统中的应用 广州航海高等专科学校学报. 2003(02).

[4]陆澎,樊重俊,李文. 现代企业物流管理中的数据挖掘技术 商场现代化,2009,(3).

[5]李强. 基于聚类分析的物流中心选址问题算法研究. 山东科技大学,2012.

[6]范坤,何智文. 基于数据挖掘在物流管理决策中的应用. 湖北广播电视大学学报. 2008(10).

上一篇:关于第三方物流的产生及其发展面临的挑战分析 下一篇:安全性评价动态管理系统在电力企业生产管理中...