基于数据挖掘的搜索引擎营销研究综述

时间:2022-06-10 02:53:53

基于数据挖掘的搜索引擎营销研究综述

【摘要】针对数据挖掘技术在搜索引擎营销领域的广泛应用,本文从关键字的生成、排名机制、广告与网页内容的匹配、个性化营销四个角度对这个交叉领域的主要研究成果进行了综述,并做了展望。

【关键词】搜索引擎营销 网络营销 数据挖掘

在搜索引擎营销日益成为市场宠儿的同时,搜索质量也成为重中之重。数据挖掘作为一种比信息检索更高级的技术,已经成功地应用到搜索引擎中,并改善了搜索质量,实现了智能搜索。鉴于数据挖掘在搜索引擎营销中的广泛应用,众多学者也取得了不少研究成果。

一、搜索引擎营销的概念

搜索引擎营销是一种新兴网络营销模式,其含义在于根据用户使用搜索引擎的方式,利用用户检索信息的机会尽可能将营销信息传递给目标用户。

为了达到精准的营销效果,分析用户的搜索过程是十分必要的。用户首先会键入代表需求的关键字,进而会浏览一系列结果页面,然后用户会根据浏览经验、每个链接的标题和内容等原则判断该链接是否与需求相关,从而点击或忽略。通过浏览多个网页内容,用户会做出进一步搜索或停止搜索的决策。接下来,本文就按照用户搜索行为的顺序来总结搜索引擎营销的相关研究成果。

二、搜索引擎营销的研究现状

(一)关键字的生成

一般而言,关键字是指用户在使用搜索引擎时输入的、能够最大程度概括用户所要查找信息内容的字或词,是信息的概括化和集中化。

Amruta 和Rajeev(2000)提出一个新颖的方法TermsNet。这个方法要求判断术语之间的相关性,并用直线图表示彼此的语义关系。Vibhanshu和Kartik(2007)也提出了一个类似方法,即基于核函数去建立术语间的语义关联。

Carrasco等人(2003)提出采用聚类方法对关键字进行归类。他们利用145,000家广告商的关键字组成的数据集,分别采用自上而下的分裂层次聚类法和自下而上的凝聚聚类法,结果证明前者适用高层次的聚类,后者适用低层次的聚类。

Yih等人(2006)推荐了一种利用监督式学习方法从网页中提取关键字的机制。

Stamatina等人(2011)开发了一个基于语义识别方法的关键字自动生成系统,虽然精确性还有待提高,但是也为挑选最优关键字做了铺垫。

(二)排名机制

最能体现搜索引擎设计思想的就是网页排序系统,因为搜索引擎最关注的是如何将与用户搜索请求最相关的链接放在前一百位。学者们多用数据挖掘技术研究算法,而文本排序技术方法基本包括PageRank算法、Allan Borodin等人的完全贝叶斯统计方法、网站级别模型等。

之后,学术界也出现了后缀排序算法。一是后缀树排序算法,主要用数据结构中“树”的结构去产生最终的排序结果。二是后缀数组排序算法,即所有数据都储存在数组这种数据结构中,处于主流的是 Larrsson和Sadakane的快速后缀排序算法。

除此之外,Lacerda等人(2006)建议在情境式营销中采用机器学习的方法寻找排序函数。他们采用遗传编程算法来选择排序函数,该函数放大了训练集上的平均精确度。

(三)广告与网页内容的匹配

为了充分利用用户浏览网页的时间达到营销目的,二者的匹配问题至关重要。Ribeiro-Neto等人(2006)认为利用二者的语义关联提高匹配度。为此,他们提出一个模型,其思想是扩展网页中的关键字以减少二者的词汇不匹配度。

Broder等人(2007)认为,在标准的字符串匹配方法中加入主题的相似性这个变量,会提高广告和网页的匹配度。他们的方法依赖现成的基于语言的分类标准,试图捕捉二者的语义关联。

Murdock等人(2007)认为可利用机器翻译的方法来克服词汇的不匹配问题。

(四)个性化营销

现有的研究一般通过分析用户访问行为进而达到个性化目的。数据挖掘在Web访问行为分析方面应用较广泛,常用方法包括:统计分析、关联规则、序列模式、聚类分析、分类分析。对营销而言,其用途是个性化推荐服务和营销智能。

钟生海和邱玉辉(2011)把情感语义引入了推荐系统,设计了基于情感语义的推荐系统模型。通过商品潜在的情感因素对顾客情绪进行识别,提出了由情感匹配程度计算情感支持度的方法,给出了情感与关联规则挖掘结合的个性化推荐算法。

除此之外,还有些有趣的发现。Dirk等人(2010)尝试性地利用Web挖掘方法从博客中提取数据来形成新产品设想。因为大多数用户倾向于在博客上表达出对新产品的渴求,而利用文本挖掘便可从这种口语体语言中发现有用的信息。

三、总结与展望

目前,这个交叉领域的研究还只是冰山一角,尚有很多研究空间,譬如:(1)分析用户对不同位置推广链接的偏好程度。(2)采用文本挖掘研究不同关键字广告内容对用户决策的影响。(3)研究该营销模式下顾客的延迟购买行为。

数据挖掘可以经过一种非平凡过程从巨量数据库中获取有效的、新颖的、潜在有用的、最终可理解的模式。而搜索引擎营销领域的研究离不开大量有价值数据和模式的支持,所以在今后的研究中也会继续频繁地使用数据挖掘这种新兴工具,相信这个交叉领域会迸发出累累硕果。

参考文献

[1] Dirk Thorleuchter, Dirk Van den Poel, Anita Prinzie. Extracting Consumers Needs for New Products – A Web Mining Approach. Third International Conference on Knowledge Discovery and Data Mining, 2010.

作者简介:刘文文(1986-),女,山东德州人,就读于南京大学商学院,研究方向:电子商务。

上一篇:后危机时代我国信用评级的新契机 下一篇:论不安抗辩权在合同预付款中的应用