基于Web的网站流量统计系统的设计

时间:2022-03-09 04:31:27

基于Web的网站流量统计系统的设计

摘要:传统的网站只是在页面上使用计数器进行简单的访问者数量的统计。随着网站运营规模的扩大,依靠这种简单的数量统计并不能

>> 基于Web的网站流量统计系统的设计 基于WEB技术的网站新闻系统设计 基于Web的校园寻物网站设计 基于WEB2.0的ILAS系统学习与交流网站的设计 基于网站流量统计的网站可用性指标及计算方法研究 基于WEB的招生网站信息管理系统设计与实践 基于Web的精品课程网站系统研究与设计 基于WEB的招生网站信息管理系统设计与实现 基于Web的企业工时统计系统的设计与实现 基于XML的Web站点访问统计和分析系统的设计与实现 基于Web日志的旅游网站流量影响因素分析 基于Web的技术的网站设计 基于医院WEB网站后台设计的研究 基于web的生产统计报表的设计与实现 基于ASP+MSSQL的多用户网站访问统计系统的设计与实现 基于web的项目管理系统设计 基于Web的数据采集系统设计 基于WEB的网上试衣系统设计 基于Web of Knowledge Web服务的机构论文统计分析系统 基于Web的农产品质量安全追溯系统网站的设计与实现 常见问题解答 当前所在位置:l HTTP/1.1" 304 C 我们可以从中分析出访问这的IP地址、访问时间、访问者所在的时区、访问方式、用户请求访问的内容和用户使用的应用层协议。日志分析是网站流量分析最简易、最普遍的方法之一,日志分析的方式仅仅需要对日志文件内容进行数据挖掘工作,所以不受时间地点的限制也不会对服务器的稳定运行造成任何影响。目前有众多日志分析软件能够提供Web流量的数据挖掘和分析工作。比较著名的有:Webtrends、AWStats、Webalizer。不过日志分析方式也存在着一些不足:首先,日志分析仅仅局限于对Web服务器软件提供的Web运行日志文件进行分析,尽管可以通过日志配置的方式来增加一些重要的数据指标,但Web服务器日志提供的数据指标项目毕竟有限,使得在用户访问细节方面很难深入,通常都只是对现有数据进行简单的汇总,这种模式化的分析结果难以与网络营销策略结合起来。第二,对于大型网站来讲,日志分析并不方便,可能会耗费分析机的大量CPU资源,数据汇总的速度也受到日志文件大小的影响,长期数据汇总的结果还要占用大量硬盘空间。第三,日志分析难以实现实时的分析,网站管理员必须把日志数据下载到另外一台分析服务器上进行分析,这样数据的时效性受到了一定的影响。

除了日志分析法,还可以采用基于Web方式的脚本嵌入式的数据获取分析方法。这种方法是在需要统计的网站页面上嵌入一段javascript代码,该代码的作用就是向统计分析服务器发送各种统计数据,包括访问者的各种信息。在服务器端一般具有处理程序来实时存储和处理javascript程序发送过来的数据,大多数分析系统都是采用数据库来存储流量统计数据,使用Web的方式向网站管理者提供网站运行报告,形成一整套流量分析系统平台(如图1)。

图1流量统计平台工作原理图

以下是脚本嵌入法的分析原理和实现过程。

在被监控Web页面上设置 js文件,该文件的作用就是获取访问者的信息,并将搜集到的访问者信息写入到客户端的cookie当中供服务器程序取用。这些访问这信息都是与流量统计有关的各种统计指标,比如访问者操作系统的屏幕分辨率、访问者入站时间、访问者浏览器安装各种插件的状况等一系列数据。以下是一段简单的js代码,说明js程序是如何获取用户信息的:

//取得用户数据的函数代码

function vis_getUrlStat(vis_urlPmv, vis_site, vis_urlDoc, vis_pname, vis_typeClick, vis_vars)

{

var vis_getvars='';

if (vis_vars) {

for (var i in vis_vars){

if (!Array.prototype[i]){

vis_getvars = vis_getvars + '&a_vars['+ escape(i) + ']' + "=" + escape(vis_vars[i]);

}

}

}

var vis_da = new Date();

var vis_src = vis_urlPmv;

vis_src += '?url='+escape(vis_urlDoc)+'&pagename='+escape(vis_pname)+vis_getvars;

vis_src += '&id='+vis_site+'&res='+screen.width+'x'+screen.height+'&col='+screen.colorDepth; //访问者屏幕分辨率情况

vis_src += '&h='+vis_da.getHours()+'&m='+vis_da.getMinutes()+'&s='+vis_da.getSeconds();//访问者入站时间

vis_src += '&flash='+vis_fla+'&director='+vis_dir+'&quicktime='+vis_qt+'&realplayer='+vis_rea;

vis_src += '&pdf='+vis_pdf+'&windowsmedia='+vis_wma+'&java='+vis_jav+'&cookie='+vis_cookie;//客户端浏览器安装插件情况

if ((vis_typeClick) && (vis_typeClick != "")) vis_src += '&type='+escape(vis_typeClick);

vis_src += '&ref='+escape(vis_rtu);

return vis_src;

}

在访问流量分析系统上设置数据处理程序程序,该程序的作用是将cookie中的信息进行处理并存入到数据库中,数据库操作的一段代码如下:

//将统计数据插入到数据库中

$r = query("INSERT INTO ".T_VISIT." (idsite, idcookie, returning, last_visit_time, server_date, server_time, md5config, referer, os, browser_name, browser_version, resolution, color_depth, pdf, flash, java, javascript, director, quicktime, realplayer, windowsmedia, cookie, local_time, ip, hostname_ext, browser_lang, country, continent, total_pages, total_time, entry_idpage, entry_idpageurl, exit_idpage) VALUES ('$idSite', '$idCookie', '$returningVisitor', CURRENT_TIME(), '$serverDate', '$serverTime', '$md5Config', $refererUrl, '$os', '".$a_browser['shortName']."', '".$a_browser['version']."', '$resolution', '$colorDepth', '$pdf', '$flash','$java', '$javascript', '$director', '$quicktime', '$realPlayer', '$windowsMedia', '$cookieAccept', '$localTime','$ip2long', '$hostExt', '$browserLang', '$country', '$continent', 1, '".DEFAULT_TIME_PAGE ."', '$idPage', '$idPageUrl', '$idPage')");

$idVisit = mysql_insert_id();

脚本嵌入法具有很多优点,同时也有不足之处。它的优点有:

(1)数据全面:可以统计各种数据 甚至包括用户客户端软件的信息、分辨率、逗留时间等一系列指标;

(2)实时远程查看:网站管理者可以实时进行远程查看,随时掌握网站的运行情况;

(3)数据管理方便:通过使用数据库进行数据的存储,提高了数据管理的效率,便于流量数据信息的提取和挖掘。

缺点有:

(1)嵌入的js脚本可能会增加一部分Web服务器负担;

(2)要有一台专门做分析服务的服务器,增加运营成本,不过,目前互联网上有众多提供免费流量分析的网站如google analyse等,可以选择运行成熟的公司代为管理流量分析系统来解决该问题。

4 存在的问题

基于Web的网站数据统计系统的建立只是整个网站营销分析的第一步,仅仅应用于流量数据的采集和整理,网络营销真正需要的是结合网站自身特点进行更深层次的分析。在流量分析的过程中,经常采用数据挖掘技术来对获取的流量数据进行归纳和整理,最终分析出对网站营销具有指导意义的分析结果。这个分析结果一定要与网站具有针对性。

虽然,目前的流量统计系统能够获得各种各样的网站访问数据,但如果结合互联网网站服务的多样性来讲,流量统计分析的国内外标准的难以统一致使分析结果没有可比性,同一的流量分析指标并不是适合所有的网站。

5 结束语

基于Web的网站数据统计系统克服了传统的简单的计数分析和日志分析中数据类型相对简单的弊端。能够提供丰富的分析指标,网站管理者能够对用户的访问数量,页面的访问数量,以至访问者的来源等一系列数据指标进行统计和管理,进而制定对更加切合实际的网络营销规划。

参考文献:

[1]蔡巍,王飞龙.政务网站的性能测试与流量分析[J].厦门大学学报, 2004,vol.43(增刊):336-339.

[2]焦蓉梅.浅谈网站流量统计分析法[J].科技信息,2007, (6):518.

收稿日期:2008-01-12

作者简介:李耸(1979-),男,辽宁沈阳人,沈阳理工大学现代教育技术中心助理工程师;房明(1977-),男,辽宁沈阳人,沈阳理工大学现代教育技术中心工程师。

上一篇:基于AM的单点登录(SSO)解决方案 下一篇:视频点播系统研究与实现