数据网络研究报告范文

时间:2023-09-25 01:08:53

数据网络研究报告

数据网络研究报告篇1

艾默生网络能源与Ponemon研究院曾在2010年首次联合了数据中心宕机成本研究――一项对数据中心宕机的成本与成因进行的独立研究。该研究报告曾在2013年更新,今年是再次更新。最新的报告有如下最新发现:

意外宕机平均每分钟总成本从2010年的5617美元增加到2013年的7908美元,再到现在的8851美元。

单个数据中心宕机的平均成本从2010年的505502美元增加到2013年的690204美元,再到现在的740357美元。从2010年首次报告到现在,增长率达到38%。

最高宕机成本增加更快,从2010年到现在增加至2409991美元,增加了81%。

UPS系统故障,包括UPS主机和电池故障,是数据中心意外宕机的首要原因,占所有发生故障的1/4。网络犯罪所导致的数据中心故障增长最快,从2010年占2%增长到2013年的18%,再到现在的22%。

“如今数据中心的复杂度越来越高,持续为企业和组织带来更大的挑战,而企业和组织在努力建设和管理其IT基础设施,以减少代价高昂的宕机。”艾默生网络能源数据中心解决方案总裁Steve Hassell说,“我们与Ponemon研究院联合进行研究的目的,就是为行业提供基准和有价值的观点,帮助他们做出明智的决策,避免代价高昂的宕机。”

Ponemon研究院因其在隐私安全、数据保护和信息安全政策方面的独立研究而获得IT行业高度认可。

在艾默生网络能源与Ponemon研究院联合进行的5个研究报告系列当中,该份报告将创造行业标杆,提供行业应对主要挑战、做出决策所需的见解。而当前,整个行业都在构建强大的IT基础设施,支持企业内部用户、合作伙伴、供应商和客户在数字时代获得更大价值。

Ponemon研究院主席LarryPonemon说,“艾默生网络能源勇于创立行业标准,将帮助数据中心开发者与管理者更好地应对所面临的挑战,从而为企业与组织的数字化转型提供巨大支持。”

数据网络研究报告篇2

【摘 要 题】信息资源建设与管理

【关 键 词】灰色文献/网络灰色文献/资源建设

【正 文】

    灰色文献是指通过正常途径难以获得的文献。传统的灰色文献主要包括会议论文、科技报告、内部刊物、政府报告、学位论文、档案文献、产品样本、广告样本、翻译文献等。1997举行的第三次灰色文献国际会议,就灰色文献的定义基本达成了共识,认为灰色文献是指不受商业出版者控制的,由各级政府部门、学术机构、工商业界生产的各类印刷或电子形式的文献资料。近年来,随着网络的普及以及传统的出版费用的增加,通过网络出版、传播和获取灰色文献成为重要的手段。网络灰色文献不仅包括传统灰色文献的网络载体形式,而且还包括许多非正式出版但具有学术性的在线信息、电子预印本等。一般来说,网络灰色文献资源主要是对科研和生产有较高利用价值的学术信息资源。本文主要对我国网络灰色文献资源建设的现状、存在问题和发展对策进行探讨。

    1 我国网络灰色文献资源建设的现状

    我国网络灰色文献资源的建设开展时间较晚,就目前而言,主要指学位论文、会议论文、技术报告以及其他学术资源方面的建设。

    1.1 学位论文

    学位论文是一种重要的网络灰色文献资源,它是一种原创性的研究成果,理论性、系统性较强,内容专一,具有一定的独创性,目前,我国的学位论文数据库方面的建设主要有以下几方面。

    calis的高校学位论文数据库。该数据库是一个集中检索、分布式全文获取服务的calis高校博硕士学位论文文摘与全文数据库,由清华大学图书馆牵头组织,协调全国86所高校合作建设的文摘索引数据库。系统收录包括北京大学、清华大学等全国著名大学在内的83个calis成员馆的博硕士学位论文,内容涵盖自然科学、社会科学等各个学科领域。

    万方数据资源系统的中国学位论文数据库。该数据库是万方数据库的子系统,由中国科技信息研究所提供。它的记录来源于1977年以来各高等院校、研究生院及研究所向中国科技信息研究所送交的我国自然科学领域的硕士、博士和博士后论文。其文摘记录数量到2006年7月23为止已达到766609条,每日更新,而全文数据库收录了自1986年以来的博硕士论文,涵盖自然科学和人文社会科学的各学科领域,全文数量到2006年7月23日为止已达到492562篇。

    中国期刊网的中国优秀博硕士学位论文全文数据库。该系统是目前国内相关资源最完备、收录质量最高、连续动态更新的中国博硕土论文全文数据库,至2006年7月23日,它收录了1999年以来305家博硕士培养单位的优秀博硕士学位论文约321506篇。覆盖的范围有:理工a(数理化天地生)、理工b(化学化工能源与材料)、理工c(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学、电子技术与信息科学。该数据库及各镜像站点每日更新,专辑光盘每月更新,专题光盘年度更新。

    国家图书馆学位论文收藏中心。国务院学位委员会指定的全国惟一负责全面收藏和整理我国学位论文的专门机构;也是人事部专家司确定的惟一负责全面入藏博士后研究报告的专门机构。迄今已收藏自 1981年实施学位制以来的博士论文(包括所有博士授予单位及其专业)近12万种,收藏率达98%;收藏近年来硕士论文和博士后研究报告万余种。此外,自 1992年至今,已向海外征集到中国留学生的博士论文千余种。该馆并建置了“全国博硕士论文资讯网”,自 1986年至今共建立全国65所大学院校、882个研究所的126000余篇博硕士论文的摘要资料。

    1.2 会议论文

    会议论文也是一种重要的网络灰色文献资源,目前,我国会议论文数据库的建设主要集中在以下几方面。

    万方数据资源系统的中国学术会议论文全文数据库。中国学术会议论文全文数据库是国内惟一的学术会议文献全文数据库,主要收录1998年以来部级学会、协会、研究会组织召开的全国性学术会议论文,每年涉及600余个重要的学术会议,每年增补论文15000余篇,数据范围覆盖自然科学、工程技术、农林、医学等领域。到2006年7月,总共收录会议论文 407004篇。

    中国医学学术会议论文数据库。该库是解放军医学图书馆数据库研究部开发的以医学学术会议论文为来源文献的数据库,收集了1994年以来的中华医学会所属专业学会、各地区分会以及编辑部等单位组织召开的全国性医学学术会议论文集的医学文献,约700多个会议15万多篇文献。会议论文大部分只在大会上宣讲或传阅,只有少部分会议在医学期刊上。数据库收集面广、会种多、内容丰富,是目前我国收集较为齐全的医学会议文献数据库。

    中国知网的中国重要会议论文全文数据库。收录 2000年以来(部分回溯至1999年会议论文)中国国家二级以上学会、协会举办的重要学术会议、高校重要学术会议、在国内召开的国际会议上发表的文献。年更新约100000篇文章。至2005年12月31日,累积会议论文全文文献38万多篇。中心网站及数据库交换服务中心每日更新,各镜像站点每日更新。

    1.3 研究报告

    研究报告作为一种重要的网络灰色文献资源并没有得到足够的重视,主要包括以下两种。

    国研网的国研报告。国研网(国务院发展研究中心信息网)创建于1998年3月,是国务院发展研究中心信息中心主办、北京国研网信息有限公司承办的大型经济类专业信息网络服务平台,它全面汇集、整合了国内外经济金融领域的研究成果和经济信息。其国研报告是一种有关中国经济和社会诸多领域的调查报告,内容丰富,设有社会发展研究、宏观经济研究、农村经济研究、金融研究、产业研究、企业研究、政府管理研究、技术发展研究和区域经济研究等9个专题报告,具有很高的权威性和预见性。每年约200期,不定期出版,网络每天在线更新,印刷版每月出版。

    中国商业报告库。它是中国资讯的子库之一,收录1993年以来经济专家及学者关于中国宏观经济、金融、市场、行业等的分析研究文献及政府部门颁布的各项年度报告全文,主要为用户的商业研究提供专家意见的资讯。到2006年7月23日为止,共收录218723篇报告,数据库每日更新。

    1.4 电子预印本资源

    电子预印本资源是开放存取资源的一种主要类型,也是一种新兴起的网络灰色文献资源。国内的电子预印本系统建设起步较晚,2003年以来,许多研究机构和个人组织纷纷建立电子预印本系统,收集电子预印本资源,主要有中国科技论文在线、奇迹论文、中国预印本系统等。这些预印本系统提供了向科研人员提供方便稳定的预印本服务,方便科研人员第一时间自己的研究成果,并在中国学术界中推广开放存取的思想和理念。目前,国内的电子预印本系统基本上覆盖所有的学科。

    2 我国网络灰色文献资源建设存在的问题

    2.1 缺乏一个全国性的网络灰色文献收集管理中心

    国外许多国家都非常重视灰色文献的收集管理和开发利用,成立专门性的全国灰色文献机构,如:英国大英图书馆文献供应中心、德国灰色文献中心等,集中收集整理本国以及其他国家的灰色文献,并建立了许多灰色文献网站,如:灰色文献网(greynet)、美国的灰色文献门户网站(greylit network)等。而一直以来,我国由于缺乏对网络灰色文献的开发意识,并没有专门设立一个统一的机构对网络灰色文献进行集中、系统的收集整理和开发利用,现有的灰色文献系统一般都偏重于搜集某一类型的灰色文献,如学位论文、会议论文、政府报告等等,各自为政,缺少合作,同类资源重复建设的现象较严重,缺乏系统的开发利用,缺少一个含多国家、多类型、跨学科的大型综合性网络灰色文献信息系统。

    2.2 网络灰色文献类型少,规模较小

    国外针对灰色文献开发利用的类型多种多样,涵盖了灰色文献的所有类型。如sigle收集有科技报告、学位论文、会议论文、译文、预印本、政府出版物等,另外,除收集本国的各种灰色文献资源外,还积极开发利用其他国家的灰色文献资源。

    而我国目前对于灰色文献的开发类型还主要集中在学位论文、会议论文和科研报告方面,近几年来开展了针对电子预印本资源的开发利用,并建立了中国预印本服务系统、奇迹文库和中国科技论文在线等三大电子预印本服务系统,但由于电子预印本系统还处于起步阶段,规模小,论文的提交量还相当有限,其中许多学科提交的论文数量只有几篇甚至从来就没有。另外,在译文方面的开发利用也还未能开展。而且我国的灰色文献资源来源也主要局限于国内的高等院校、研究所、协会、学会和政府等,对国外灰色文献的收集和开发利用也很少。

    2.3 网络灰色文献开发利用缺乏标准化建设

    网络灰色文献开发利用的最终目的是资源共享,而标准化与规范化则是灰色文献资源共享的前提,没有规范和统一的技术标准,资源共享将成为空谈。目前我国网络灰色文献资源的建设仍处在一种零星分散的状态,数据格式多种多样,数据缺乏统一的规范和标准,而且数据的建设重复较多,覆盖的广度也不够,这些问题给实现数据共享带来很大障碍。而国外对网络灰色文献资源的开发利用由于有一个相对集中的管理中心,该中心已通过建立起统一的规范和标准对灰色文献进行集中收集和管理。

   2.4 网络灰色文献的版权保护问题期待重视

    网络灰色文献资源的开发和利用过程中会涉及到大量的知识产权问题,一般来说,对于任何形式的复制、分发、租赁、存储等目的的使用权限需要向文献的版权所有者申请。虽然有合理使用的范畴,但为了不侵犯灰色文献版权者的权益,在开发和利用网络灰色文献资源时,首先要保持文献资源的完整性,并注明资源版权者的姓名,如带有营利目的,还应向版权者支付版权费用。就目前来说,许多大的灰色文献收藏机构往往能够获得文献的版权,并向用户提供一般意义上的使用权,如个人的研究需要或非商业目的的使用。但有些灰色文献收藏机构只对一部分特定用户提供使用权,而大多数用户在使用或下载时需要申请权限。另外,还有很多灰色文献没有明确的版权说明,有些甚至没有明确的来源信息,更无从考证版权,这些都给网络灰色文献的收藏和利用带来了很多隐患和困难。

    3 我国网络灰色文献资源建设的对策

    3.1 建立全国性的网络灰色文献资源管理机构

    我国政府和各个灰色文献收藏机构应该重视网络灰色文献的开发利用,政府应根据需要制定网络灰色文献资源建设的总体规划,并统一和协调各个灰色文献收藏机构的具体规划,从而保证对本机构范围内的网络灰色文献的收藏和开发利用。目前,各种类型的网络灰色文献资源中,学位论文的收藏和利用较为系统化和规范化,建立了国家学位论文服务体系,成为国家科技文献资源建设与共享服务平台的重要保障之一。但其他类型的网络灰色文献资源如会议论文、技术报告、国家标准、开放资源等等的收藏和开发利用并不系统。因此,有必要像欧美国家一样,成立全国性的、统一的国家网络灰色文献资源管理机构,加大对网络灰色文献开发和利用的资金投入力度,并制定相应的规范和标准,加强各收藏分机构间的合作,统一协调开发利用工作,避免重复建设,以收集更多的网络灰色文献资源,为社会提供更多的灰色文献资源服务。

    3.2 切实加强收藏和组织利用各种网络灰色文献资源

    如前所述,网络灰色文献资源是一种重要的学术信息资源,网络灰色文献资源种类多,国外针对灰色文献开发利用的类型多种多样,涵盖了灰色文献的所有类型,如科技报告、学位论文、学术会议论文、译文、预印本、政府出版物等。而我国对于网络灰色文献资源的建设主要集中在学位论文、学术会议论文和科研报告方面,特别是对于最后几年出现的网络开放存取的学术资源,并没有进行有针对性的收集。另外,除了多途径多类型、广范围地收集各种网络灰色文献外,还应该有针对性地开发利用网络上的灰色文献,通过有效的方式对灰色文献资源进行组织管理,并制定管理章程、规范和条例,确定灰色文献的收藏范围、原则和保管细则等具体的管理办法,加强灰色文献研究与开发,以便人们更好地利用。有必要在现有的基础上,加大对网络灰色文献开发利用的力度,进一步加强对学位论文、会议论文和报告的开发外,还要加强对开放存取资源、译文和政府出版物等类型网络灰色文献的开发利用。

    3.3 加强对网络灰色文献资源的版权保护

    加强对网络灰色文献资源的版权保护有利于灰色文献资源建设的持续发展。由于对网络灰色文献资源的收集、整理、加工、翻译、复制、传播、利用等方面,不可避免地涉及知识产权问题,网络灰色文献资源版权保护方面存在较大的复杂性和难操作性,有必要重新修订《知识产权法》中的有关条款,加大对网络灰色文献资源的保护力度和违反后的惩罚力度。同时,应该大力宣传《知识产权法》,加大宣传以及采取专门措施,逐步强化人们的知识产权意识,长期有效地开发和利用网络灰色文献,走可持续发展之路。

    3.4 加强网络灰色文献的开放存取

    在加强对网络灰色文献资源版权保护的同时,有必要加强网络灰色文献资源的开放存取,国外的网络灰色文献资源中,有许多是开放存取资源,用户在遵守知识产权保护的基础上,能够免费利用这些开放存取资源。而国内由于利益方面的问题,资源共享并没有得到有效的实施,,只停留在本机构范围内、系统内的资源共享,如大学校园网外的用户并不能有效利用大学图书馆购买或开发的网络学术资源,包括许多网络灰色文献资源。因而,有必要进行网络灰色文献资源的开放存取,机构生产者可以在本机构建立机构库或学科库,用户将自己撰写的灰色文献资源通过网络提交到机构库或学科库中,而机构库通过特定的协议如oai元数据收割协议(oai pmh)和其它机构库或学科库实现互操作,形成更大范围内的网络灰色文献资源的开放存取。

    3.5 加强网络灰色文献建设的标准化和规范化建设

    标准化和规范化是网络灰色文献资源建设的前提和基础,要实现资源共享,就必须要有统一的标准规范。欧美许多国家都建立了完备的网络灰色文献数据库,并遵循较统一的、易操作的标准和规范。我们在建立网络灰色文献数据库时,一定要充分研究与国外接轨的规范和标准,实现网络灰色文献资源著录格式、标引规则、数据指标、符号转换等方面的标准化,并根据国际标准和通用规范,逐步推出资源标识、描述、存贮、查询、交换、管理和使用等方面的标准规范,形成我国网络灰色文献资源建设所需的标准规范体系,真正使我国网络灰色文献信息资源能够被社会以最方便的形式获取和利用。

   

【参考文献】

    [1] http://www. chinainfobank. com/dir/baogao/bg00. htm

    [2] http://gz. wanfangdata. com. cn/cddb/cddbft. htm

    [3] http://www. paper. edu. cn/home. jsp

    [4] http://www. qiji. cn/

    [5] http://prep. istic. ac. cn/eprint/index. jsp

    [6] http://ckrd. cnki. net/grid20/navigator. aspx? id=2

    [7] http://edu. drcnet. com. cn/drcnet. channel. web/report/ index. aspx

    [8] 王新.因特网上灰色文献的开发与利用.情报理论与实践,2005(2):209-212

数据网络研究报告篇3

    摘要:本文通过对大量的有关网络受众的调查数据的研究,得出了以下的规律性结论,网络受众呈现大众化( “平民”化)趋势;网络受众上网的主要目的是获取信息,常用工具是电子邮件和搜索引擎;网络受众对网络广告的认可程度在不断提高,开展电子商务的时机日趋成熟;网络受众对黄色信息存在猎奇心理;网络受众浏览的网站日趋集中,网络受众的注意力呈现“马太效应”。

    Keywords:Internet communication, Internet audience, quantitative analysis

    Abstract: The anthor deduces rules about Internet audience by analyzing a lot of data about Internet audience. Internet audience becoming popular, acquiring information is their main purpose, email and search engine is their favourite, Internet advertisement becomes more and more acceptable, they seek novelty for yellow information, the attention of Internet audience focuses on few webstation.

    在传播学的受众研究中,定量研究方法起到了重要作用,传播学史中着名的有关受众的理论基本上是建立在对大量一手数据的定量分析和研究的基础之上。在网络媒体日益兴盛的今天,对网络受众进行定量研究显得十分迫切和重要。

    依据中国互联网络信息中心(CNNIC)公布的《中国Internet发展状况统计报告》的数据以及在互联网上获得的其他调查数据,笔者对中国的网络受众的进行了定量研究,发现中国网络受众以下的几大特征和趋势。

    一.网络受众的大众化( “平民”化)趋势互联网的发展在很大程度上是“贵族”的“专利”。这里所说的“贵族”是指受教育程度和经济收入较高的年轻的单身男性“贵族”,这从历次的中国互联网络信息中心公布的《中国Internet发展状况统计报告》就可以得出结论。一般的研究也认为,网络受众即“网民”群体的特征为:信息需求大、年龄小、教育程度高、收入多、以男性和白领为主。

    但是,通过对大量的历次数据及国内外数据的对比研究,我们发现,网络受众已经开始呈现出大众化趋势(或称为“平民”化趋势)。

    1. 网络受众数量呈指数增长

    CNNIC第一次公布《中国互联网络发展状况统计报告》是在1997年,截止到1997年10月31日,中国互联网用户人数是62万,此后每年统计和公布两次。1998年上半年,中国互联网用户达到117.5万,这一年的12月31日就达到210万,几乎翻一番;1999年6月底400万,1999年12月底890万,每半年翻一番的趋势形成;进入2000年,伴随全球互联网发展的高潮,中国上网用户人数继续迅猛增长,截止到6月31日达到1690万人,相比上一年同期翻两番有余。但是,2000年下半年就显示出增长趋缓的迹象,比上半年只增长了560万人。到2001年6月30日,我国互联网用户人数达到2650万,比2001年1月的2250万增长了400万人。

    目前中国网民的人数居世界第二位,仅次于美国。美国有一亿多网民,中国有2500万网民。中国网络人口2001年底将达3500万,比2000年底止2250万人成长56%。

    按照目前的发展速度,中国互联网用户将在2001年底突破或接近3000万,2002年底至少突破3500万。

    以下是笔者在MICROSOFT OFFICE EXCEL下对中国网民增长数据的处理结果:

    中国网民呈指数增长的原因很多,主要原因在于中国经济实力的增长,同时上网费用的下降:中国的电信事业的迅速发展,电信基础设施得以大幅改善,同时电子及通信产品制造业已经成为中国第一支柱工业,为上网创造了良好的环境;中国教育事业在发展,使得计算机网络知识和技能在迅速普及。

    然而,中国网民的绝对数量在高速增长的同时,相对数量(网民占人口的比例)与发达国家还是有很大的差距。据信息研究机构JUPITERMMXI日前公布的统计数字报道,挪威的全国人口中每个月都上网的人数比例已达到63%,丹麦上网人数比例达36%,美国上网率超过50%,瑞典29%,英国25%,德国18%,法国14%,意大利13%,西班牙9%。整体而言,2000年全球约有4亿人每天在使用互联网,预料到2005年将超过10亿人。华盛顿的Strategis公司经过调查,在美国,互联网用户人数已达到一亿,现在美国有半数的成人在使用互联网。据日本2001年06月30日发表的《2001年因特网白皮书》提供的统计,截止2001年2月底,日本共有网民3263.6万人,比去年增加1937.9万人。白皮书预测,到今年年底,日本网民人数将增加到3628万。

    按照传播学界的共识,当一种媒介的使用者人数超过总体的20%亦即 1/5以上,它就跨越了“普及”的门槛。以美国为例,为达到这一标准,广播用了38年,电视用了13年,而网络只用了5年。根据传播学中的“扩散S曲线理论”,当一种新产品或服务在其潜在市场中占据10~25%份额之际,扩散率就将急剧上升。

    此外,手机正在成为媒体工具,促使网民数量的飞速增长。短短几年,在中国,手机的使用不仅已经大普及,而且手机的功能也大扩充,它已由最初单一的双向语音通信工具,变成媒体信息的接收端和个人信息的发送端。据日本2001年06月30日发表的《2001年因特网白皮书》提供的统计,在日本的3000多万网民中,就有652.5万人是利用手机同因特网联网的。使用手机联网的家庭已经超过利用电脑联网的家庭。随着手机技术的发展和手机功能的增强及扩大,手机新品不断推出,将使其媒体工具的特性越来越彰显,它不仅是人们随时随地获取信息的工具,而且是新闻记者及时快速传递新闻信息的利器。由于中国移动用户已经居世界第一,能够上网手机的大量使用,将极大地促使中国网络的普及。

    在中国的经济领域,有所谓的“2000万现象”:彩电、冰箱、空调等均在用户数量达到2000万以后迅速走向大众化,中国手机的普及更加印证了“2000万用户往往会带来雪崩效应”的观点。中国网络自突破2000万用户后开始向低收入、女网民倾斜,也印证了这一趋势,但是,从去年开始的全球新经济不景气反映到中国网络发展上,从而在一定程度上延缓了这一进程,使网络的大众化没能像手机、彩电那样直接带来用户数量的猛增。

    2.网络受众的性别比例趋向平衡

    尽管中国互联网络信息中心(CNNIC)的数据显示,在网民中,男性远多于女性。但是,我们通过历次数据的对比及海外的数据分析,发现,网络受众的性别比例趋向平衡。

    1997年10月CNNIC调查结果显示,用户中,男性占87.7%,女性占12.3%。但随后的调查显示性别比例逐步趋向平衡,到2001年7月CNNIC调查结果显示,男性占61.3%,女性占38.7%。女性网民增长速度明显快于男性,大有后来居上之势。

    来自香港的着名互联网统计机构iamasia公布的一份资料显示,目前大中华区经常使用互联网人数达2400万人,其中女性超过了1000万人。在发达国家,女性网民的数量已经与男性网民持平或超过了后者。据日本2001年06月30日发表的《2001年因特网白皮书》提供的统计,在日本网民中,男性和女性分别占61.2%和38.8%。美国Nielsen//NetRatings公司2001年6月16日的最新研究报告称,美国互联网用户当中的女性人数最近日益增加。调查显示上个月女性已占美国网民人数中的51.7%;加拿大的女性互联网用户也超过了互联网用户的半数。澳大利亚、新西兰、韩国、中国香港、新加坡和中国台湾地区的女性网民比例分别为48%、46%、45%、44%、42%、41%。

    3.网络受众的年龄分布趋于平衡在网络发展的初期,网民的年龄集中在20—35岁之间。但是随着网络的普及,网络受众的年龄分布正在趋于平衡。尤其是,2000年7月以来统计表明,18岁到24岁,25岁到30岁这两个年龄段的上网人数比例在持续下降,18岁到24岁上网人数的比例2000年7月是46.77%,2001年1月减少到41.18%,而现在只占36.8%;25岁到30岁的上网人群2000年1月占33%,2001年1月底降低到19%,现在进一步降低到16.1%。网民年龄层次分别向两个方向延伸。今后互联网将不是年轻人的专有,只要有符合需求的信息及合理的收费,用户群体必将向各年龄段延伸。

    国外的调查研究也显示了网络受众年龄分布的平衡化趋势。据互联网调查公司Jupiter Media Metrix2001年 5月14日的研究报告,2000年一年全球网民中增长速度最快的两个年龄段分别为18至24岁以及55岁以上的用户。在2000年4月到2001年4月期间,55岁以上的网民人数增加了33个百分点,18到24岁的网民人数也增加了32个百分点,同一时期各个年龄段的网民人数平均增加19个百分点。 尽管25到34岁的网民占全球网民人数的最大部分,但18到24岁再加上55岁以上网民的人数总和截止2001年4月已超过25到34岁的网民数量550万人。

    4.网络受众的婚姻状况——未婚者与已婚者的比例趋于平衡

    以往,在网民中未婚者居多数,但是,从最新的调查结果来看,未婚者与已婚者的比例也在趋于平衡。例如,1999年7月CNNIC调查显示的用户的婚姻状况:未婚占63%,已婚占37%;而 2001年7月CNNIC调查显示的用户的婚姻状况:未婚占58.5%,已婚占41.5%。未婚者在网民中所占比例在缩小,未婚者与已婚者的比例在日趋接近。

    5.网络受众文化程度分布的变化

    网民的文化素质普遍较高,这与上网需要计算机网络的知识和技能有关,一般人们是在高校中才能学习到这些知识,尤其是在中国。但是随着计算机网络的知识和技能的普及,以及电脑的人性化操作趋势,上网变得越来越简便,使得网络受众的文化程度分布发生了变化。从CNNIC历次报告的数据中可以看出,网民的学历层次有所下降,说明网络的普及程度有所提高,使用网络对专业知识的要求将越来越低;表明中国网民结构正趋于大众化。

    6.网络受众的经济收入分布

    毫无疑问,上网首先要购置电脑及相关设备,并且支付上网所需的通讯费用,这些需要经济基础。尤其是在网络应用的初期,上网需要较雄厚的经济基础。但是历次的CNNIC调查显示却显示,尽管月收入在1000元以下的网民所占比例很小;但是,低收入者却占据网民的大多数。这和网民中学生和年轻人的比例较高有关。事实上,经济水准达到一定阶段之后,网民上网积极性如何,更多地取决于其他因素。随着国民经济的发展,上网费用的下调,网络受众人均月收入分布会进一步平衡。

    7.网络受众的地域分布趋向平衡

    网民主要集中在发达国家和地区。北京是我国网民最多的地区,广东其次、上海紧随其后。北京和上海文化生活水平较高,成为网民数量最多的直辖市;而分省来看东、南部发达地区的网民数量最高,其中广东省的网民数量最多,其次是浙江和江苏两省;西北部地区的网民数量仍然偏低。

    历次的CNNIC调查显示,网络受众主要集中在发达地区,但是地区差在缩小。以网络受众所占比例最高的北京和比例最低的新疆为典型案例进行比较研究,我们不难发现, 1997年10月CNNIC调查显示的北京网络受众所占比例为36%,新疆为0.1%;2001年1月北京网络受众所占比例为12.39%,新疆为1.51%;显示网络受众的地域分布趋向平衡。

    8.网络受众的行业分布趋向平衡

    历次的CNNIC调查显示,网络受众主要集中在科研教育和计算机行业。但是,通过对网络受众的行业分布比例的变化情况,我们可以发现其行业分布正在趋向平衡。例如,所占比例最高的科研教育和计算机行业的网络受众的比例在逐年下降。1997年10月CNNIC调查显示的网络受众显示,科研和教育(不包括学生)的网络受众所占比例为26.1%,计算机行业为15%;而2001年7月CNNIC调查显示的网络受众显示,科研和教育的网络受众所占比例为10.0%,计算机行业为9.0%。

    当然,不均衡现象依然存在,具体而言,“网民”中的强势职业为:学生 、教师和专业技术人员、计算机行业从业人员。与此相对照,弱势职业为:“退休人员”、“待业人员”、“打工者”。2001年7月CNNIC调查显示,用户中学生和专业技术人员最多,各占百分之二十几;用户的行业分布较广,网民分布在结构上更为广泛,在行业分布上以计算机业与IT行业、商业贸易以及科教行业居多。

    总之,通过对用户的性别、年龄、收入、教育水平、地域和行业分布等数据变化情况的分析,笔者可以得出结论,网络受众呈现出明显的大众化趋势,网络受众原先的独有特征正在淡化。国外的调查研究也印证了笔者的结论。

    美国一家网络市场研究公司InsightExpress公司2001年7月12日发表的一份研究报告称,目前使用互联网的成年美国人的平均特征很大程度上就是所有成年美国人的平均特征。1996年,网民中的性别比例为,男性占62%,女性占38%。今年,网民中的性别比例却发生了重要的变化,男性占49%,女性占51%。这也是美国2000年人口普查工作中发现的全部男性与女性人口比率正在下降的一个侧面反应。同样,1996年,在线人口的家庭年平均收入为62,700美元,而这一数字在2001年时为49,800美元。今年的这个收入数字与2000年美国人口普查时,计算的普通公民年家庭收入数字相比,还要低一些。该公司认为,“最普遍的评论意见,就是互联网作为一种市场媒体正在接近每个消费者。我们国家的在线消费者的特征,现在已经很明显地表明,与美国人的平均特征相当接近。”

    二.网络受众上网的主要目的是获取信息,常用工具是电子邮件和搜索引擎

    历次的CNNIC调查结果都显示,网络受众上网的主要目的依次是:获得各方面的信息, 学习计算机等新技术,工作需要,休闲娱乐;网络受众最常使用的网络服务是电子邮箱和搜索引擎;用户在网上最主要获得哪方面信息是各类新闻。CNNIC 2001年7月18日公布的统计数字表明,我国目前有2650万网民,而这些网民有近8成拥有自己的电子邮箱,电子邮件的快捷和便利已经被绝大多数网民所认可。历次的CNNIC调查结果显示,网络受众上网的主要目的和常用工具没有明显变化,上网的主要目的是获取信息,常用工具是电子邮件和搜索引擎。

    国外的调查也得出了类似的结论。2001年6月11日,美国尼尔森网络评估公司(Nielsen//NetRatings)的一份报告称,一些提供类似于免费电子邮件服务的网站正在迅速增加,搜索引擎服务网站、门户网站和在线社区服务网站仍然在所有在线交易活动中起着重要作用。

    三.网络受众对网络广告的认可程度在不断提高,开展电子商务的时机日趋成熟

    1997年7月CNNIC调查结果显示,网络受众经常点击,并且丛中获得很多有用信息的仅占6%;有时点击,为了支持自己喜欢的网站占19%;不常点击,除非有感兴趣的内容的占49%;不点击,但对网络广告并不讨厌的占20%; 网上广告将延长下载网页的时间,对其痛恨至极的占6%。

    而CNNIC2001年7月18日公布的《中国互联网络发展状况统计报告》中透露的调查数据显示,63.4%的用户“经常点击”或“有时点击”网络广告,69.9%的用户“经常浏览”或“有时浏览”网络广告;目前在我国的网民中有73.9%的人“经常浏览”或“有时浏览”电子商务网站,与以往相比,更多的网民开始接触并接受电子商务。在初步接受了电子商务的网民中有31.9%进行过实际的网络购物,而“节省时间”(46.7%)和“操作方便”(44.2%)是他们选择网络购物的主要原因。价格相对较低的图书、音像制品、电脑软件、鲜花礼品、生活日用品以及票务服务等对网民具有较强的吸引力,是近期网上消费的主要热点。

    尽管我国的网民目前对电子商务还存在或多或少的否定和怀疑,但他们对在中国实现大规模电子商务依旧充满了信心,有79%的网民认为中国5年之内能实现大规模的网上电子商务。“网上购物”被网民认为是将来最有希望的网上事业(60.5%),“网上学校”(54.7%)、“网络通讯”(52.4%)以及“网上炒股”(50.9%)的前景也被看好。

    可以预见,随着互联网络的进一步发展,网民数量的进一步增加和网民结构的进一步成熟,将会有更多的个人和企业接受网络广告其跨时空、跨地域、图文并茂双向传播信息的超凡魅力,网络广告和电子商务蕴涵着巨大商业潜力。

    国外的调查也得出了类似的结论。据网络研究公司Taylor Nelson Sofres2001年6月29日公布的一项电子商务研究报告表明,全球的网上购物网民比例去年同比增长了了50%。

    四.网络受众对黄色信息存在猎奇心理

    多个海外的调查显示,网络受众普遍接触过黄色信息。据中国新闻网2001年07月03日的报导,台湾的一项最新调查显示,有93.4%台湾网络族看过色情片。其中,有4.16%的人集中在16到20岁之间,36.2%的受访者在11到15岁时就己经有观看色情片的经验。据报道,这份调查是由台湾的《张老师》月刊于2日正式公布的。该月刊在5月中旬,针对青少年朋友们看待色情片的态度,在网络上进行为期半个月的意见调查。

    根据调查指出,曾经看过色情片的受访者有1377人,占所有受访者的93.4%,而在被问到第一次接触色情片的年纪时,36.2%的受访者在11到15岁时就己经有观赏色情片的经验。问卷中也问到了青少年的色情片来源,结果显示出同学处是主要来源。

    调查还发现,随着网络科技及复制技术的日益发达,有21.8%的青少年曾经自己到录像带或光盘出租店中租色情片回家观赏,还有12%的青少年是在色情网站上透过网络的匿名性,交易获得各式种类多样的色情光盘。

    2001年8月30日,韩国昨天在一政府网站传载色情罪犯的姓名,造成网络交通阻塞。韩国保护少年委员会当日传载169名色情罪犯的姓名、年龄、职业和地址,他们包括强奸犯以及与未成年男女发生性关系的罪犯。此举也引起网民的广泛兴趣,导致该网站www.youth.go.kr陷入瘫痪。

    此外,部分网络受众有在网上假扮相反的性别的“爱好”。香港明报2000年5月24日报导,美国与澳洲一项新研究,以角色扮演游戏及其他互动网上活动调查了四百名网民,便发现共四成参加者有在网上对掉性别的习惯。该项研究更指出,上网时间愈长的人,愈可能会尝试扮作相反的性别上网,以寻求新鲜感。

    五.网络受众浏览的网站日趋集中,网络受众的注意力呈现“马太效应”。

    调查显示,网络受众的注意力越来越集中在少数的知名网站,呈现出“马太效应”。

    美国6月11日美国尼尔森网络评估公司(Nielsen//NetRatings)的一份报告称,就整体浏览量而言,排在前五位的还是人们熟悉的网站,分别是美国在线时代华纳、微软、雅虎、Lycos以及Excite。在美国,每三个美国人中平均就会有一人每天访问一家如美国在线或者是雅虎的门户网站。访问这些网站的网民占所有网民的92%。

    美国Jupiter Media Metrix互联网调查公司2001年6月4日报告称,美国在线(AOL)、雅虎、微软以及Napster4个网站吸引网络美国用户驻足浏览的时间占所有美国用户上网时间的一半还多,即四家网站瓜分网民半数线上时间。该报告还发现,就在两年前,占所有美国用户上网时间一半的网站总数还是11个,现在已减少到仅为4个。另外,1999年3月份时占所有美国用户上网时间60%的网站数量还是110个,现在却猛减到了14个。

    CNN公布的一份研究报告也显示,互联网界现在有四家大型门户网站(美国在线、雅虎、微软和Napster)已经控制了半数网民。显然,网络受众的注意力呈现出明显的“马太效应”。

    参考文献: 

数据网络研究报告篇4

关键词:内部控制鉴定报告;实证研究;公司特征

中图分类号:F275

随着社会经济环境和会计信息使用者需求的变化,财务报告的内容和形式已经发生了巨大的变化。目前,已有越来越多的公司建立网站披露财务报告,特别是内部控制鉴定报告,网络内部控制鉴定报告成为发展的新形式。它以其所具有的低成本、大容量、高频率、广触及等优势逐渐得到一些公司的喜爱,很多国家政府部门也鼓励公司实施网络内部控制鉴定报告。那么,究竟有哪些因素影响公司披露网络内部控制鉴定报告,它们的影响程度又是怎样的。

1 研究假设

假设1:大股东持股比例与网络内部控制鉴定报告自愿披露程度正相关。

假设2:管理层持股情况与网络内部控制鉴定报告自愿披露程度负相关。

假设3:聘用的事务所规模大小与网络内部控制鉴定报告自愿披露程度正相关。

假设4:审计意见类型与网络内部控制鉴定报告自愿披露程度正相关。

假设5:公司是否为技术信息业与网络内部控制鉴定报告自愿披露程度正相关。

假设6:公司规模与网络内部控制鉴定报告自愿披露程度正相关。

假设7:公司业绩与网络内部控制鉴定报告自愿披露程度正相关。

2 研究方法

2.1 数据来源

网络内部控制鉴定报告地址来源于深圳证券交易所公布的公司基本信息中列示的网站地址,我们按照公司所提供的网站逐家进行了访问(中小板块除外)。有效样本一共是283个。

2.2 变量构造

根据研究的需要,构造了以下变量:

网络内部控制鉴定报告总指数,包括了内容指数和形式指数,用来衡量网络内部控制鉴定报告的实施情况。这是因变量Y。大股东持股比例,选取了前10名股东的持股比例作为自变量X1;管理层持股情况,出现管理层持股的记为1;否则为0。这是自变量X2;聘用的事务所规模大小,聘用“四大”会计师事务所的记为1;否则为0。这是自变量X3;审计意见类型,出具标准无保留意见的记为1;否则为0。这是自变量X4;公司是否为技术信息业,若是记为1;否则为0。这是自变量X5;公司规模,选用公司总资产作为衡量标准,这是自变量X6;公司业绩,选用资产报酬率作为衡量标准,这是自变量X7。

3 统计结果与分析

3.1 描述性统计

在调查的283个样本中,公司网站主要设置了公司基本情况、产品服务信息栏、投资者关系、电子商务、客户服务、人力资源、企业文化等基本栏目。其中,用于反映公司与投资者关系的“投资者关系”栏目,所占比例比较高,而网络内部控制鉴定报告通常会在这一栏中反映,由此可以看出,在我国,有很大一部分公司愿意采用网络内部控制鉴定报告的形式来反映企业财务信息。但有些公司的信息比较陈旧,或者与相关的证券网站做了一个超级链接。统计表明,网络内部控制鉴定报告总指数平均得分为9.80分,与总分(18分)相比较,公司自愿实施网络内部控制鉴定报告的平均程度还不高。

3.2 回归分析

建立多元回归模型,对283个样本进行检验,得到的结果见表1。

表1 模型的相关参数

Unstandardized Coefficients Standardized Coefficients t

Sig.

B Std. Error Beta

常数 3.482 2.426 1.552 .248

X1 .017 .018 .050 .814 .411

X2 1.457 .547 .154 2.647 .009

X3 1.362 .961 .083 1.431 .163

X4 1.384 .805 .107 1.718 .087

X5 .617 1.044 .034 .592 .554

X6 3.443E-11 .000 .118 2.050 .042

X7 2.540 1.913 .085 1.338 .185

分别对各个假设进行检验,从检验结果来看:

(1)假设1没有通过显著性检验。这表明,大股东持股比例对公司是否自愿实施网络内部控制鉴定报告没有显著的影响。

(2)假设2通过了5%的显著性检验,但是符号与假设相反。即若管理层持股,公司更愿意实施网络内部控制鉴定报告。这违背了我们的假设,可以解释为管理层持股可以从一定程度上解决股东与管理层之间的问题。

(3)假设3没有通过显著性检验。这说明公司是否聘用“四大”对公司是否自愿实施网络内部控制鉴定报告没有显著的影响。

(4)假设4通过了10%的显著性检验。这表明审计意见的类型会影响到网络内部控制鉴定报告的实施。因为可以通过强化网络内部控制鉴定报告的形式来向市场传递公司的利好消息。

(5)假设5没有通过显著性检验。这表明是否为信息技术行业对网络内部控制鉴定报告的实施没有很大的影响。

(6)假设6通过了5%的显著性检验。这表明公司规模显著地影响到网络内部控制鉴定报告的实施。

(7)假设7没有通过显著性检验。这表明公司业绩对网络内部控制鉴定报告的实施没有很大的影响。

4 建议与局限

网络内部控制鉴定报告以其所具有的低成本、大容量、高频率、广触及等优势逐渐被一些公司所接受,很多国家政府部门也鼓励公司实施网络内部控制鉴定报告。但作为一种自愿形式,并不是所有公司都建立网站,即使建立网站也不一定披露内部控制鉴定报告,各公司网络内部控制鉴定报告的内容与列报形式也存在较大差异。

即便如此,此调查和分析仍然证明了网络内部控制鉴定报告的实施受到公司特征等信息披露环境的影响。又加之网络内部控制鉴定报告所带来的优越性,随着可扩展企业报告语言的运用,更应该支持鼓励其发展。一是改进现有技术,建立可扩展企业报告语言的网络内部控制鉴定报告,便于传递和有机结合;二是相关证券管理部门的介入,在披露制度上应当加以规范,从而促进网络内部控制鉴定报告的快速发展。

参考文献:

[1]刘金梅.网络财务报告在我国的应用现状及问题研究[J].审计与理财,2012(09).

[2]栾晓鹏,于园园,王姣.企业财务信息的网络披露研究[J].中国管理信息化,2012(15).

[3]许建榕.自愿披露内部控制鉴定报告的影响因素研究[D].海南大学,2012.

[4]李刚,安静,张超.会计信息化理论研究热点的回顾与思考[J].会计之友,2011(12).

作者简介:韩玉竹(1983-),女,山东潍坊人,潍坊工程职业学院会计与统计学院,教师,助教,硕士研究生,研究方向:会计理论与实务、会计信息化。

数据网络研究报告篇5

受经济衰退影响,此前英国各大商业电视台广告收入已不断被互联网蚕食,这份报告则进一步显示出,电视媒体前景黯淡。报告显示,2009年上半年,英国网络广告销售额同比增长4.6%,至17.5亿英镑(约合28亿美元),市场份额为23.5%。同期,电视广告收入同比下降16.1%,至16.4亿英镑(约合26亿美元),市场份额跌至第二,为21.9%。

世界广告研究协会(World Advertising Research Council)提供的数据显示,上半年,英国广告业整体销售额同比下滑16.6%,至74.7亿英镑(约合120亿美元)。

据广告公司群邑(Group M)的数据显示,近几年,英国网络广告占整体广告市场比重的增速一直稳居世界前列。该公司发言人亚当·史密斯(Adam Smith)表示,这与英国的互联网普及率有关。他指出,互联网普及率同样较高的丹麦,其网络广告市场份额仅次于英国。

群邑的数据还显示,2008年美国网络广告占整体广告市场的份额仅为13.9%,电视则占43.4%。与IAB不同的是,群邑的数据不包括直销广告。

市场调研机构Enders Analysis分析师伊恩·莫德(Ian Maude)认为,造成英美两国网络广告份额差异明显的一个重要因素是,英国广告市场受到不播放广告的BBC的影响,但他同时指出,英国消费者喜好购物,电子商务的增长也带动了搜索广告的发展。

数据网络研究报告篇6

传播力决定影响力,没有传播力就没有影响力,媒体传播力是一种执行力,是一种推广力,是一种竞争力,也是各大网络媒体由内向外而生的张力和冲击力。网络媒体需要进一步增强传播力,提升影响力,在新的时代条件下,切实履行好党的新闻舆论工作的职责和使命。

2016年6月,《网络传播》杂志倾力打造的中国新闻网站传播力榜迎来一周年,一年风雨一年秋,一年种谷一年收。榜单自以来,中央网信办领导多次对榜单作出重要批示和指示,各省市相关领导也根据榜单对属地网站作重要批示并指导相关工作。榜样是一种力量,彰显进步;榜单是一面旗帜,也是一个风向标,为网信事业鼓舞斗志。2015年10月,《网络传播》杂志按照中央网信办领导的指示及要求,根据榜单推荐了十家坚持政治导向、正能量传播并具有影响力和发展潜力的新媒体,作为重点扶持对象。一些地方网信办根据榜单来考核属地新闻网站,各网站也依据榜单对内部业务流程进行了改造,有效地提升了传播力,多家高校研究机构也对榜单进行了深入持续的追踪研究。

一年来,榜单积累了各网站大量的数据,为让相关数据发挥更大价值、更好地为新闻网站服务,《网络传播》杂志依据2015年6月至2016年5月期间的榜单数据撰写了《2015-2016中国新闻网站传播力年度报告》(以下简称《报告》)。《网络传播》杂志从今年3月起开始筹备《报告》,并于5月26日召开了中国新闻网站传播力第三次研讨会,向各网站介绍了《报告》筹备情况及主体框架,同时听取业界对《报告》内容的建议。为使《报告》真实呈现各网站的传播实力,《网络传播》杂志先后走访了多家机构,拜访相关学者专家,共同研究分析方法,确定了整体报告结构。在九次方大数据和北京师范大学新闻传播学院的密切配合下,完成了主报告;在中青华云、搜狗、今日头条、新浪微博的支持下,依据相关平台大数据撰写了相应报告,共同组成《报告》中的其他报告。

8月25日,在《网络传播》杂志主办的第十二期“网络传播”沙龙上,《报告》正式对外。

《报告》分为理论前沿、主报告、副报告和附录四大部分。理论前沿通过《传播力的概念与测量》《新闻网站传播力提升途径》《新技术对新闻传播的冲击、挑战与思考》以及《中国新闻网站传播力榜介绍》这四部分,概述中国新闻网站传播力榜一年来的发展情况,阐述传播力与影响力的关系,介绍网络新闻传播的发展背景,分析新技术与新闻生产模式为新闻传播带来的变革。

主报告分为《总体分析报告》《平台属性分析报告》《网站类型分析报告》《网站地域分析报告》《新闻网站传播力提升建议》。这五部分通过对中国新闻网站传播力总榜指数分析、网站PC端、微博、微信平台各指标分析,以及对中央主要新闻网站、全国行业新闻网站、省级网站和城市网站四大类别的新闻网站传播力进行系统解读,同时还结合地域分布、各地经济发展(GDP)、网民人数、新闻网站与所在城市进行系统分析,并对新闻网站PC端、微信、微博传播力提升路径给出建议。

其他报告由《中央主要新闻网站国际传播能力分析报告》《2015-2016年度热点事件报告》《2015-2016年度热词报告》《新浪微博2015-2016年度传播力分析报告》《今日头条客户端2015-2016 年度传播报告》组成。

《报告》还将国家网信办在2015年1月至2016年7月期间的相关管理规定,以及互联网新闻信息稿源单位名单,编入其中作为附录。

此外,《网络传播》还依据年度榜单中的综合传播力指数,并结合导向性,产生了“2015-2016中国新闻网站传播力优秀网站”,主要包括“2015-2016年度中国新闻网站传播力10强”“2015-2016年度全国行业新闻网站传播力10强”“2015-2016年度省级网站传播力10强”“2015-2016年度城市网站传播力10强”“2015-2016 年度中国新闻网站成长型3强”。

数据网络研究报告篇7

关键字:入侵检测;协议分析;模式匹配;智能关联a

1引言

入侵检测技术是继“防火墙”、“数据加密”等传统安全保护措施后新一代的安全保障技术,它对计算机和

网络资源上的恶意使用行为进行识别和响应,不仅检测来自外部的入侵行为,同时也监督内部用户的未授权活动。但是随着网络入侵技术的发展和变化以及网络运用的不断深入,现有入侵检测系统暴露出了诸多的问题。特别是由于网络流量增加、新安全漏洞未更新规则库和特殊隧道及后门等原因造成的漏报问题和IDS攻击以及网络数据特征匹配的不合理特性等原因造成的误报问题,导致IDS对攻击行为反应迟缓,增加安全管理人员的工作负担,严重影响了IDS发挥实际的作用。

本文针对现有入侵监测系统误报率和漏报率较高的问题,对几种降低IDS误报率和漏报率的方法进行研究。通过将这几种方法相互结合,能有效提高入侵检测系统的运行效率并能大大简化安全管理员的工作,从而保证网络

安全的运行。

2入侵检测系统

入侵是对信息系统的非授权访问及(或)未经许可在信息系统中进行操作,威胁计算机或网络的安全机制(包括机密性、完整性、可用性)的行为。入侵可能是来自外界对攻击者对系统的非法访问,也可能是系统的授权用户对未授权的内容进行非法访问,入侵检测就是对企图入侵、正在进行的入侵或已经发生的入侵进行识别的过程。入侵检测系统IDS(IntrusionDetectionSystem)是从多种计算机系统机及网络中收集信息,再通过这些信息分析入侵特征的网络安全系统。

现在的IDS产品使用的检测方法主要是误用检测和异常检测。误用检测是对不正常的行为进行建模,这些行为就是以前记录下来的确认了的误用或攻击。目前误用检测的方法主要是模式匹配,即将每一个已知的攻击事件定义为一个独立的特征,这样对入侵行为的检测就成为对特征的匹配搜索,如果和已知的入侵特征匹配,就认为是攻击。异常检测是对正常的行为建模,所有不符合这个模型的事件就被怀疑为攻击。现在异常检测的主要方法是统计模型,它通过设置极限阈值等方法,将检测数据与已有的正常行为比较,如果超出极限阈值,就认为是入侵行为。

入侵检测性能的关键参数包括:(1)误报:实际无害的事件却被IDS检测为攻击事件。(2)漏报:攻击事件未被IDS检测到或被分析人员认为是无害的。

3降低IDS误报率方法研究

3.1智能关联

智能关联是将企业相关系统的信息(如主机特征信息)与网络IDS检测结构相融合,从而减少误报。如系统的脆弱性信息需要包括特定的操作系统(OS)以及主机上运行的服务。当IDS使用智能关联时,它可以参考目标主机上存在的、与脆弱性相关的所有告警信息。如果目标主机不存在某个攻击可以利用的漏洞,IDS将抑制告警的产生。

智能关联包括主动和被动关联。主动关联是通过扫描确定主机漏洞;被动关联是借助操作系统的指纹识别技术,即通过分析IP、TCP报头信息识别主机上的操作系统。

3.1.1被动指纹识别技术的工作原理

被动指纹识别技术的实质是匹配分析法。匹配双方一个是来自源主机数据流中的TCP、IP报头信息,另一个是特征数据库中的目标主机信息,通过将两者做匹配来识别源主机发送的数据流中是否含有恶意信息。通常比较的报头信息包括窗口(WINDOWSIZE)、数据报存活期(TTL)、DF(dontfragment)标志以及数据报长(Totallength)。

窗口大小(wsize)指输入数据缓冲区大小,它在TCP会话的初始阶段由OS设定。数据报存活期指数据报在被丢弃前经过的跳数(hop);不同的TTL值可以代表不同的操作系统(OS),TTL=64,OS=UNIX;TTL=12,OS=Windows。DF字段通常设为默认值,而OpenBSD不对它进行设置。数据报长是IP报头和负载(Payload)长度之和。在SYN和SYNACK数据报中,不同的数据报长代表不同的操作系统,60代表Linux、44代表Solaris、48代表Windows2000。

IDS将上述参数合理组合作为主机特征库中的特征(称为指纹)来识别不同的操作系统。如TTL=64,初步判断OS=Linux/OpenBSD;如果再给定wsize的值就可以区分是Linux还是OpenBSD。因此,(TTL,wsize)就可以作为特征库中的一个特征信息。3.1.2被动指纹识别技术工作流程

具有指纹识别技术的IDS系统通过收集目标主机信息,判断主机是否易受到针对某种漏洞的攻击,从而降低误报率。

因此当IDS检测到攻击数据包时,首先查看主机信息表,判断目标主机是否存在该攻击可利用的漏洞;如果不存在该漏洞,IDS将抑制告警的产生,但要记录关于该漏洞的告警信息作为追究法律责任的依据。这种做法能够使安全管理员专心处理由于系统漏洞产生的告警。

3.2告警泛滥抑制

IDS产品使用告警泛滥抑制技术可以降低误报率。在利用漏洞的攻击势头逐渐变强之时,IDS短时间内会产生大量的告警信息;而IDS传感器却要对同一攻击重复记录,尤其是蠕虫在网络中自我繁殖的过程中,这种现象最为重要。

所谓“告警泛滥”是指短时间内产生的关于同一攻击的告警。IDS可根据用户需求减少或抑制短时间内同一传感器针对某个流量产生的重复告警。这样。网管人员可以专注于公司网络的安全状况,不至于为泛滥的告警信息大伤脑筋。告警泛滥抑制技术是将一些规则或参数(包括警告类型、源IP、目的IP以及时间窗大小)融入到IDS传感器中,使传感器能够识别告警饱和现象并实施抵制操作。有了这种技术,传感器可以在告警前对警报进行预处理,抑制重复告警。例如,可以对传感器进行适当配置,使它忽略在30秒内产生的针对同一主机的告警信息;IDS在抑制告警的同时可以记录这些重复警告用于事后的统计分析。

3.3告警融合

该技术是将不同传感器产生的、具有相关性的低级别告警融合成更高级别的警告信息,这有助于解决误报和漏报问题。当与低级别警告有关的条件或规则满足时,安全管理员在IDS上定义的元告警相关性规则就会促使高级别警告产生。如扫描主机事件,如果单独考虑每次扫描,可能认为每次扫描都是独立的事件,而且对系统的影响可以忽略不计;但是,如果把在短时间内产生的一系列事件整合考虑,会有不同的结论。IDS在10min内检测到来自于同一IP的扫描事件,而且扫描强度在不断升级,安全管理人员可以认为是攻击前的渗透操作,应该作为高级别告警对待。例子告诉我们告警融合技术可以发出早期攻击警告,如果没有这种技术,需要安全管理员来判断一系列低级别告警是否是随后更高级别攻击的先兆;而通过设置元警告相关性规则,安全管理员可以把精力都集中在高级别警告的处理上。元警告相关性规则中定义参数包括时间窗、事件数量、事件类型IP地址、端口号、事件顺序。

4降低IDS漏报率方法研究

4.1特征模式匹配方法分析

模式匹配是入侵检测系统中常用的分析方法,许多入侵检测系统如大家熟知的snort等都采用了模式匹配方法。

单一的模式匹配方法使得IDS检测慢、不准确、消耗系统资源,并存在以下严重问题:

(1)计算的负载过大,持续该运算法则所需的计算量极其巨大。

(2)模式匹配特征搜索技术使用固定的特征模式来探测攻击,只能探测明确的、唯一的攻击特征,即便是基于最轻微变换的攻击串都会被忽略。

(3)一个基于模式匹配的IDS系统不能智能地判断看似不同字符串/命令串的真实含义和最终效果。在模式匹配系统中,每一个这样的变化都要求攻击特征数据库增加一个特征记录。这种技术攻击运算规则的内在缺陷使得所谓的庞大特征库实际上是徒劳的,最后的结果往往是付出更高的计算负载,而导致更多的丢包率,也就产生遗漏更多攻击的可能,特别是在高速网络下,导致大量丢包,漏报率明显增大。

可见传统的模式匹配方法已不能适应新的要求。在网络通信中,网络协议定义了标准的、层次化、格式化的网络数据包。在攻击检测中,利用这种层次性对网络协议逐层分析,可以提高检测效率。因此,在数据分析时将协议分析方法和模式匹配方法结合使用,可以大幅度减少匹配算法的计算量,提高分析效率,得到更准确的检测结果。超级秘书网

4.2协议分析方法分析

在以网络为主的入侵检测系统中,由于把通过网络获得的数据包作为侦测的资料来源,所以数据包在网络传输中必须遵循固定的协议才能在电脑之间相互沟通,因此能够按照协议类别对规则集进行分类。协议分析的原理就是根据现有的协议模式,到固定的位置取值(而不式逐一的去比较),然后根据取得的值判断其协议连同实施下一步分析动作。其作用是非类似于邮局的邮件自动分捡设备,有效的提高了分析效率,同时还能够避免单纯模式匹配带来的误报。

根据以上特点,能够将协议分析算法用一棵协议分类树来表示,如图2所示。这样,当IDS进行模式匹配时,利用协议分析过滤许多规则,能够节省大量的时间。在任何规则中关于TCP的规则最多,大约占了50%以上,因此在初步分类后,能够按照端口进行第二次分类。在两次分类完成后,能够快速比较特征库中的规则,减少大量不必要的时间消耗。如有必要,还可进行多次分类,尽量在规则树上分叉,尽可能的缩减模式匹配的范围。

每个分析机的数据结构中包含以下信息:协议名称、协议代号以及该协议对应的攻击检测函数。协议名称是该协议的唯一标志,协议代号是为了提高分析速度用的编号。为了提高检测的精确度,可以在树中加入自定义的协议结点,以此来细化分析数据,例如在HTTP协议中可以把请求URL列入该树中作为一个结点,再将URL中不同的方法作为子节点。

分析机的功能是分析某一特定协议的数据,得出是否具有攻击的可能性存在。一般情况下,分析机尽可能的放到树结构的叶子结点上或尽可能的靠近叶子结点,因为越靠近树根部分的分析机,调用的次数越多。过多的分析机聚集在根部附近会严重影响系统的性能。同时叶子结点上的协议类型划分越细,分析机的效率越高。

因此,协议分析技术有检测快、准确、资源消耗少的特点,它利用网络协议的高度规则性快速探测攻击的存在。

5结束语

本文对几种降低IDS误报率和漏报率的方法进行分析研究,通过将这几种方法相互结合,能有效提高入侵检测系统的运行效率并能大大简化安全管理员的工作,从而保证网络安全的运行。由于方法论的问题,目前IDS的误报和漏报是不可能彻底解决的。因此,IDS需要走强化安全管理功能的道路,需要强化对多种安全信息的收集功能,需要提高IDS的智能化分析和报告能力,并需要与多种安全产品形成配合。只有这样,IDS才能成为网络安全的重要基础设施。

参考文献:

[1]张杰,戴英侠.入侵检测系统技术现状及其发展趋势[J].计算机与通信,2002(6):28-32.

[2]唐洪英,付国瑜.入侵检测的原理与方法[J].重庆工学院学报,2002(4):71-73.

[3]戴连英,连一峰,王航.系统安全与入侵检测技术[M].北京:清华大学出版社,2002(3).

[4]郑成兴.网络入侵防范的理论与实践[M].北京:机械工业出版社,2006:48-56.

[5]耿麦香.网络入侵检测技术研究[J].科技情报开发与经济,2003,13(12):217-218.

数据网络研究报告篇8

【关键词】网络舆论领袖;测量方法;移植取向;数据挖掘;

【中图分类号】G206 【文献标识码】A

所谓舆论领袖就是在政治竞选投票过程中,经常给别人提供建议的人。舆论领袖现象最早 被哥伦比亚大学应用社会研究所拉扎斯菲尔德、贝雷尔森等人1940年在美国依利县有关政治选举 研究中发现。(Katz,1957,p.63)。随着各个学科对舆论领袖现象的日益关注,西方产生了丰 富的舆论领袖测量方法和理论成果。随着互联网在中国社会日益普及和网络言论影响力的加大, 加强舆论领袖的舆论引导作用的论述逐渐增多。但是,这些文章多论述停留在表面泛泛的议论和 断言,由于缺乏明确的操作性定义和测量方法,尚难以进行科学实、证的考察。本文欲对1990年 代以来西方网络舆论领袖测量的两个重要研究取向,作一简单评述,为国内开展相关研究提供参 考。一个是将传统舆论领袖测量方法移植到网络,另一个是采取与传统舆论领袖截然不同方法, 即数据挖掘方法测量舆论领袖。前者可以称为“用传统方法研究现代问题”,后者为“用现代方 法研究现代问题”。

一、网络舆论领袖测量方法――移植取向

传统舆论领袖测量方法很多,罗杰斯将这些方法归类总结为:社会计量法(sociometric techniques)、 关键人物访谈法(interviews with key informants)、观察法(observation)、自我报告法(self-designating techniques)。由于自我报告法实施起来简 单、经济,可以进行大规模测量,因此为最常用的方法;量表在实际使用过程中也不断得到改善 和更新。第一个舆论领袖测量量表由卡茨和拉扎斯菲尔德1955年创建,称为Katz and Lazarsfeld 量表,在迪凯特研究中首次使用。Katz and Lazarsfeld量表之后,50多年间一系列量表相继提 出,按照时间先后顺序依次为:1962年Rogers & Cartano量表、1965年Troldahl & vanDam量 表、1970年 King & Summers量表、1978年 Levy量表、 1986年Childers量表、1994年Flynn, Goldsmith &Eastman量表。从1955年第一个测量舆论领袖Katz and Lazarsfeld 量表到1994年 Flynn, Goldsmith &Eastman量表,是舆论领袖测量方法形成、发展和成熟阶段。

与丰富的传统舆论领袖研究成果相比,网络舆论领袖研究颇为匮乏。仅有的网络舆论领袖研 究都从营销学角度探讨网络交易型社区舆论领袖在新产品采纳过程中的说服、示范作用,与国内 的关注舆论引导存在极大不同;研究方法倾向于使用量化手段来测量舆论领袖,使用最多的方法 为自我报告法,其次是社会计量法。

自我报告法即数据收集依赖受访者自己判断和回答。用自我报告法测量舆论领袖经常采用 量表测量。量表由一组问题构成,用以间接测量人们在某一态度或观念上的状况。因此舆论领 袖测量量表就是一组测量人们舆论领袖心理素质的问题,通过累加所有问题回答得分而得出舆 论领袖指数。社会计量法(也称社会网络分析法)是一种调查人们社会关系特征和群体特征的 测量方法。这些特征不同于个人特征,它们必须通过人们之间的交往或互动关系来反映。社会 计量法的实施程序一般为:(1)根据调查内容设计一份简单的问卷,如询问:“你和谁来往最 密切”、“你认为谁最有威望”等问题。(2)让被调查的群体中的每个成员都填写这份问卷。 (3)将每个人编号,计算每个人被选择的次数及选择他人的次数。(4)根据统计数据绘制社会图(Sociogram)、社会矩阵(Socio matrix)或进行指数分析。社会图可以直观地了解人际交往 的网络。指数可用来分析个人在群体中的地位、威望等,并能了解群体的凝聚力、组织管理、社 会交往等方面的情况。社会计量法特别适用于小群体研究。

将传统自我报告法运用到网络舆论领袖研究的做法通常有三种一为网下问卷调查人们上网 时的情况;二为网上问卷;三为网上和网下调查相结合。问卷的测量题项沿用传统舆论领袖 测量量表。研究思路大多根据舆论领袖指数将网上人群二分为舆论领袖及其跟随者,对比两类人 群,描述舆论领袖的特征。例如,澳大利亚Barbara Lyons,Kenneth Henderson探讨舆论领袖对 电子商务的推动作用研究中,采用传统舆论领袖的定义来定义网络舆论领袖,运用Childers量表(1986)测量舆论领袖指数[1],采取网下自填式问卷方式,将使用计算机中介交流技术的人群二 分为舆论领袖及其跟随者,并考察两类人群使用电子商务的差异。研究发现:采用传统舆论领袖 量表测量网络舆论领袖的信度较佳(α=0.74),可以成功将网络使用者二分为网络舆论领袖与跟 随者;二者在产品知识、产品卷入度、产品采纳行为、网上投入时间、网上讨论存在显著不同(Barbara Lyons et al., 2005)。Youngju Sohn在有关韩国品牌数码产品虚拟社区研究中,舆 论领袖测量采用Flynn et al. (1994)量表[2]。该研究运用网上问卷和电子邮件邮寄问卷调查124 名网民,请他们填答浏览韩国数码相机品牌社区时的一些行为和心理。该研究将网民网上、网下 心理和行为进行相关分析,发现网络舆论领袖在网上表现与现实生活中表现有所不同,网络舆论 领袖在现实生活中并不是一呼百应的舆论领袖(Youngju Sohn, 2005)。

同样,运用社会计量法测量网络舆论领袖也不过是把研究的场域从现实世界搬家到虚拟空 间而已。在已有的运用社会计量法测量网络舆论领袖研究中,一般采用虚拟社区成员之间提名方 式。例如Nancy Baym对一个肥皂剧新闻组虚拟社区研究中,要求社区成员在问卷调查中指出社区 的舆论领袖。研究发现那些社区的“常客”、发帖多的社区成员很容易被其它社区成员以及社区 边缘参与者(潜水者)认可为舆论领袖(Baym,2000p.69-83)。日本学者I. Kaneko采用社会网络 法来分析一个邮件组成员之间的交往关系。通过分析电子邮件回复形成的社会网结构来界定有影 响力的邮件和人物,分析这些具有影响力的人物在社区危机管理中作用(I. Kaneko, 1996)。

将传统舆论领袖测量方法移植到网络面临一些局限:使用社会计量法的前提是群体成员彼 此之间了解、熟悉,因此该方法适用于凝聚力较强、规模较小的群体,不适合大范围调查研究。 庞大、漂移和隐秘的网络社区用户之间缺乏足够了解和互动,因此社会计量法运用到网络传播存 在困难。自我报告法最大问题在于回答的主观性;极有可能一些自认为是舆论领袖的人实际并不 是舆论领袖,或者一些实际上是舆论领袖的人却没有被包含在舆论领袖群体中。因此某种程度上 说,自我报告法更多测量的是人们自认为的舆论领袖心理,而不是真正的舆论领袖。同时,现有网络舆论领袖研究样本全是自愿样本或便利样本,研究结论的适用面大打折扣。

二、革新取向网络舆论领袖测量方法――数据挖掘

基于文本的计算机中介交流(Text-based CMC)与面对面交流的根本不同在于交流双方并 不见面,很多时候也不知对方为何许人,通过文本交流进行沟通和发展友谊。 “线索消除 论”(clues filtered out theory)认为CMC消除了很多面对面交流中的必要因素,比如面部表 情、目光接触、肢体语言、语音语调;“社会环境线索缺乏假设”(lack of social context clues) 认为CMC缺乏语言以外的社会环境线索(如年龄、性别、教育程度、收入、职业等), 而这些是确定交流者个人特征及社会地位的重要因素(Kieler,1984)。在社会线索缺乏的虚拟空 间,人们不能根据社会线索来确定社会身份,只能根据交流文本来估计写作者的社会线索。Lea & Spear指出计算机中介交流缺乏对交流对象个人情况的了解会导致人们倍加关注语言信息中所 透露的个性特征(Lea & Spear, 1995)。因此基于文本交流的CMC研究的重点应该放到语言交流 上。而革新取向测量舆论领袖的方法则是根据计算机中介交流(CMC)的特点而研发的新方法,通 常需要借助新技术、新手段。2002年以来,国外网络舆论领袖研究的最新方法是数据挖掘。

数据挖掘是二十世纪80年代以后发展起来的新研究领域,在银行、证券、保险、电信、零 售、交通、航空、石化、能源等领域得到广泛应用。随着计算机的普及和数据的大量积累,数据 挖掘在电子商务、快速消费品行业甚至在社会科学研究领域如语言文字大显身手。

数据挖掘指从大量数据中抽取潜在的、有价值的知识(模型或规则)的过程,就好比从一 堆矿石中寻找金子。数据挖掘融合了数据库、人工智能、机器学习、统计学等多个领域的理论和 技术。随着科技的发展,数据挖掘工作可以变得易于操作,就如同随着SPSS、SALS等大型统计分 析软件的出现,社会科学的统计分析变得轻松有效一样。事实上,SPSS中的因子分析、聚类分 析、回归分析都是数据挖掘技术。只不过数据挖掘与统计分析和分析报告相比,“分析报告给你 后见之明 (hindsight),统计分析给你先机 (foresight),数据挖掘给你洞察力 (insight)”(Berry and Linoff,1997)。分析报告为事后亡羊补牢之举;统计分析是对研究假设进行检验 以发现事物发展规律;而数据挖掘则不需要研究者事先提出研究假设,通过挖掘现有数据,抽取 规则,从而能预测趋势和行为,支持人们的决策。

清华大学经济管理系毛波、尤雯雯以BBS 类型虚拟社区中知识共享型版面为主要研究对象, 根据社区成员所发表文章对社区整体知识形成和共享过程的贡献, 利用数据挖掘技术, 对虚拟社 区中所发表的文章进行定量分析总结, 提出了知识共享型虚拟社区的成员分类模型, 将社区的成 员归纳为领袖、呼应者、浏览者、共享者和学习者等5 种类型, 提出每种类型成员的活动特点。 其成员分类模型在BBS 类型虚拟社区的交易型版面和其他版面中也得到了验证, 为今后深入研究 虚拟社区成员的行为模式提供了必要的基础(毛波、尤雯雯,2006:p.29)。

日本学者Naohiro Matsumura、Yukio Ohsawa、Mitsuru Ishizuka运用数据挖掘技术提出“影 响力扩散模型”(IDM),从文本内容和交往网络两个方面来测量网络角色类型,筛选出舆论领 袖。该模型基于以下2个前提假设:(1)、在基于文本计算机中介交流环境下,人们通过发回帖 子来表达观点;论坛对话链(comment-chain)体现影响力的传递结构。(2)、词语为组成帖子 的基本单位,在基于文本计算机中介交流环境中,论坛交流通过词语来表达和传播。影响力定义 为词语在对话链中传播的程度,计算为有回复关系的上下游帖子的词语交集与下游帖子词语数 的比值。该方法采用先进的网络数据采集技术(Pearl)下载网络论坛的交谈内容;在保持交谈 内容结构(讨论串结构)基础上,将文本自动切分为词语集合,通过程序智能比对上下游帖子词 语,计算机根据算法自动给出论坛每个发帖人的影响力。

图1为一个对话链示意图。实线箭头表示帖子回复关系,虚线箭头表示影响力。

图1:IDM模型解释

在图1中,C1为主帖,C2、C3分别回复C1,C4则回复C2。C1帖包含A、B、C三个词语,C2包含 A、C、D三个词语,C3包含B、F两个词语,C4包含C、F词语。C1、C2词语交集为A、C,因此帖子 C1对C2影响力为23;C1与C3词语交集为B,C1对C3影响力为12;C1、C3、C4词语交集为C,C1对 C4影响力为12×23。

帖子在论坛中的总影响力为帖子对论坛其他所有成员的影响力之和。发贴人的影响力等于其 发贴影响力之和。作者用该模型分析了日本一些论坛和邮件列组,证明模型的解释力“出乎意料 的大”(Naohiro Matsumura etal.,2002)。

三、启示

网络舆论领袖研究方法的“移植”和“创新”两个不同取向事实上存在于整个新媒体研究; 传播科技的发展,特别是随着网络媒体的出现和迅猛发展,传统研究方法和范式已经遇到挑战。

国际传播学界很早就关注新媒体,如1996年国际传播学界权威学术刊物《传播学杂志》出 版新媒体专辑,2000年《新闻学与大众传播季刊》的春、秋季两期刊登网络传播研究方法文章, 提醒学者注意互联网对传统大众传播研究方法的影响,机遇与挑战共存(Guido and Stewart, 2000;McMillan,2000)。

机遇主要来自于数据收集的便捷性。在数字化、网络化浪潮一浪高过一浪背景下,“新产 生的信息差不多都是与生俱来就数字化、网络化的,一切许多有意义的资料信息也在被重新数字 化而且迟早会网络化。这对于社会科学来说,预示着极大幅度提高数据采集效率的潜力。庞大的 上网人群也给社会科学家进行从未有过的广泛且高效的调查提供了天然的基础”(李晓明、祝建 华,2006:p.43)。大规模数据收集曾经是制约大众传播研究的昂贵瓶颈之一,而在线调查、在 线内容分析等可以轻松实现数据收集工作;而且如果有合适的分析工具,数据的分析工作可以在 收集的同时实现。

但互联网给传播研究者带来机遇同时,也带来挑战。挑战来自于:一、研究的信度和效度。 二、网络传播衍生的新问题、新领域呼唤新方法。

信度和效度是评估研究质量的两个基本原则,网络研究也不例外。将传统舆论领袖测量方 法移植到网络面临的主要问题就是抽样误差,即样本是否能够代表所有网民。由于目前无法建立 完备的网民抽样框,目前的网民样本很多都是便利样本。以网上问卷为例,大多操作方法为网上 挂问卷或电子邮寄问卷。若把问卷放在网站上,由访问者自愿填写,面临的问题是:能否吸引足 够多的人填写问卷;填写问卷的人是否符合对调查对象的要求;是否有人多次填写同一问卷。用 E-mail发送问卷,必须掌握足够多的邮件地址,并应按随机原则挑选调查对象,否则不具代表 性。抽样框无法确定的调查中,拒答率也难以确定。只有在抽样框和入选概率已知(即概率抽样 调查)的情况下,才可以进行对拒答误差的测量或者评价。

由于缺乏足够的抽样框,有些网络调查公司创建固定网络调查小组作为调查对象,这不 失为一种可行的办法。但这个方法也存在一定的问题。首先是小组成员流失率高,一般每年有 30%-40%的成员流失。其次是威胁效度的因素:随着网络调查小组成员受调查经验的积累,他们 对问题的回答可能与初次接触问题的被调查者存在差异,从而导致测量误差。因此,将传统研究 方法移植到互联网,需要解决概率抽样这个社会科学研究进行科学推论的前提。

其次,网络传播衍生的新问题、新领域呼唤新方法。随着社会信息化、网络化进程的进一步 加快,大量的社会现实以“数据”的形式存在。面对海量数据,人们迫切需要一个“去伪存真, 去粗取精”的分析工具,以帮助正确预测趋势,避免决策失误。数据挖掘则正是顺应现实的需要 而开发出来的新型分析工具,在商业领域已经发挥了重大的作用。现在数据挖掘技术也同样可以 在网络学术研究领域发挥重大作用。互联网作为一个与传统媒体不同的新媒体,提供许多崭新领 域供研究者挖掘和探索,如网络内容(网页、论坛帖子、博客文章等)、网络结构(超链接和 社会网链接)和网络使用(网站访问记录和客户端访问记录)互联网挖掘(Zhu,2006)。如前 文介绍的清华大学经济管理系和日本东京大学工程系、图象序列研究所、信息管理系合作研究的 “IDM”影响力扩散模型都是采用数据挖掘方法来分析网页数据的规律。可以预见数据挖掘将会 成为社会科学工作者一项研究“利器”。

注 释:

[1] Childers, T. L (1986) 量表

1.你一般与你的朋友或邻居讨论___吗?2.你与朋友或邻居讨论___时,请问你是较少还是较多提供信息?3.过去半年内,你和多少人讨论过___?4.你的朋友会向你询问有关___的新信息吗?5.在讨论某个新产品___时,你是倾向于接受朋友的建议还是说服别人接受你的意见?6.讨论新产品___时,你经常告诉朋友们产品信息还是朋友告诉你产品的信息?7.总体而言,你经常很少给别人提出建议。

[2] Flynn et al. (1994)量表

1.我对___的意见与他人不一致。2.当别人挑选___时,较少向我询问信息。3.别人很少向我询问有关___意见。4.我周围的人根据我的意见决定是否购买___。5.我经常说服别人购买我喜欢的___。6.我经常影响别人对___的看法。

参考文献:

[1] 毛波、尤雯雯.虚拟社区成员分类模型[J].清华大学学报(自然科学版), 2006(S1).

[2] 李晓明、祝建华.让社会科学插上信息科学的翅膀[J].《中国计算机学会通讯》2006(2).

[3] Katz. E.,“The two-step flow of communication An up-to-date report of an hypothesis,”Public Opinion Quarterly 21(1957): 61-78.

[4] Fisk, G., “Media influence reconsidered,”Public Opinion Quarterly 1 (1959) 83-91.

[5] Flynn, L.R., Goldsmith, R.E. and Eastman, J.K., “The King and Summers opinion leadership scale revision and refinement,”Journal of Business Research Vol.31 (1994) 55.

[6] Eric Vernette, “Role and Profile of Opinion Leaders for Internet Diffusion Process,” Decisions Marketing 25 (2002)93.

[7] Reid Goldsborough, “The influence of active online users,” Black Issues in Higher Education 5 (2002) 30.

[8] Barbara Lyons, Kenneth Henderson, “Opinion Leadership in a Computer-Mediated Environment,” Journal of Consumer Behaviour 5 (2005) 319.

[9] Sohn Youngju, “Opinion Leaders and Seekers in Online Brand Communities Centered on Korean Digital Camera band Communities,”Master Thesis The Florida State University, Summer Semester (2005).

[10] Baym N.K., Tune in, Log on Soaps, Fandom, and Online Community (Thousand Oaks, CA Sage Publications,2000) 69-83.

[11] I. Kaneko, “the Great Hanshin-Awaji Earthquake and Network Organization Theory,” Proc.Innovative Urban Community

Development and Disaster Management (1996)233-241.

[12] Kieler S., “Computer mediation of conversation,”American Psychologist 39 (1984)1123-1134.

[13] Lea M. & Spears R., “Love at first byte Building personal relationships over computer networks,” in Understudied relationships Off the beaten track Eds. J.T. Wood & S. Duck (Newbury Park, CA Sage, 1995) 197-233.

[14] M. Berry and G. Linoff, Data Mining Techniques For Marketing, Sales, and Customer Support (USA John Wiley & Sons, 1997).转引自数据挖掘讨论组http:省略.cn(2006-8-20).

[15] Naohiro Matsumura, Yukio Ohsawa and Mitsuru Ishizuka, “Influence Diffusion Model in Text-Based Communication,”in the Eleventh International World Wide Web Conference (2002).

[16] Guido H Stempel III and Robert K Stewart, “The Internet provides both opportunities and challenges for mass communication researchers,”Journalism and mass Communication Quarterly 3 (2000)541-548.

[17] Sally J.McMillan, “The Microscope and the Moving Target The Challenge of Applying Content Analysis to the World Wide Web,” Journalism and Mass Communication Quarterly 1 (2000)80-98.

上一篇:勘察设计调查报告范文 下一篇:风电设备调查报告范文