基于.NET 3.5的网络信息采集系统的设计思想和工作原理

时间:2022-10-18 12:29:47

基于.NET 3.5的网络信息采集系统的设计思想和工作原理

【 摘 要 】 现代社会是一个信息社会,掌握必要的信息是发现问题、解决问题的前提。如何汇集网络信息资源呢?需要建立网络信息采集系统,将分散在不同机构的居民健康数据整合为一个逻辑完整的信息整体,对于实现城乡一体化的医疗服务水平和质量,提高居民对基层医疗机构的信任度,实现城市卫生资料的高效利用等方面具有重要的社会意义。文章从对.NET3.5的介绍谈起,然后分别就基于.net 3.省略3.5 网络信息采集系统设计思想工作原理

Design Ideas and Works .NET 3.5 Web-based Information Collection System

Tang Jing Peng Chun-fu

(Changde Vocational Technical College HunanChangde 415000)

【 Abstract 】 Modern society is an information society, to acquire the necessary information is the premise to discover and solve problems. How to assemble a network of information resources? The need to establish a network information collection system, will be scattered in different institutions of the residents'' health data into a logical and complete information as a whole, the level and quality of urban and rural health care services to improve the trust of the residents of the primary health care institutions, and urban health efficient use of information has an important social significance. From the introduction. NET3.5 about, then, respectively, based on design ideas and works of the NET 3.5 Web-based information acquisition system is described.

【 Keywords 】 .Net3.5 network information collection system design idea works

0 前言

网络信息采集系统是指通过对网络各类信息汇集、分类、整合、筛选等技术处理,再形成对网络热点、动态、网民意见等实时统计报表的软件系统平台。网络信息采集系统可以提供信息汇集服务,机构及工作人员可以充分利用计算机网络自动信息采集功能来收集相关信息,系统根据用户信息需求,设定主题目标,使用人工参与和自动信息采集相结合的方法完成信息收集。

1 .NET3.5概述

1.1 .NET3.5的特性

.NET 3.5主要特性。

1)可以实现深度整合语言级的数据集成查询(LINQ)与数据处理。

2)可以借助ASP AJAX创建更高效、更具交互性、更有个性的网络体验,并支持大多数流行的浏览器。

3)支持AJAX、JSON、REST、POX、RSS、ATOM等新型网络协议,以及一些新的WS标准,用于构建WCF服务。

4)全面提供WWF、WCF、WPF工具支持,包括新的工作流服务技术。

5)在基类库(BCL)中添加了很多新的类,可以更好的满足大多数客户的需求。

1.2 以.NET3.5技术框架为基础的系统总体框架

2 基于.NET 3.5的网络信息采集系统的设计思想

2.1 网络信息采集系统的设计思路

各种网络信息采集系统的详细设计思想可能不太一样,但是基本的设计思路是一致的,下面就以通用的网络信息采集系统为例子,介绍一下网络信息采集系统设计的基本的步骤。

第一步:确定采集任务。

第二步:针对不同的目标数据源,进行不同的采集配置,以确保能采集到数据。

第三步:调度采集任务,与目标站点同步更新,增量采集。

第四步:采集到数据结果,完成数据异构到同构的过程。

第五步:通过服务器,将数据到应用平台。

2.2 网络信息采集系统的设计方案

网络信息采集系统通过对热点问题和重点领域比较集中的网站信息,如网页、论坛、BBS等,进行24小时监控,随时下载最新的消息和意见。下载后完成对数据格式的转换及元数据的标引。对下载本地的信息,进行初步的过滤和预处理。

对热点问题和重要领域实施监控,前提是必须通过人际交互建立舆情监控的知识库,用来指导智能分析的过程。对热点问题的智能分析,首先基于传统基于向量空间的特征分析技术上,对采集的内容做分类、聚类和摘要分析,对信息完成初步的再组织。然后在监控知识库的指导下进行基于舆情的语义分析,使管理者看到的民情民意更有效,更符合现实。最后将采集的信息数据,分别推送到不同的职能部门,供相关部门制定对策使用。

网络信息采集系统是利用搜索引擎技术和网络信息挖掘技术,通过网页内容的自动采集处理、敏感词过滤、智能聚类分类、主题检测、专题聚焦、统计分析,实现各单位对自己相关网络舆情监督管理的需要,最终形成舆情简报、舆情专报、分析报告、移动快报,为决策层全面掌握舆情动态,做出正确舆论引导,提供分析依据。

上一篇:利用C#将Excel数据导入SQL Server的设计与实现 下一篇:Altium Designer 9在工程中的仿真应用