RSS的“功夫”

时间:2022-08-01 12:10:40

RSS的“功夫”

新闻出版行业在互联网方兴未艾的今天面临着众多的机遇和挑战。层出不穷的新技术使稳定、高效、实时、安全、低成本的新闻信息、接收和使用越来越成为可能,而这些技术的实施和使用成本也在不断降低,越来越成为信息者和使用者日常生活、工作的一部分。

RSS技术就是互联网上最新技术的杰出代表,是新闻出版、信息、互动交流领域新技术的奇葩。

RSS技术的发展历程

RSS是“Rich Site Summary”或“Really Simple Syndication”的英文首字母缩写,中文称作“简易信息聚合”。RSS是一种基于XML标准,在互联网上被广泛采用的内容包装和投递协议。

RSS技术诞生于1999年的网景公司(Netscape)。当时由于公司内部商务决策、当时互联网内容匮乏等诸多原因,网景最终只了一个0.9版本的规范。微软当时也推出了类似的数据规格,与RSS非常接近,试图利用新闻频道的架构把“推”(Push)技术变成一个应用主流,捆绑在IE浏览器中与Netscape Navigator抗衡。不过无奈的是,由于当时互联网访问速度慢、内容缺乏、用户不熟悉等原因, 这个“推”技术自始至终没有得到市场的广泛支持。

但是随着时间的推移,RSS技术随着XML技术的发展和博客群体的快速增长,逐渐被人们广泛地接受,其应用范围也已经跳出单纯的博客圈,成为新闻传媒、电子商务、企业知识管理等众多领域的不可缺少的新技术。2001年,RSS技术标准的发展工作被戴夫・温那(Dave Winer)的公司所接手,继续开发新的版本,以适应新的网络应用需要。通过戴夫・温那的努力,RSS升级到了0.91版,然后达到了0.92版,并随后被众多的专业新闻站点所接受和支持。

在广泛的应用过程中,众多的专业人士认识到需要组织起来,把RSS发展成为一个通用的规范,并进一步标准化。

一个叫W3C的联合小组根据新一代的语义网技术RDF对RSS进行了重新定义,了RSS 1.0版,并把RSS定义为“RDF Site Summary”。这项工作并没有与戴夫・温那进行有效的沟通,而戴夫则坚持在自己设想的方向上进一步开发RSS的后续版本2.0,同时也不承认RSS 1.0的有效性。RSS由此开始分化形成了RSS 0.9x/2.0和RSS 1.0两个阵营。

戴夫・温那在2002年9月独自把RSS升级到了2.0版本,并交由哈佛大学法学院Berkman互联网和社会学中心进行维护。而RSS 1.0版则仍然由W3C联合小组维护。

最近,著名的互联网搜索引擎公司GOOGLE收购了美国大型的博客服务网站, 使这个网站一直采用的一种近似于RSS的技术衍生版Atom一夜之间成为RSS领域标准之争的新的有力竞争对手。目前,这三个技术标准阵营(RSS 0.9x/2.0,RSS 1.0,Atom 0.3) 正在展开相互兼容的对话,相信在不久的将来会有积极的结果。

尽管技术标准有差异,但是目前市场上的RSS内容阅读软件,完全支持这三种技术标准。也就是说,无论RSS内容提供者决定采用哪一种标准来包装自己的内容,对使用RSS内容阅读器软件的用户都没有影响。

RSS技术的特点

RSS通过XML标准定义内容的包装和格式,使内容提供者和接收者都能从中获益。对内容提供者来说,RSS技术提供了一个实时、高效、安全、低成本的信息渠道;对内容接收者来说,RSS技术提供了一个崭新的阅读体验。

RSS技术几大显著特性如下:

来源多样的个性化“聚合”特性。 因为RSS是一种被广泛采用的内容包装定义格式,所以任何内容源都可以采用这种方式来信息,包括专业新闻站点、电子商务站点、企业站点、甚至个人站点等。而在用户端,RSS阅读器软件的作用就是按照用户的喜好,有选择性地将用户感兴趣的内容来源“聚合” 到该软件的界面中,为用户提供多来源信息的“一站式”服务。

信息的时效、低成本特性。RSS技术秉承“推”信息的概念,当新内容在服务器数据库中出现时第一时间被“推”到用户端阅读器中,极大地提高了信息的时效性和价值。此外,服务器端内容的RSS包装在技术实现上极为简单,而且是一次性的工作,使长期的信息边际成本几乎降为零,是传统的电子邮件、卫星传输、互联网浏览等方式所完全无法比拟的。

无“垃圾”信息、便利的本地内容管理特性。RSS用户端阅读器软件的特点是完全由用户根据自身喜好以“频道”的形式订阅值得信任的内容来源,如“新华网国际新闻”、“中国汽车网市场行情”、“天极网IT产品资讯”等。RSS阅读器软件完全屏蔽掉其他所有用户没有订阅的内容以及弹出广告、垃圾邮件等令人困扰的噪音内容。此外,对下载到阅读器软件本地的订阅RSS内容,用户可以进行离线阅读、存档保留、搜索排序、相关分类等多种管理操作,使阅读器软件不仅是一个“阅读”器,更是一个用户随身的“资料库”。

RSS的招式

对于一般用户来说,用RSS订阅新闻可以像使用Outlook Express收取订阅的邮件一样简单;而对于Web应用程序的开发者而言,RSS的工作过程也不是那么复杂,至少比大多数其他常见的Web技术都更容易被理解和被实现。

用通俗的语言可以这样描述一个RSS的基本应用:用户通过RSS订阅,从网站上获取最新的文章标题、内容提要及全文链接等基本信息(Feeds),并据此进行可取舍的有针对性的快速阅读。

在一个RSS提要(Feeds)的分发过程中,内容商首先将要的提要按照RSS定义的方式输出到一个标准的XML文件,该文件在Web上要由一个惟一确定的地址来标识。用户端在得知该XML文件的地址后,将其导入“周博通”或“看天下”等RSS阅读器,作为监测地址。然后,RSS阅读器将按照预先设定的频率,每隔一段时间(一般为几分钟到一个小时不等)对监测的RSS地址进行扫描,查看目标XML文件是否有变动。一旦发现该文件被改动过,就将此XML文件自动下载到本地。

被监测的XML文件(RSS地址)中保存着标准RSS格式的提要(Feeds)信息,这些信息用不同的标签来标注。Feeds包含的主要信息有频道名称(用〈channel〉来标识)、标题(〈title〉)、链接地址(〈link〉)、内容摘要(〈description〉)、语言(〈language〉)、时间(〈pubdate〉)、作者(〈author〉)、分类(〈category〉)等十多种预定义的标记。用户接收到Feeds后,就能在RSS阅读器中看到这一频道下所有最新文章的标题和每篇文章的内容摘要以及可链接到全文的网页地址。如果用户通过对文章标题和内容摘要(一般只有几十到上百字)的浏览产生了进一步阅读的兴趣,就可以通过Feeds中提供的链接找到文章的全文进行详细阅读。

(李书宁/华南师范大学经济与管理学院教授)

上一篇:新闻学术网站的生存场景 下一篇:频道生存状态调查分析报告