论文部分内容阅读
RSS是什么?它可以是“RichSite Summary(丰富站点摘要)”、“RDF Site Summary(RDF站点摘要,RDF是一种语义网技术)”,还可以是“Really Simple Syndication(简易聚合)”。这主要是因为该技术有不同的源头,不同的技术团体对其做出了不同的解释。实际上RSS是一种简单XML格式,用于为内容整合客户端提供选择性的、汇总过的Web内容。更准确地说,RSS是一种“轻量级、多用途、可扩展的元数据描述及联合推广格式”,它能够用于共享各种各样的信息,包括新闻、简讯、Web站点更新、事件日历、软件更新、特色内容集合和电子商务等。
一、RSS的特征
RSS本质上是一种信息的传递方式,最显著的特点主要有以下几条:
1.来源多样的个性化“聚合”:因为RSS是一种被广泛采用的内容包装定义格式,所以任何内容源都可以采用这种方式来发布信息,包括专业新闻站点电子商务站点、企业站点、甚至个人站点等。而在用户端,RSS阅读器软件的作用就是按照用户的喜好,有选择性地将用户感兴趣的内容来源“聚合”到该软件的界面中,为用户提供多来源信息的“一站式”服务。 2.信息发布时效高、低成本:RSS技术秉承“推”信息的概念,当新内容在服务器数据库中出现后很快就被“推”到用户端阅读器中,极大地提高了信息的时效性和价值。此外,服务器端内容的RSS包装在技术实现上极为简单,而且是一次性的工作,使长期的信息发布边际成本几乎降为零,是传统的电子邮件、卫星传输、互联网浏览等发布方式所无法比拟的。
3.无“垃圾”信息,便利的本地内容管理:RSS用户端阅读器软件的特点是完全由用户根据自身喜好以“频道”的形式订阅值得信任的内容来源,如“新华网国际新闻”、“中国汽车网市场行情”、“天极网n产品资讯”等。RSS阅读器软件完全屏蔽掉用户没有订阅的其他所有内容以及弹出广告、垃圾邮件等令人困扰的噪音内容。此外,对下载到阅读器软件本地的订阅RSS内容,用户可以进行离线阅读、存档保留、搜索排序、相关分类等多种管理操作,使阅读器软件不仅是一个“阅读”器,更是一个用户随身的“资料库”。
此外,订阅RSS的用户一般只接收到一些内容摘要信息,如果感兴趣的话才点击到相关页面进行访问,一般不会陷入那些无序的海量信息当中。
4.没有病毒:RSS文件是一种比较简单的XML文本文件,并没有涉及任何可执行的文件格式。 网站地址的解析也相对安全,不如E—mail那样容易模仿好友邮件地址给你发病毒,从而减少了自己机器收到病毒的风险。
二、RSS的文件形式
RSS是一种XML方言,用于连锁Web内容和元数据。RSS文件由一个 元素及其子元素组成。除了频道内容本身之外, 还以项的形式包含表示频道元数据的元素——比女口 、 和。项通常是频道的主要部分,包含经常变化的内容。
频道:一般有3个元素,提供关于频道本身的信息:
:频道或提要的名称。
:与该频道关联的Web站点或者站点区域的URLo
:简要介绍该频道是做什么的。
许多频道子元素都是可选的。常用的 元素包含3个必需的子元素:
:表示该频道的GIF、JPEG或PNG图像的URLo
:图像的描述。当频道以HTML呈现时,用作HTML标签的ALT属性。
:站点的URL。如果频道以HTML呈现,该图像作为到这个站点的链接。
项:通常是提要中最重要的部分。每个项都可以是关于某个we·blog、完整文档、电影评论、分类广告或者任何希望与频道连锁内容的记录。频道中的其他元素可能不变,但项经常发生变化。以前的规范限值为15个项,如果要保持向后兼容这仍然是一个很好的上限。现在可以有任意多个项。每个项通常包含3个元素:
:这是项的名称,在标准应用中被转换成HTML中的标题。
:这是该项的URLotitle通常作为一个链接,指向包含在元素中的URL。
:通常作为link中所指向的URL的摘要或者补充。所有的元素都是可选的,但是一个项至少要么包含一个, 要么包含一个。
三、应用实例
RSS发展目的是想将信息以XML为基础的方式,附上不同的后设数据描述来提供信息。换句话说,就是网站可以透过RSS来散布消息,让伙伴网站可以透过简单的软件就可以获得想要的信息。而如今RSS最主要的应用如下:
案例一:在Blog中的应用——博客中国(WWW.blogchina.com)
目前,RSS应用最广泛的还是在Blog也就是网志中。 我们经常会在一些Blog上看到这样的图标RSS,或者是诸如“syndicatethissite(XML)”之类的文字,这些图标和文字所对应的超级链接通常也就是该Blog的RSS输出文件的URL。一般情况下这些RSS文件是以xml或者使rdf为后缀的,但是也有一些网站采用动态地址来定位RSS文件。
案例二:Bt。C电子商务——亚马逊(WWW.amazon.com)
亚马逊是全球最大的B to C网上购物站点,所售商品种类达几十万种。如此庞大的商品数目使用户越来越难以找到他们想要的商品,也使亚马逊新商品介绍和商品促销的信息越来越难以找到合适的渠道传递给成千上万口味不同的用户。传统的Email发布形式由于“垃圾”邮件和病毒的盛行,已为大多数用户所摒弃,于是亚马逊于2004年初将注意力转向了RSS。今天打开亚马逊的网站,将会发现几乎所有种类的商品都已打包成相应的“RSS频道”,向用户终端的阅读器定期发送。通过RSS这个新渠道,亚马逊每当有新商品上市、新促销信息和重大新闻时,都能快速及时地将这些信息“推”向其用户,不仅给用户提供了方便,而且大大提高了这些信息的普及率、针对性和时效性,从而抓住了大量以前被白白浪费的商机和收入。
案例三:RSS在新闻中的应用——雅虎(WWW.yahoo.com) 门户网站的业务核心就是提供给用户及时、丰富、和有价值的信息。RSS技术的时效性、内容全面性以及可个性定制等特点决定了它是门户网站的必然选择。雅虎很早就看到了这个趋势,并于2004年初率先在"MyYahoo!”中推出了RSS信息频道订阅服务,并计划将新闻以外的更多内容也打包成RSS的格式推出,逐渐使RSS成为整个“MyYahoo!”内容服务的基础核心平台。
案例四:网上招聘——简历工厂(WWW.resumes2work.com)
每当一个行业符合信息量大,更新速度快的特性时,RSS就会发挥非常大的作用。门户如此,电子商务如此,网上招聘也不例外。其中比较有代表性的是简历工厂网站(删.resumes2work.com)。他们以地域为划分标准,将简历和招聘信息打包成相应的“RSS频道”,推送给订阅的用户。和亚马逊一样,不是每个人都有时间每天在数以万计的信息记录中搜寻自己喜爱的工作;比亚马逊更甚,一个新工作信息的使用寿命很短,一旦有人抢先入选,该信息对其他人便宣告失效。这种情况不仅对应聘者如此,对招聘者也是如此。所以在激烈竞争的人才市场里,通过RSS发布信息所带来的时效性和针对性便显得十分关键,成为一个“兵家必争”的渠道。
案例五:在搜索引擎中的应用——BioSlines(WMrW.bioSlines.com)
RSS提供了一种全新的个性化搜索。国外已经有很多RSS搜索引擎,如Feedster、BioGIInes、IceRocket等。最近一段时间,也开始出现一批中文RSS搜索引擎,比较知名的就有Donews、8Fang、FeedsS、Feed-Search等,再加上早一点出现的Grassland、RSSService、看天下等,中文RSS搜索已经暗潮涌动,大家纷纷开始在一个新的领域寻找机会了。 雅虎弃用Google搜索引擎之后,推出了自己开发的新搜索引擎,RSS技术成为新引擎的一个显著革新。RSS技术已经存在多年,但搜索网站的青睐则让它的存在有了更多的意义。基于该技术的所谓“个性化搜索”的服务,实际就是在检索结果中包含了XML和RSS混合内容的链接。
四、存在的问题
1.占用大量带宽
你的RSS被遍布四处的大量新闻聚合器所串联,每隔几个小时(甚至更短间隔)就被刷新调用一次,这是一个可怕的分布力量。即使人离开电脑;它也会自动照看几百个RSS。使用聚合器的人可能根本不会仔细去读内容,甚至是标题都从来不看一下。国内处于初级阶段的中文Blog服务大都还是采用Runtime的RSS方式,也许有一天被聚合器调用RSS页面会远超过浏览页面和作者在线工作的数量。如果不采取有效的措施,就会出现站点被众多RSS的访问流量阻塞酌情况。
2.RSS引发版权问题
关于RSS版权的问题,不仅涉及blogger的利益,也涉及像Blog-lines这样的RSS聚合服务商的利益。很多人建议,如果不希望自己的内容被Bloglines收录,就不要提供RSS输出。问题是RSS输出是为了方便那些非商业使用者的。矛盾之处在于,很多非商业使用者同时也是Bloglines的用户,他们是通过BioIines的服务,非商业地使用RSS的内容。问题在于,Bloglines有没有权利在这些有非商业约定的RSS上放置自己的广告?放置广告可能是Bloglines的盈利方式之一,它通过提供用户喜欢的服务,换取在它并不拥有权利的RSS上放置广告的权利,但这种商业利用却没有明确地得到RSS内容提供者的授权。如果这个问题不能解决,Biolines的商业模式就可能失去立足点。RSS 2.0规范是遵从CC(CreativeCommons)许可的,但它本身并未包含每一篇文章的版权许可。规范中有“copyright”元素,但这是用来申明该RSS全部内容的版权所有者的,而不是用来规定每篇文章的版权许可形式的。也就是说,你输出的RSS,很难把CC许可附加到每篇文章上。Bloglines抓取你的RSS,也就无从判断你采用的是何种版权许可。
3.用户一时还难以接受
2004年,越来越多的网站,尤其是主流媒体网站开始提供RSS支持。但RSS的实际使用者仍然很少,根据有关机构的调查,大约只有5%的互联网用户通过RSS订阅新闻。很多用户对于出现在Blog和网站上的橙色XML标志很困惑,点击后,浏览器打开的是一个难以阅读的页面。所以很多Blog上就会列出一长串的订阅方式:用Bloglines订阅、用MyYahoo!订阅、用Feed-Demon订阅一串logo。于是有人提出建议,就像http协议、mailto:协议,应该增加一个”feed://”协议,只要遵守该协议,就无需专门为每一种聚合工具列出一个logo,所有的XML聚合工具和RSS阅读器都可以自动处理RSS的订阅。
五、发展前景
1.RSS挑战门户霸权:RSS技术在中国大众互联网中的普及是有其基础和必然性的。首先,大量新网站和内容源的不断涌现和用户获取信息口味的多样化,使得RSS作为个性化聚合内容的最佳手段得到越来越多的用户的重视和钟爱。其次,越来越多的内容提供者为推广自身品牌,获得更大客户群而纷纷推出RSS服务,以期为他们的内容带来更大的流量和知名度。再次,目前的商业门户网站出于自身商业利益的考虑,把用户信息获取的环境搞得日益恶劣,弹出广告、垃圾邮件、不健康内容等充斥屏幕,而真正有价值的信息却无从寻觅。这些都迫使广大用户呼唤一种新的互联网阅读体验,一种可以自行控制、自己作主的新型“门户”体验,从而为RSS的普及奠定了良好的基础。
2.新闻出版业的应用潜力:在新闻出版领域,RSS技术作为电子出版的一个新型渠道(像华尔街日报电子版的案例)已经在新华社等新闻机构得到了有益的尝试,并逐渐成熟走向商业化。相信在不久的未来,RSS技术会作为新闻出版业的一项主流成熟技术被广泛应用。
3.企业知识管理利用的可能性:目前尚处于萌芽时期,像迪斯尼这样的经典案例还没有出现。但随着企业管理者对博客概念观念的转变和对其技术的更深刻理解,利用这项新技术来为企业知识管理、信息共享服务的浪潮相信会很快到来。
参考文献
1 李子臣,王晓丽.引擎竞争的两大焦点:RSS技术和桌面搜索模式.中国信息导报,2004(10):54—56
2 吴振新.RSS元数据在门户网站建设中的应用.现代图书情报技术,2004(10):60—64
3 袁勇智.基于RSS的Web信息发布和集成技术.现代图书情报技术,2004(2):60—62
4 王昭强.RSS技术让网络商业信息的传递更简单化,December,16,2004.http://www.emarketer.cn/em/expert/852.htm
5 什么是RSS,April, 18,2004.http://www.blogchina.com/new/display/28976.html
6 周靖译.用RSS来整合内容以满足不同的需要,August,18,2003.http://www.zdnet.com.cn/devel-oper/tech/story/0, 2000081602,39156759,00.htm
7 李建平.RSS新闻器:互联网上即将到来的革命,March,23,2004.http://www.pconline.com.cn/news/hy/0403/339395.html
8 看天下RSS十旨南,了uly,1,2004.http://www.kantianxia.com/blog/wp/index.php?cat:1
9 RSS 2.0站,氮,http://blogs.1aw.harvard.edu/tech/rss
一、RSS的特征
RSS本质上是一种信息的传递方式,最显著的特点主要有以下几条:
1.来源多样的个性化“聚合”:因为RSS是一种被广泛采用的内容包装定义格式,所以任何内容源都可以采用这种方式来发布信息,包括专业新闻站点电子商务站点、企业站点、甚至个人站点等。而在用户端,RSS阅读器软件的作用就是按照用户的喜好,有选择性地将用户感兴趣的内容来源“聚合”到该软件的界面中,为用户提供多来源信息的“一站式”服务。 2.信息发布时效高、低成本:RSS技术秉承“推”信息的概念,当新内容在服务器数据库中出现后很快就被“推”到用户端阅读器中,极大地提高了信息的时效性和价值。此外,服务器端内容的RSS包装在技术实现上极为简单,而且是一次性的工作,使长期的信息发布边际成本几乎降为零,是传统的电子邮件、卫星传输、互联网浏览等发布方式所无法比拟的。
3.无“垃圾”信息,便利的本地内容管理:RSS用户端阅读器软件的特点是完全由用户根据自身喜好以“频道”的形式订阅值得信任的内容来源,如“新华网国际新闻”、“中国汽车网市场行情”、“天极网n产品资讯”等。RSS阅读器软件完全屏蔽掉用户没有订阅的其他所有内容以及弹出广告、垃圾邮件等令人困扰的噪音内容。此外,对下载到阅读器软件本地的订阅RSS内容,用户可以进行离线阅读、存档保留、搜索排序、相关分类等多种管理操作,使阅读器软件不仅是一个“阅读”器,更是一个用户随身的“资料库”。
此外,订阅RSS的用户一般只接收到一些内容摘要信息,如果感兴趣的话才点击到相关页面进行访问,一般不会陷入那些无序的海量信息当中。
4.没有病毒:RSS文件是一种比较简单的XML文本文件,并没有涉及任何可执行的文件格式。 网站地址的解析也相对安全,不如E—mail那样容易模仿好友邮件地址给你发病毒,从而减少了自己机器收到病毒的风险。
二、RSS的文件形式
RSS是一种XML方言,用于连锁Web内容和元数据。RSS文件由一个
频道:一般有3个元素,提供关于频道本身的信息:
:与该频道关联的Web站点或者站点区域的URLo
许多频道子元素都是可选的。常用的
:站点的URL。如果频道以HTML呈现,该图像作为到这个站点的链接。
项:通常是提要中最重要的部分。每个项都可以是关于某个we·blog、完整文档、电影评论、分类广告或者任何希望与频道连锁内容的记录。频道中的其他元素可能不变,但项经常发生变化。以前的规范限值为15个项,如果要保持向后兼容这仍然是一个很好的上限。现在可以有任意多个项。每个项通常包含3个元素:
:这是该项的URLotitle通常作为一个链接,指向包含在元素中的URL。
三、应用实例
RSS发展目的是想将信息以XML为基础的方式,附上不同的后设数据描述来提供信息。换句话说,就是网站可以透过RSS来散布消息,让伙伴网站可以透过简单的软件就可以获得想要的信息。而如今RSS最主要的应用如下:
案例一:在Blog中的应用——博客中国(WWW.blogchina.com)
目前,RSS应用最广泛的还是在Blog也就是网志中。 我们经常会在一些Blog上看到这样的图标RSS,或者是诸如“syndicatethissite(XML)”之类的文字,这些图标和文字所对应的超级链接通常也就是该Blog的RSS输出文件的URL。一般情况下这些RSS文件是以xml或者使rdf为后缀的,但是也有一些网站采用动态地址来定位RSS文件。
案例二:Bt。C电子商务——亚马逊(WWW.amazon.com)
亚马逊是全球最大的B to C网上购物站点,所售商品种类达几十万种。如此庞大的商品数目使用户越来越难以找到他们想要的商品,也使亚马逊新商品介绍和商品促销的信息越来越难以找到合适的渠道传递给成千上万口味不同的用户。传统的Email发布形式由于“垃圾”邮件和病毒的盛行,已为大多数用户所摒弃,于是亚马逊于2004年初将注意力转向了RSS。今天打开亚马逊的网站,将会发现几乎所有种类的商品都已打包成相应的“RSS频道”,向用户终端的阅读器定期发送。通过RSS这个新渠道,亚马逊每当有新商品上市、新促销信息和重大新闻时,都能快速及时地将这些信息“推”向其用户,不仅给用户提供了方便,而且大大提高了这些信息的普及率、针对性和时效性,从而抓住了大量以前被白白浪费的商机和收入。
案例三:RSS在新闻中的应用——雅虎(WWW.yahoo.com) 门户网站的业务核心就是提供给用户及时、丰富、和有价值的信息。RSS技术的时效性、内容全面性以及可个性定制等特点决定了它是门户网站的必然选择。雅虎很早就看到了这个趋势,并于2004年初率先在"MyYahoo!”中推出了RSS信息频道订阅服务,并计划将新闻以外的更多内容也打包成RSS的格式推出,逐渐使RSS成为整个“MyYahoo!”内容服务的基础核心平台。
案例四:网上招聘——简历工厂(WWW.resumes2work.com)
每当一个行业符合信息量大,更新速度快的特性时,RSS就会发挥非常大的作用。门户如此,电子商务如此,网上招聘也不例外。其中比较有代表性的是简历工厂网站(删.resumes2work.com)。他们以地域为划分标准,将简历和招聘信息打包成相应的“RSS频道”,推送给订阅的用户。和亚马逊一样,不是每个人都有时间每天在数以万计的信息记录中搜寻自己喜爱的工作;比亚马逊更甚,一个新工作信息的使用寿命很短,一旦有人抢先入选,该信息对其他人便宣告失效。这种情况不仅对应聘者如此,对招聘者也是如此。所以在激烈竞争的人才市场里,通过RSS发布信息所带来的时效性和针对性便显得十分关键,成为一个“兵家必争”的渠道。
案例五:在搜索引擎中的应用——BioSlines(WMrW.bioSlines.com)
RSS提供了一种全新的个性化搜索。国外已经有很多RSS搜索引擎,如Feedster、BioGIInes、IceRocket等。最近一段时间,也开始出现一批中文RSS搜索引擎,比较知名的就有Donews、8Fang、FeedsS、Feed-Search等,再加上早一点出现的Grassland、RSSService、看天下等,中文RSS搜索已经暗潮涌动,大家纷纷开始在一个新的领域寻找机会了。 雅虎弃用Google搜索引擎之后,推出了自己开发的新搜索引擎,RSS技术成为新引擎的一个显著革新。RSS技术已经存在多年,但搜索网站的青睐则让它的存在有了更多的意义。基于该技术的所谓“个性化搜索”的服务,实际就是在检索结果中包含了XML和RSS混合内容的链接。
四、存在的问题
1.占用大量带宽
你的RSS被遍布四处的大量新闻聚合器所串联,每隔几个小时(甚至更短间隔)就被刷新调用一次,这是一个可怕的分布力量。即使人离开电脑;它也会自动照看几百个RSS。使用聚合器的人可能根本不会仔细去读内容,甚至是标题都从来不看一下。国内处于初级阶段的中文Blog服务大都还是采用Runtime的RSS方式,也许有一天被聚合器调用RSS页面会远超过浏览页面和作者在线工作的数量。如果不采取有效的措施,就会出现站点被众多RSS的访问流量阻塞酌情况。
2.RSS引发版权问题
关于RSS版权的问题,不仅涉及blogger的利益,也涉及像Blog-lines这样的RSS聚合服务商的利益。很多人建议,如果不希望自己的内容被Bloglines收录,就不要提供RSS输出。问题是RSS输出是为了方便那些非商业使用者的。矛盾之处在于,很多非商业使用者同时也是Bloglines的用户,他们是通过BioIines的服务,非商业地使用RSS的内容。问题在于,Bloglines有没有权利在这些有非商业约定的RSS上放置自己的广告?放置广告可能是Bloglines的盈利方式之一,它通过提供用户喜欢的服务,换取在它并不拥有权利的RSS上放置广告的权利,但这种商业利用却没有明确地得到RSS内容提供者的授权。如果这个问题不能解决,Biolines的商业模式就可能失去立足点。RSS 2.0规范是遵从CC(CreativeCommons)许可的,但它本身并未包含每一篇文章的版权许可。规范中有“copyright”元素,但这是用来申明该RSS全部内容的版权所有者的,而不是用来规定每篇文章的版权许可形式的。也就是说,你输出的RSS,很难把CC许可附加到每篇文章上。Bloglines抓取你的RSS,也就无从判断你采用的是何种版权许可。
3.用户一时还难以接受
2004年,越来越多的网站,尤其是主流媒体网站开始提供RSS支持。但RSS的实际使用者仍然很少,根据有关机构的调查,大约只有5%的互联网用户通过RSS订阅新闻。很多用户对于出现在Blog和网站上的橙色XML标志很困惑,点击后,浏览器打开的是一个难以阅读的页面。所以很多Blog上就会列出一长串的订阅方式:用Bloglines订阅、用MyYahoo!订阅、用Feed-Demon订阅一串logo。于是有人提出建议,就像http协议、mailto:协议,应该增加一个”feed://”协议,只要遵守该协议,就无需专门为每一种聚合工具列出一个logo,所有的XML聚合工具和RSS阅读器都可以自动处理RSS的订阅。
五、发展前景
1.RSS挑战门户霸权:RSS技术在中国大众互联网中的普及是有其基础和必然性的。首先,大量新网站和内容源的不断涌现和用户获取信息口味的多样化,使得RSS作为个性化聚合内容的最佳手段得到越来越多的用户的重视和钟爱。其次,越来越多的内容提供者为推广自身品牌,获得更大客户群而纷纷推出RSS服务,以期为他们的内容带来更大的流量和知名度。再次,目前的商业门户网站出于自身商业利益的考虑,把用户信息获取的环境搞得日益恶劣,弹出广告、垃圾邮件、不健康内容等充斥屏幕,而真正有价值的信息却无从寻觅。这些都迫使广大用户呼唤一种新的互联网阅读体验,一种可以自行控制、自己作主的新型“门户”体验,从而为RSS的普及奠定了良好的基础。
2.新闻出版业的应用潜力:在新闻出版领域,RSS技术作为电子出版的一个新型渠道(像华尔街日报电子版的案例)已经在新华社等新闻机构得到了有益的尝试,并逐渐成熟走向商业化。相信在不久的未来,RSS技术会作为新闻出版业的一项主流成熟技术被广泛应用。
3.企业知识管理利用的可能性:目前尚处于萌芽时期,像迪斯尼这样的经典案例还没有出现。但随着企业管理者对博客概念观念的转变和对其技术的更深刻理解,利用这项新技术来为企业知识管理、信息共享服务的浪潮相信会很快到来。
参考文献
1 李子臣,王晓丽.引擎竞争的两大焦点:RSS技术和桌面搜索模式.中国信息导报,2004(10):54—56
2 吴振新.RSS元数据在门户网站建设中的应用.现代图书情报技术,2004(10):60—64
3 袁勇智.基于RSS的Web信息发布和集成技术.现代图书情报技术,2004(2):60—62
4 王昭强.RSS技术让网络商业信息的传递更简单化,December,16,2004.http://www.emarketer.cn/em/expert/852.htm
5 什么是RSS,April, 18,2004.http://www.blogchina.com/new/display/28976.html
6 周靖译.用RSS来整合内容以满足不同的需要,August,18,2003.http://www.zdnet.com.cn/devel-oper/tech/story/0, 2000081602,39156759,00.htm
7 李建平.RSS新闻器:互联网上即将到来的革命,March,23,2004.http://www.pconline.com.cn/news/hy/0403/339395.html
8 看天下RSS十旨南,了uly,1,2004.http://www.kantianxia.com/blog/wp/index.php?cat:1
9 RSS 2.0站,氮,http://blogs.1aw.harvard.edu/tech/rss