一种流数据多播接口的设计、实现与应用

来源 :集成技术 | 被引量 : 0次 | 上传用户:jing8522
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量流数据的分析与处理是信息社会面对的一个基本问题。各种传感器汇聚的数据是流数据,人们发出的短信对于移动通信运营商的数据中心来说是流数据,人们写的微博对于新浪或者腾讯来说是流数据,搜索引擎网页爬取子系统传给后台处理的数据也可以看成是流数据。尽管它们的应用背景不同,但有共同的特征,即存在一个网络上的汇聚节点,从该节点的角度看,数据源源不断地到来。通常,这些数据会以某种特定的格式缓存起来,待某个特定的后续系统处理。启发本文工作的问题是:那些数据常常是有多方面价值的,有些甚至是当前没有想到的,我们有必要同时开放一个流数据接口供未来可能出现的新应用调用。该接口应该具有如下特征:(1)向外输出原始流数据;(2)允许其他(多个)应用程序动态接入和退出;(3)接入的应用程序的行为不影响数据搜集和最初设计的后续系统的功能。本文以连续运行了10年以上的天网搜索引擎和中国Web博物馆(WebInfomall)为例,讨论其网页搜集子系统的改造以适应上述需求,IP多播是采用的基本技术。在介绍了设计思想和实现要点后,我们也给出一个“新应用”的实际例子。这样一个接口的实现,为各种网页流信息分析应用打开了一扇窗口。该接口的设计思想也可以用于其他流数据汇聚系统中。 Massive stream data analysis and processing is one of the basic issues facing the information society. Data collected by various sensors is streaming data, and messages sent by people are streaming data for data centers of mobile communication operators. People write microblogs for streaming data to Sina or Tencent, and search engine web crawling subsystems Data passed to the background can also be seen as streaming data. Although they have different application backgrounds, they all share the same feature that there is a convergent node on the network. From this node’s point of view, data comes in an endless stream. Often, these data are cached in a specific format for processing by a particular, subsequent system. The problem with this article’s work is that those data are often valuable in many ways, and some are not even currently thought out. It is necessary for us to simultaneously open a stream data interface for new application calls that may come out in the future. The interface should have the following characteristics: (1) export the original stream data outwards; (2) allow other application (s) to dynamically access and exit; (3) the accessed application’s behavior does not affect the data collection and initial Design of follow-up system functions. Taking the Skynet search engine and WebInfomall that have been running continuously for more than 10 years as an example, this paper discusses the transformation of its webpage collection subsystem to meet the above requirements. IP Multicast is the basic technology adopted. After introducing the design ideas and implementation points, we also give a practical example of “new application.” The realization of such an interface opens a window for various webpage flow information analysis applications. The design idea of ​​this interface can also be used in other stream data gathering systems.
其他文献
随着我国社会的不断更新以及经济的不断发展,在这种环境背景之下我国对教育教学予以更多的重视,对于教育教学也进行了深入改革,目的就是要促进我国教育实际水平的提高同时也
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
近年来,物联网(Internet of Things,IoT)产业受到许多的关注,世界各国均视其为潜在无限商机的高科技产业,并投入大量的资源从事研发与推广。由于物联网的应用非常广泛,且透过物联网技术人类得以提升生活质量,让生活更加便利,因此,本论文首先简介物联网的背景及应用,并介绍其基本概念与架构。接着,本论文以「无线感测真菌人文树道」为例,针对物联网技术应用于人文艺术领域进行说明,并详细叙述其所
今年7月以来,“维基解密”就在网上不断公布秘密文件,并且愈演愈烈,令全世界为之侧目.皮尤人民与新闻界研究中心近日对1 000名美国人的调查显示,53%的美国受访者认为维基解密
随着社会的发展,人们的环保意识不断提升,越来越重视国家的生态建设工作,而园林工程作为国家生态建设的重要组成部分,其施工质量会对生态建设的效果造成直接的影响.但园林工
为了便于固体氧化物燃料电池(SOFC)的性能预测和控制方案设计,提出一种基于支持向量机(SVM)的建模方法,用具有RBF核函数的SVM建立了SOFC电池堆的非线性模型。应用仿真对所建SVM模型的有效性和精度进行了检验,并与BPNN模型的辨识效果进行了比较。仿真结果证明与BPNN模型相比,SVM模型具有较高的建模精度。该SVM辨识模型的建立,对SOFC系统的控制策略研究具有一定的实用价值。
本文对机器翻译技术的研究现状进行了全面介绍,分析了亟待解决的核心问题,并对机器翻译的未来发展前景和趋势提出了自己的设想。
《安全生产法》自2002年11月1日起实施,至今两年了。但从今年上半年全国共发生各类伤亡事故426,283起,死亡63,735人的情况看,事故总量和死亡人数仍居高不下,全国平均每天因
本刊讯 从2003年12月20日在北京召开的“中国数字音视频标准与产业论坛”上获悉,备受业内关注的我国拥有自主知识产权的数字音视频编解码技术标准(AVS)《信息技术先进音视频
邮发代号:22-49《建材技术与应用》主要报道国内外建筑材料及相关领域的进展和动态,介绍建筑、建材及相关领域的新技术、新工艺、新装备,开展学术研究,交流生产技术,促进科技