信息门户聚合关键技术的研究与应用

被引量 : 0次 | 上传用户:zmaozhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化的不断发展,信息门户的出现使用户从中得到了许多便利,它将各种网络资源统一集成到一个门户之下,具有一站式访问以及单点登录等特点,用户可以方便的从门户上获得各种信息资源和服务。然而,传统的信息门户聚合技术已不能满足互联网快速发展的需要:第一,现有构建信息门户的方法并没有重视用户的个性化需求。第二,信息门户的构建需要整合大量分散异构的信息资源,这些资源可能分布在不同信息门户中,这是一项复杂而艰巨的任务。如何有效重用不同门户的信息资源,从而大幅度提高信息门户的构建效率,降低开发成本已成为一个亟待解决的关键问题。本文主要面向信息门户网页资源的按需聚合问题,提出一种面向服务的、以用户主导的信息门户聚合方法,帮助用户有效利用来自不同门户的信息资源快速构建新的信息门户。本文重点研究了网页信息按需抽取方法以及服务化封装和聚合的相关理论和技巧,主要内容和创新点如下:1.提出可视化的网页信息按需抽取方法。传统的网页抽取技术缺乏对用户个性化需求的考虑,针对这一问题,本文对网页信息的结构特点进行分析并且结合已有的信息抽取模型和相关技术进行改进,提出了网页信息的按需抽取方法。用户可以根据其个性化需求,利用鼠标圈定抽取范围,可视化的定位和抽取所需的网页信息,实现网页信息的按需抽取。2.为屏蔽网页资源在数据格式和访问方式上的异构性,本文在前期工作的基础上,引入了数据服务模型,以用标准化的方式对抽取的网页资源进行封装,并通过数据服务中心对数据服务进行统一管理和维护,从而帮助用户高效、方便的查找和发现所需服务,为数据聚合提供更好的支持,服务化后的数据服务将被注册到数据服务中心进行有序化的组织和管理。3.提出可视化的数据服务聚合和界面布局方法。用户可以在客户端自定义数据服务的聚合模式,只需进行简单的可视化布局操作,对想要聚合的服务进行配置,无需人工编写代码。聚合后的数据服务在调用后,会形成新的信息门户,从而达到门户资源重用的目的。4.在基于用户的网页信息抽取与聚合方法的基础上,设计并实现可视化数据抽取模块、服务化封装模块和数据服务聚合模块,并且开发了信息门户聚合工具。
其他文献
目的探讨自动痔疮套扎联合外剥内扎术治疗脱垂性痔疮的疗效及安全性。方法将2016年2月至2017年3月104例脱垂性痔疮患者根据数字表法分组。对照组采用外剥内扎术治疗,联合手术
<正>历史,是一个民族的记忆,同时又记忆了这个民族。世界各国,都是如此。纵观中国几千年文明史,我们的先人对"史"的重视,堪称世界之最。中国的史籍成书最早说到中国史籍成书
更接近于文化研究的"文学中的城市"研究,比"城市的文学"研究能够更多揭示现实城市与文学城市之间的极其复杂的关系。文学以对于北京城的想象性表述,参与了现实的北京城的塑造
南京白局,作为南京地区极具浓郁地方特色的唯一现存的本土说唱艺术,流传已近七百年之久。然而时至今日,南京白局创生之初的辉煌局面已不复存在,老艺人相继作古、传承人断层、
<正>高锰酸钾俗称灰锰氧,外观呈黑紫色固体小颗粒,易溶于水,水溶液为玫瑰红色。它是一种强氧化剂,可以消毒杀菌,为家庭常用消毒药。在妇科方面,0.01%的高锰酸钾水溶液可以用
核事故会对人们生命安全及环境健康造成巨大危害。为最大限度地控制放射性物质的传播扩散,放射性废水的有效处理和处置应当引起我们足够的重视。本文总结了切尔诺贝利核爆炸
本文主要通过文献回顾,对上海闵行区城中村现状进行阐述和分析,得出其改造存在城乡二元体制改革滞后、土地产权难界定、政府角色不明确和集体经济发展困难等问题,并且得出政
为方便实现对桥梁缆索的检测和日常维护任务,利用蛇形机器人良好的适应性,通过研究其控制规律,给出了一种简单的并可实现蛇形机器人沿缆索进行螺旋攀爬运动的控制函数。分析
情绪劳动是体力劳动、脑力劳动之外的第三种劳动,它是通过管理个人情感,建立公众可见的表情和身体展示,以获得报酬、晋升机会以及良好人际关系等物质或非物质奖励的一种劳动
考察2008年1月雪灾发生前期全球海洋的热状况发现,强La Nia事件和北大西洋显著增暖是最明显特征。此外,北太平洋中部较常年偏暖,北极(特别是北欧海附近)海冰较常年显著偏少