基于动态领域知识体系的信息采集方法及实现

被引量 : 0次 | 上传用户:kary_yeah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一个庞大的动态信息资源库,互联网已经成为各类机构信息采集的重要渠道之一,专题的信息采集变得十分重要。但是目前面向网络的信息搜索是基于关键词技术的,采集结果零碎,内容孤立,数据量大。本文在项目任务需求基础上,提出一种基于动态领域知识体系的专题信息采集方法,本方法是在基础领域知识体系基础上,结合关键词的发现,并在领域专家干预下实现的,从而实现专题信息采集的动态适应性,对提高采集质量有很好的研究意义。本文首先对信息采集和信息更新的基础理论方法和研究现状进行了简介,介绍了Web信息采集的基本原理和信息更新的方法以及相关技术。然后针对Web内容进行专题信息采集的策略设计,其中主要是对一般网页的采集策略设计、论坛数据的采集策略设计、领域知识体系的更新设计。有了相关采集策略后,进行系统的需求分析,分析现有领域知识体系应用于专题信息采集上面的不足,再进行系统的分析与设计,包括领域知识体系的建立,系统功能结构的分析,其中系统核心是对预置的领域知识体系进行半自动化更新,从而进一步提高专题信息采集的采全率,最后实现系统,针对特定的国防领域知识体系的专题信息采集设计了实验,对本文提出的方案设计进行测试。本文的主要贡献在于在传统的专题信息采集的基础上提出了不同信息源的采集策略和领域知识体系更新的半自动算法,并在系统中进行应用测试,在提交给用户实际使用的过程中得到认可。
其他文献
分别在20℃和7℃工况下对R417a用于空气源热泵热水器进行了实验,并就进水温度对系统吸/排气压力、消耗功率、制热功率、COP等方面与R22进行了对比分析。结果表明,两种工况下,
本文首先对大管演奏中"呼吸技巧"的重要性进行了探讨,然后对大管演奏中的腹式呼吸、胸式呼吸以及胸腹式呼吸等三种主要的呼吸技巧进行了分析,最后对其在演奏中的运用进行了评述
目的探讨IL-6在多囊卵巢综合征(polycystic ovary syndrome,PCOS)高胰岛素血症和胰岛素抵抗中的作用。方法在体外培养的大鼠胰岛细胞培养液中加入10、100和1 000 pg/ml IL-6,
反垄断法私人执行中的间接购买人诉讼资格与转嫁抗辩一直是一个充满争议的问题,其反应了反垄断私人执行的赔偿目标与威慑目标之间的矛盾。从赔偿市场中垄断协议或行为受害者
2007年5月作者对青海省天峻县9个乡镇的29只藏羊进行蠕虫学全身剖检,发现吸虫1种,绦虫2种,绦虫蚴3种,线虫19种,住肉孢子虫1种,蜘蛛昆虫2种。优势虫种为住肉孢子虫(sarcocysti
基本矩阵的估算可以分为线性算法、非线性优化迭代算法、鲁棒估计算法三大类,而以鲁棒估计效率、效果最为突出,但是实现比较复杂。本文通过数码相机获取的两张未标定照片,采
以南京大学等52所本科院校档案网站调研为基础,从服务对象、服务功能和服务内容等三个方面对其提供的数字档案资源服务进行考量,并在此基础上提出意见或建议,以期对我国高校
2003年11月21日上午10时,北京物美商业集团股份有限公司(下称“北京物美”)在香港创业板挂牌上市。其90%以国际配售形式发售的股份,认购倍数达13倍左右;其余10%公开发售股份的认购倍
HRP(Hospital Resource Planning医院资源计划)是医院,融合现代化管理理念和流程,整合医院已有信息资源,创建一套支持医院整体运营管理的统一高效、信息共享的系统化医院资源管
在小学语文课堂中培养人文价值教育是时代发展的需要,也是教育目标的要求。如何在教学中渗透人文价值,是老师研究实践的重要问题。在小学语文课堂里,倾注仁爱之心,耐心养成"正