基于本体的农业科技信息用户建模系统研究

来源 :中国农业科学院 | 被引量 : 0次 | 上传用户:adige
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
快速发展的互联网给人们的生活带来了全方位的便利,同时网络上信息资源的爆炸性增长也不可避免的带来了一些问题。由于网络构成的是一个开放、分布的信息空间,其本身固有的异构性、多样性、分布性所造成的“信息过载”、“资源迷向”问题也日益严重。搜索引擎为我们提供了检索信息的便利,然而目前大多数检索系统对用户提供的检索仍然是停留在“关键词”层面上,缺乏语义和针对性,并在一定程度上造成了信息的流失。在针对性方面利用用户模型来描述用户信息,为用户提供个性化的服务。在语义方面引入本体提供语义层面的描述,分析用户需求、信息资源。用户建模工作可以追溯到上世纪70年代后期,国内用户建模方面的研究起步较晚,而基于本体的用户建模更是近两三年才开始稍见成效。从目前所掌握的信息看,农业领域方面尚无人问津。本研究以部分农业科技信息用户为例,研究怎样获取用户的知识结构,如何表示用户的信息需求和兴趣爱好并从这些数据中分析得到用户模型。具体来讲,本文主要完成的工作包括:(1)以《农业叙词表》作为初级的农业本体,并从文献中抽取出概念,用于表达用户的知识结构。(2)将农业词表加入通用词表中,对农业词表分配较大的权重以对农业词汇优先分词。以本体为依据,对文献进行语义标注,实现文献中词汇与本体中概念的匹配,并构建用户本体。(3)以TF-IDF算法计算文献中知识元素出现的频率记为用户概念向量,记录用户对知识元素的偏好。(4)用户本体和用户概念向量共同构成用户模型。(5)以余弦相似度的算法计算文献检索结果与用户模型的相似程度,从语义的角度出发对用户的文献检索结果进行重排序。(6)本体作为分词、语义标注的工具以及用户模型的一部分,实现信息资源与用户知识之间的对照。本研究以本体和概念表的方式表示用户模型。从文献中抽取出概念组成用户本体,并利用已有的本体对文献中的词汇进行归一化组织,计算出文献中用户感兴趣概念的向量,以表示用户的兴趣偏好。实验表明,本研究对用户文献检索结果的排序有所改善。本研究方法不仅适合于科技信息用户建模,也适用于互联网络中一般性的用户建模。
其他文献
光疗法作为物理疗法的一种,已经在临床取得了显著成果。但对于人体这个复杂的巨系统,由于皮肤对不同波长的光有不同的反射和吸收特性,而且不同组织间的光学特性存在差异。因
基于外聘教师自身、学生、专任教师、教学管理者对外聘教师教学质量的评价,从教学纪律、教学内容、教学方式、教学情感四个层面,剖析了外聘教师教学质量,发现:外聘教师入职门槛低
<正> 肺动脉血栓栓塞病(The pulmonary Thombo Embolic Disease)旧称肺栓塞或肺梗塞(本文中仍应用肺梗塞或肺栓塞),但究竟是由于血栓形成或由于栓塞所造成,有时在病理学上亦
马克思关于人的本质的三个重要命题——自由的有意识的活动是人的类本质、人的本质在现实性上是一切社会关系的总和、人的需要即是人的本质——各自具有丰富的内涵和特征,三
针对电、气、热相耦合的多电-气互联综合能源系统(IEGES),将高渗透率区域和低渗透率区域作为不同的利益主体,提出一种考虑日前联络线调度计划的多IEGES分散协调调度模型。在
随着经济的发展,对建设用地的需求持续增长,征收农村集体土地成了建设用地供给的一种主要方式,伴随征地过程产生了对农民的补偿与安置问题。由于我国的法律对征地的前提、主
本文介绍了有机膨润土的合成原理和方法及其在油漆高温润滑脂、铸型涂料、纺织工业、钻井工业、化妆品等方面的应用。
森林具有多种功能,这些功能大致可以划分为经济功能、社会功能和生态功能三类。其中生态功能是森林诸多功能之中最基础和本原的功能,森林生态功能的损害不仅影响到森林经济功
近半个世纪以来,中国社会主义经济发展先后经历了高度集中的计划经济和向现代市场经济体制转型的过渡经济时期,目前已初步建立了社会主义市场经济体制。在计划经济时期,中国
随着微型燃气轮机和以其为基础的热电联供单元的大量配置,电力、天然气系统之间的联合优化调度越来越受到关注。针对电-气混联系统的优化调度问题,提出双层多时间尺度优化调