粒分层结构在信息检索上的应用

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:xyw1h
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:在传统粒计算理论的基础上,针对一种新的粒表示方法,因为其结构更适合进行层次分析,在其基础上进而构建映射系统,并尝试将该理论应用数据信息检索查询中,发现当粒度层次映射到特征库中,便可得到信息的层次结构图。结合用户检索时的兴趣点,通过添加或删除约束条件对检索的特征粒进行泛化或细化运算,从而引导用户找到满足兴趣点的信息,最后探讨了该方法在协助用户获取满足兴趣点的信息时的特点。并利用这个特点尝试构建基于粒结构的信息检索模型,讨论了该粒结构在协助用户获取信息时的特点。
  关键词:粒计算;粒结构;投影;信息检索
  中图分类号:TP301
  粒计算是一种新的基于问题概念空间划分的智能计算方法[1-4]。通常可以从两个方面来研究粒计算的问题,一方面是粒的结构,另一方面是粒的计算,粒的结构主要对粒的形成,表示和解释进行讨论。而粒的计算主要讨论如何使用粒的问题。在目前粒计算理论研究上,许多学者对粒的结构和构建方面的问题进行了研究,比较典型的有从内容,结构,用法三个角度对粒的结构进行构建和分析,还有把一个基本粒表示成一个语法和语义的二元组等等。文献[5]结合实际应用,结合众多粒表示方法,采用一种适不但适应数据上具有离散性的原子粒,而且适用于不具离散性的数据。另一方面,信息检索特点和发展瓶颈也体现在具有模糊性和不确定性上,因此粒计算理论这种计算方法非常适合信息检索。
  本文结合传统粒计算理论,针对一种新的粒表示方法,在其基础上进而构建映射系统,并尝试将该理论应用数据信息检索查询中,发现当粒度层次映射到特征库中,便可得到信息的层次结构图。结合用户检索时的兴趣点,通过添加或删除约束条件对检索的特征粒进行泛化或细化运算,从而引导用户找到满足兴趣点的信息,最后探讨了该方法在协助用户获取满足兴趣点的信息时的特点。并利用这个特点尝试构建基于粒结构的信息检索模型,讨论了该粒结构在协助用户获取信息时的特点,提高了数据分析的效率。
  1 相关基本定义
  1.1 假设在一个四元组特征库(U,A,V,F )中,令属性a∈A, 值域MVa,则将原子公式定义为(a,M),或记为aM,定义的粗糙逻辑公式如下:[5]
  (1)aM是原子公式,原子公式是公式;若M=Va,则aM对应的对象为整个论域,并把该类原子公式记为T;若M=,则称aM为空公式。
  (2)如果A和B是原子公式,那么A∧B是公式,使用连接词∧进行有限次运算所组成的式子是公式。
  1.2函数h(a,M)表示所有在属性a(a∈A)上的值属于M(MVa)的对象集,即h(a,M)={x|a(x)∈M},其中x∈U,则信息系统S=(U,A,V, f )中粒的定义为:[5]
  Gr=((a, M), h(a,M)),
  其中原子公式(a, M)为粒Gr的语法,Gr被称为信息系统中的原子粒。
  1.3 [6]设U表示特征库中表示对象的集合,G为表示特征库中特征粒的集合, N,N1,N2U,M,M1,M2G,F: (G)→(U)为特征粒集合G映射到对象集U的映射算子;L: (U)→(G)表示从对象集合U到特征粒上的映射算子。
  2 粒的分层结构
  2.1 (映射系统)假设Gr=(Ψ,(Ψ))为四元组特征库(U,A,V,F)中一个任意粒,其中公式Ψ可以描述为(a1, M1)∧(a2, M2)∧…∧ (an, Mn), Gr通过分解(分解算法参见文献[5])可以得到一个粒子集{Gr1,Gr2,…,Grn},则将Gr在S中映射系统表示(U’,G,I),其中U’=U – {x|(x,Gri)I , Gri },I为U’于满足G,的运算关系。
  2.2 假设在一个组特征库中,Gr对应的映射系统为(U,G,I),设Q={(x,F(x))|x∈G, x= L(F(x))},则存在唯一的有序二元对Z与之对应。我们称这个有序二元对Z形成的数据结构为Gr在信息系统S中的投影。
  对于特征库中任意一个粒子,都可以通过算法3.1找到与之对应的映射系统,在这个映射系统中每个粒子节点都满足以下特点,即每个粒子节点都有且只有一个最小子节点,每个粒子都有且只有一个最大父节点。由此特点可以再该映射系统找到该粒子的对应的信息系统中的投影。该投影描述的数据结构其实就是该粒子对应的粒度层次结构。
  3 基于粒分层结构的信息检索
  从大量的数据库中,检索出具有相似特征的信息是一个处理不确定信息的过程。这里要解决的问题是如何将查询特征与特征库中的资料按照一定的算法进行形似匹配,将满足一定相似性的一组候选结果按最优排序返回给用户。将查询特征形式化为一个组合粒,特征库形式化为信息系统,则特征与特征库中的数据形似匹配的过程转换为对特征粒的粒层次结构遍历的过程。
  文献[4]讨论了用粒结构进行信息检索的可行性和有效性。本文在构建新的粒结构,提高粒的适用性的基础上,根据文献[4],给出基于新的粒结构的信息检索的初步模型,图1是模型构建的流程。
  图1 基于新的粒结构的信息检索
  这里基于粒结构的信息检索是特点在于在精确的检索进行之前,通过领域信息和用户背景将用户的检索条件形式化为特征粒,当把该特征粒投影到特征库时形成映射系统,与原系统比较映射系统的数据信息都是用户感兴趣的相关信息,所有这些相关数据信息形成一个不同粒度层次的粒结构,用户在对感兴趣数据信息的粒结构的检索时,根据自己的兴趣点,如果当前选择的特征粒相对兴趣点过于泛化的情况,可以采取细化运算。
  4 结束语
  本文在传统粒计算理论的基础上,针对一种新的粒表示方法,因为其结构更适合进行层次分析,在其基础对其粒度层次进行分析,并尝试将该理论应用数据信息检索查询中,发现当力度层次映射到数据中,便可得到信息的层次结构图。结合用户检索时的兴趣点,通过添加或删除约束条件对检索的特征粒进行泛化或细化运算,从而引导用户找到满足兴趣点的信息,最后尝试构建基于粒度分层的信息检索模型,并探讨了该方法在协助用户获取满足兴趣点的信息时的特点。下一步的工作主要研究新的粒结构下信息粒的泛化和细分运算,并完成基于该理论的信息检索系统的具体设计与实现。
  参考文献:
  [1]Yao Y Y.Granular computing: Basic issue and possible solutions[C].Proceeding of the 5th Joint Conference on Information Sciences.2000:186-189.
  [2]Lin Yan,Qing Liu.Formalization for on Granular Computing Based on Logical Formaulas[J].Volume,2006(02):60-65.
  [3]刘清,刘群.粒及粒计算在逻辑推理中的应用[J].计算机研究与发展,2004(04):546-551.
  [4]曾毅,姚一豫,钟宁.基于粒结构的知识检索[J].计算机科学,2008(03).
  [5]徐久成,成万里,孙林.一种新的粒表示方法及其距离计算[J].计算机应用研究,2010(06):2035-2038.
  作者单位:解放军95007部队,广州 510410;95020部队,广州 510630
其他文献
摘 要:EtherCAT拥有杰出的通讯性能,接线非常简单,并对其它协议开放。EtherCAT拥有多种机制,支持主站到从站、从站到从站以及主站到主站之间的通讯。它实现了安全功能,采用技术可行且经济实用的方法,使以太网技术可以向下延伸至I/O级。EtherCAT功能优越,可以完全兼容以太网,可将因特网技术嵌入到简单设备中,并最大化地利用了以太网所提供的巨大带宽,是一种实时性能优越且成本低廉的网络技术 
期刊
摘 要:根据教学中存在的问题进行静态数码软件课程教学的有效教学实践研究,提出课程教学第一个关键点是要有专业针对性,要根据视觉设计专业重点运用的领域安排教学内容和组织课堂教学,所以提出针对性强、循序渐进和因材施教的渐层型课程模式;第二个关键点是要有教学效率和教学效果,所以提出能激发学生专业热情和培养学生专业能力的效能型课程模式。具体通过简化制作流程和细化制作任务来达到教学的高效性;培养学生专业能力,
期刊
摘 要:目前,绝大多数中职学校教师使用多媒体课件进行辅助教学,但不是所有多媒体课件都能达到预期效果。对于多媒体课件在课堂教学中出现的问题及误区,本文以赤峰农牧学校为研究对象,采用问卷调查法对多媒体课件的呈现方式、应用效果、使用情况等方面进行了调查研究,发现其中的问题,并针对这些问题提出了较为科学的对策和建议。  关键词:多媒体课件;现状调查;对策研究  中图分类号:G642.4  计算机被引入教学
期刊
摘 要:随着我国科学技术的飞速发展,人们在信息技术领域取得了很大的成就,这也就进一步促进了我国对于计算机人才的培养步伐。整体上来讲,计算机教育着重培养具有计算机应用能力的人才,并且将这个培养方向更进一步深化。当然,计算机教育中科学思维能力的培养也是十分重要的,将计算机应用与科学思维的培养紧密结合是我们新时代赋予给我们的新的任务。所以,笔者根据多年的教学经验,从计算机应用与科学思维能力培养方面,浅谈
期刊
摘 要:本文主要介绍组成技术、应用范围。可以实现调频收音机功能,同时能够实时了解佩戴人的具体位置信息,让人们在收听广播的同时,能够自动及时发送准确定位信息,使其家人能及时找到他们。  关键词:定位;收音;单片机;GSM;GPRS  中图分类号:TN851  在现代社会中,中国人口逐渐步入老龄化,孩子的课余生活丰富多彩。随着人们的生活水平不断提高,生活中的数字化和智能化也越来越受到人们的关注。许多老
期刊
摘 要:在数据化战略的支持下,淘宝网在庞大的数据平台上构建起了一个具有针对性的数据仓库,为能够有条不紊的运营提供了条件,亦成了淘宝网在市场竞争中的重要工具之一。为了使数据化策略能够为更多企业的发展提供帮助,本文以淘宝网为例,对数据平台以及数据仓库的开发和设计进行了详细讨论,希望能够为现代企业运营和管理中数据化战略的实施提供有益参考。  关键词:淘宝网;数据仓库;数据平台  Discussing o
期刊
摘 要:根据目前特检行业信息建设的需求提出了单点登陆解决方案,将原有的办公自动化系统、检验业务系统、内部管理平台等多个信息化系统集成到单点登录系统,用户只需一次登陆即可访问各个授权系统。根据系统的物理结构,详述了系统的体系设计,最后给出了基于web services单点登录解决方案。  关键词:特检行业;单点登录;web 服务;安全断言标记语言;轻量级目录服务协议  中图分类号:TP311.52 
期刊
摘 要:本文对室内可见光通信的分数间隔均衡技术进行研究,研究表明,均衡技术对室内可见光通信中“多径效应”对通信质量的干扰有较好的抑制效果。  关键词:室内可见光;码间干扰;均方误差准则;分数间隔;均衡技术  中图分类号:TN929.1  室内可见光通信作为一种新兴的宽带无线接入技术,当前正处于科研攻关阶段。室内可见光通信是在白光LED照明技术的基础上发展而来的,通常使用于LED照明过程中的数据传输
期刊
摘 要:在网络web2.0时代,以网页设计课程为载体,运用教育技术学不同的研究方法,持科学技术观,对微课的相关理论和应用实践进行研究。探索网页设计课程中的微课程设计模式策略,结合网页设计课程探讨微课设计技巧与构建思想,并从制作微课视频的实践经验中出发,设计制作一节微课。  关键词:微课程设计;网页设计;教学效果  中图分类号:TP3-4  随着网络与通信技术的迅速发展,人们在步入web2.0时代、
期刊
摘 要:进入新世纪以来,伴随着互联网的迅猛发展,网上购物开始逐渐风靡起来,商家也逐渐开始建设基于网络的电子购物商店,这将是一种全新的购物方式。网上购物是一种具有相互交换属性的新型商业购物方式,可以使买家与商家便捷的交互有关信息,完成最终的网上交易。本文重点介绍了使用Jsp技术构建电子购物商店的体系优势,对网上购物系统需求做一些细致的分析、探讨和阐述。  关键词:网上购物;Jsp技术;系统构建  中
期刊