基于粗糙集理论的遗失值填充算法的研究

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:hlg1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种先利用属性约简简化信息系统,然后在此信息系统上填充遗失值的算法.该算法定义了不完备信息系统的一个覆盖,并在此覆盖的基础上进行约简,进而对信息系统进行填充得到规则。此算法克服了填充后再约简的缺点,但它只是用覆盖中的值来替代遗失值,准确性有待进一步提高.此时的约简是一种不彻底的约简,在复杂的信息系统中,可能第一次约简的结果不是最简的约简形式,填充后仍需再进行一次约简,以得到最简的约简形式。
其他文献
本文针对滑动窗口聚集查询问题,提出了一种基于滑动窗口语义的聚集计算方法--链树(linked-tree)算法,该算法把滑动窗口逻辑分层,记录层次内数据统计信息,具有很高的执行速度;同时,所需的内存量不与窗口大小直接相关,可以大大节省内存;此外,基于该算法的查询共享策略,可使类似的聚集操作共享相同的链树结构,进一步提高了查询处理速度并节省内存资源。
在空间查询优化中,确定空间操作在查询计划中的顺序位置是核心的间题。针对含有多个空间操作以及非空间操作的混合空间查询,本文提出了混合查询的优化策略。该策略对空间操作的过滤和精练步骤在优化阶段就进行逻辑分离,并分别进行空间过滤和精炼操作代价分析,将启发式规则和动态编程相结合来选择更为合理的空间查询执行计划.这样不仅解决了利用空间索引和降低空间操作计算代价之间的矛盾,还使用了基于代价的分析方法为混合查询
本文给出DTD文档的两种对象化模型,这两种对象化模型的主要创新特点包括:引人逻辑节点来表示元素之间的逻辑关系;把属性作为子元素加人到对象化模型中,使属性不必进行特殊处理;元素或属性的元数据单独建模,与元素节点或属性节点分开,使元素或属性的元数据能够反复使用。
随着企业业务的发展与信息的膨胀,数据仓库的规模不断扩张,数据访问呈现更广的地域分布性,提高数据仓库在Web环境下的数据访问性能是本文所讨论的内容。通过DW-DS结构来构建Web数据仓库,能够更好地发挥数据仓库对企业的信息支持能力.
利用关系数据库来存储和管理RDF数据是一种有效的方法.本文在分析总结了RDF模式和ER模型联系的基础上,提出了一种基于RDF模式的RDF数据存储方法.本文在第3节给出了该方法的具体实现步骤,在第4节通过一个实验具体分析讨论了该方法的可行性和优点.
当前XML流查询处理中还存在许多待解决的间题:如XPath查询的优化,流数据的动态验证,复杂XPath的支持,如何连接多个文档的查询而得到最终的结果。如何降低处理器的时空复杂度等。 本文综述了当前国际上对这类问题的研究成果,总结它们存在的不足,指明进一步的研究方向。
本文提出了一种基于概率模型的预测性区域查询和支持该查询处理的索引结构TPMR-Tree,查询结果中不仅包含满足查询的移动对象,还包含它们满足查询的概率,为了评价查询结果的质量,提出了两个标准:准确性和效率,同时,还提出了估计查询结果质量的概率模型。
Web服务是一种新型的可以通过Web来调用的软件组件.根据业务流程组合不同的Web服务可以实现复杂的业务流程,促进不同类型应用的集成,支持企业内部和企业之间的相互协作.本文研究的目的是在Web服务系统中增加质量管理的功能,从而在服务执行时根据用户的质量要求实现质量驱动的组合Web服务选择.为此,首先提出了一个支持组合Web服务的系统结构,它扩展了基本的Web服务架构,增加了对组合服务的组织和管理功
本文通过扩展传统的关联规则模型,为每一数据项赋给不同的最小支持度,成功地解决了用单一的最小支持度挖掘关联规则不能完全反应在数据库中不同的数据项出现的颇度与性质的问题.基于该模型,本文提出了一种快速的基于FP-Tree支持多重最小支持度的关联规则发现算法,将其应用在了农业专家系统开发平台中,对已有的农业数据库中对其进行了应用。实践表明.本文提出的算法是灵活的和高效的,它能发现稀少数据项蕴涵的规则的同
本文提出了一种基于单词相关度的聚类方法WCM(Document Clustering Method Based onWord Relation)。总体的思想首先充分利用单词之间的相关度分类夹确定词的分类,然后计算每个文档向量和各个类之间的距离将其归入一个或者多个类别中。该算法在“网上科研服务原型系统”项目中加以实现。在该系统中本文实现了一个基于SDARTS协议的元搜索器,搜索器退回的结果使用WCM