【摘 要】
:
随着数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最
【机 构】
:
数据工程与知识工程教育部重点实验室(中国人民大学) 北京 100872
论文部分内容阅读
随着数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最重要的表,然后使用这些最重要的表来构成单层次的模式总结.在现实应用中,这些模式总结的主题并不明确.文中陈述了现有方法的不足,然后给出了一种为大规模数据库生成多层次模式抽象的方法.在此方法中,首先使用不同类型的社区社团检测算法来将数据库模式划分为"团",然后使用元聚类方法将这些"团"集成为数据库的主题组,每一个主题组代表数据库的一个主题.最后将这些主题组进行进一步的聚类以生成主题组类,并为每一个主题组类挑选标签以生成多层次的模式抽象.在Freebase——开源的大规模数据库上验证了文中算法的有效性.实验证明文中算法不仅能够精确地识别大规模数据库的主题,同时可以依据数据库的主题生成易于理解、能够帮助用户浏览和检索数据库的多层次模式抽象.
其他文献
ABT生根粉在板栗嫁接上的应用针对板栗育苗嫁接成活率低、接口较难愈合等问题,我们于1994年春在我校果树试验园板栗苗圃地内,将ABT生根粉2号应用于板栗育苗嫁接上,收到了良好的效果,现介绍如
复习国内文献中,多以确诊尘肺后出现块影时,是属尘肺融合或是合并结核或肿瘤的鉴别诊断报导较多。对于有粉尘接触史的结核患者,是否合并有尘肺的X线表现与病理对照分析方面
【摘 要】根据某电厂60MW燃煤锅炉调试经验,总结分析了燃用褐煤锅炉的一些特点及体会。 【关键词】褐煤;调试 1.概述 褐煤:灰分Ad(%)15-35,发热量Qnet.ar kcal/kg2700-3500,全硫St.d(%)<0.5,挥发分Vdaf(%)≤46(注:本参数给出的质量区间较大,只供参考,实际执行中可根据用户需求调整。其质量指标随井下采面条件而变化,存在一定的不确定性)。褐煤为
路线搜索已经广泛地应用于基于位置的服务和旅游路线推荐等领域.现有的关于路线搜索的研究,通常只考虑景点之间路线的流行程度与用户的需求,因此提供的推荐路线并未考虑景点
湖南镇大头埧高130公尺,是我国最高的大头埧。对它进行温度应力计算,对于其他的大头埧都有参考意义。大头埧由于周围气温的不断变化使得埧内各点的温度也不断变化。这种温度
如何快速高效检测出海量数据流中的突发事件是目前的研究热点之一.文中针对微博数据流,提出了一种新颖的基于情感符号的在线突发事件检测算法框架.伴随着事件的发生,文本流中
在农业生产环境中存在许多对人体有害的因素,这里我们谈的青贮饲料病(SFD)就是接触新鲜贮存的青饲料所释放的氮氧化物引起的急性肺部炎症。美国有许多大型的牛奶场,农场工人
从胚胎发育过程来说,睾丸原先位于腹腔内,自孕期26周开始移行。第一站是从腹腔内移行到腹股沟处,第二站自腹股沟移行到阴囊内。如果孩子出生后睾丸不在阴囊内,称为隐睾。睾
【摘 要】 VJ-12固封式真空断路器,具有开距小、体积小、结构简单、重量轻、寿命长、动作快、无噪音、维护量小,采用集成固封极柱结构,保护真空灭弧室和其它主回路零件免受碰撞、灰尘和凝露的影响,防燃、防爆和适用于频繁操作,环境条件较恶劣的场所。宁夏固海大型泵站改造中应用VJ-12型10kV真空断路器300多台,使用时间最长的已达4年,由于维护得当和开关本身的高性能,至今没有发生一起因真空断路器故障而
日常生活中常常听到这种说法:“这个孩子头大,将来一定很聪明。”一般人总认为头的大小与智力高低成正比。头颅是由23块形状不同的骨骼所组成。头颅的
This statement is o