【摘 要】
:
海量电子文献数据库中的文献往往是百万以上数量级的,对其全部进行比较需要很长的时间。查重算法的设计是 依据大数定律确定出抽样比例,再在抽样理论的基础上对文献数据按比
论文部分内容阅读
海量电子文献数据库中的文献往往是百万以上数量级的,对其全部进行比较需要很长的时间。查重算法的设计是 依据大数定律确定出抽样比例,再在抽样理论的基础上对文献数据按比例进行抽样,然后对抽样样本进行查重比较,得到重 复文献所占的比例。在对样本进行查重比较时,综合分析了目前主要的几种比较算法,并结合数据库进行比较查询,从而得 到一种比较速度和效率都比较高的算法。并通过对海量数据处理方法进行研究,结合图书馆采购人员购买电子文献数据库时 的实际需求,开发出实用性强的海量文献数据库查重系统。
其他文献
目的:观察柴陷丹参汤辅治不稳定型心绞痛的疗效。方法:94例随机分为观察组和对照组各47例,两组均给予常规西医治疗,观察组加用柴陷丹参汤治疗。结果:总有效率观察组高于对照组(P
夜色笼罩下的慕尼黑,灯光绰约,教堂的尖顶映衬在深蓝色的夜幕中,街上穿行着步履匆匆的各色行人,冷湿的空气里飘来阵阵啤酒花的芬芳。我们在导游的引领下,顺着人流,径直穿过市政广场的拱门,走进了慕尼黑著名的HB啤酒馆。 推门进去,啤酒馆内暖烘烘的,人气很旺。那宽厚的墙体和无梁柱的圆拱,构成了一个可容300多人的连贯式厅室,室内人头攒动,一排排长条原木桌椅已是座无虚席。厅室前方陈放着两个装饰性的橡木大酒
近年来手指静脉识别成为一种有前途的身份验证技术.采集图像时,手指的姿势或光照的变化会严重影响算法的性能.多生物特征识别可以在一定程度上克服这些限制,提高识别性能.相比其他的生物特征融合,手指静脉和手指轮廓融合的优点是采集图像比较方便,只需要手指静脉采集设备即可获得这两种生物特征的图像.基于此,提出了一种基于手指静脉和手指轮廓的个性化加权融合识别方法.首先根据原始得分对样本进行分类,然后依据分类结果
客观而言,代表履职不力现象的确不同程度存在。诸如"后排"代表、"挂名代表"、"溜号"代表、"卖票"代表并不鲜见。在很多时候.选民很可能不得不面对这样一个事实,即自己委以信
主动规则已经应用于主动数据库、XML文档和语义网络等领域,主动规则集的汇流性维护了数据库的数据一致性、保证了数据质量,但现有方法不能有效地判定主动规则集的汇流性.现有
上个世纪70年代初,我在塔克拉玛干南部沙漠边缘一个小村庄接受贫下中农再教育,由于生产供给的粮食填不饱肚子,我经常感到胃被吊在了胸口。每到开饭时,我就开始“侦察”谁家的烟囱
基于数据流的程序分析算法能够有效识别程序的数据处理流程,但是对于采用数据加密技术进行通信的网络程序,数据流分析由于无法准确识别、提取解密数据而失效.针对如何提取解密数
本文介绍了沥青路面常见的病害种类及特征,然后分析了病害的成因,并总结了沥青路面病害检测重点,最后提 出了沥青路面病害预防及养护措施,以供同行参考。