Diversification on big data in query processing

来源 :计算机科学前沿 | 被引量 : 0次 | 上传用户:liuhu986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Recently,in the area of big data,some popular applications such as web search engines and recommendation systems,face the problem to diversify results during query processing.In this sense,it is both significant and essential to propose methods to deal with big data in order to increase the diversity of the result set.In this paper,we firstly define the diversity of a set and the ability of an element to improve the overall diversity.Based on these definitions,we propose a diversification framework which has good performance in terms of effectiveness and efficiency.Also,this framework has theoretical guarantee on probability of success.Secondly,we design implementation algorithms based on this framework for both numerical and string data.Thirdly,for numerical and string data respectively,we carry out extensive experiments on real data to verify the performance of our proposed framework,and also perform scalability experiments on synthetic data.
其他文献
位于贵港龙山的金矿田,由于受到近SN向断裂构造的控制,其成矿物质多源于深部,该矿区是一个中低温热液型的金矿床,将平天山的岩体作为中心,深部含矿热液于燕山晚期时,岩浆岩在
With the advent of 5G,multi-homing will be an increasingly common scenario,which is expected to increase transmission rates,improve transmission reliability,and
脑血流中的血红蛋白有两种:氧合血红蛋白(HbO2)和还原血红蛋白(HbR).这两种血红蛋白在脑血流中浓度的变化可以反应脑部神经活动,提取其浓度变化信号可以为如癫痫病灶定位、抑
柳州市党史机构成立于1982年2月。10多年来,市委按照中央书记处、中央党史工作领导小组、中央党史研究室和自治区党委、自治区党史研究室的部署和要求,紧紧围绕党的中心任务抓
人民生活水平的提高,对生活品质提出了更新的要求.近年来频频发生的食品安全问题时刻在威胁着人民的身体健康,甚至危及生命安全,不利于经济社会和谐稳定发展.因此,做好食品质
今年跨年最火的套餐:二两猪肉大葱馅包子、一碗炒肝、一份芥菜,一共21元。习近平到庆丰包子铺就餐,有外媒说,展示了中国领导人的亲民。我们说,这是再正常不过的事情。中国共
对于企业来讲,资金是企业存活和发展的基础,所以资金预算管理也是企业经营工作中的重中之重.资金的预算管理出现问题后,会导致企业资金链断裂,不仅对企业品牌形象带来不利影
自2010年开始,我国整个服装行业出现了断崖式逆转:行业库存急剧增加,各个企业无不为库存问题绞尽脑汁而无根本应对之策;服装企业外部生存环境迅速恶化,租售比迅速攀升;消费者
两年前,中国几乎所有的证券交易大厅、写字楼、政府机关的电脑上都闪着红红的股市行情。人们的脸上洋溢着灿烂的笑容。今天,同样在这些地方,同样是这些人,脸上却流露出忧郁和
Recently,stacked hourglass network has shown outstanding performance in human pose estimation.However,repeated bottom-up and top-down stride convolution operati