【摘 要】
:
对比序列模式能够表达序列数据集合间的差异,在商品推荐、用户行为分析和电力供应预测等领域有广泛的应用.已有的对比序列模式挖掘算法需要用户设定正例支持度阈值和负例支持
【机 构】
:
四川大学计算机学院,国家电网智能电网研究院,四川大学华西公共卫生学院,南京邮电大学先进技术研究院
【基金项目】
:
国家自然科学基金(61103042);中国博士后科学基金(2014M552371);软件工程国家重点实验室开放研究基金(SKLSE2012-09-32)
论文部分内容阅读
对比序列模式能够表达序列数据集合间的差异,在商品推荐、用户行为分析和电力供应预测等领域有广泛的应用.已有的对比序列模式挖掘算法需要用户设定正例支持度阈值和负例支持度阈值.在不具备足够先验知识的情况下,用户难以设定恰当的支持度阈值,从而可能错失一些对比显著的模式.为此,提出了带间隔约束的top-k对比序列模式挖掘算法k DSP-Miner(top-k distinguishing sequential patterns with gap constraint miner).k DSP-Miner中用户只需设置期望发现的对比最显著的模式个数,从而避免了直接设置对比支持度阈值.相应地,挖掘算法更容易使用,并且结果更易于解释.同时,为了提高算法执行效率,设计了若干剪枝策略和启发策略.进一步设计了k DSP-Miner的多线程版本,以提高其对高维序列元素情况的处理能力.通过在真实世界数据集上的详实实验,验证了算法的有效性和执行效率.
其他文献
<正>6月1日,广东省戏剧家协会主席、广州市文联专职副主席、著名粤剧表演艺术家倪惠英主讲的"南国艺术奇葩——多彩的粤剧"在广州图书馆报告厅开坛,吸引了众多来自省港澳各地
蒙台梭利是意大利第一位女医学博士、著名的教育家,她毕生致力于探索幼儿教育,创建了科学的教育理论和方法。她的健身思想包括根据儿童在各感觉的“敏感期”对其进行教育、强
皂苷类化合物是一大类具有多种生理功能的生物活性物质,包括抗炎、抗肿瘤、抗动脉粥样硬化、免疫调节等方面的药理作用,皂苷类的初提物通常存在有效成分含量低、杂质多、质量
文章采用经济学原理中的需求/供给观点,阐述了市场的需求方对经济学全英浸入式教学(ELIPIE)的迫切需要及学术界的相关理论支持;描述了市场的供给方对开展ELIPIE所需的硬件与
近年来,我国水果罐头产品出口增长趋势较好,出口总量和出口总额都有所提升,丰富的产品也扩展了其他国外市场。我国水果罐头业在拥有世界需求趋旺、政府出台出口退税政策等良
网络教育是党员干部教育的第三代形式。积极掌握和运用现代传播手段做好党员干部教育工作,是时代发展的要求。本文着重探讨了如何在互联网上做好党员干部教育的问题。
我国社会经济发展的非常迅速,电力行业也在不断的改革和持续的推进。不过现阶段电力企业在经营管理过程当中存在着非常复杂的问题,出现了越来越大的运营风险,所以这个企业需
翻译生态学是翻译学和生态学相互渗透的结果,它从分析各种翻译生态环境及其因子对翻译的影响入手,进一步剖析翻译的生态结构。本文试图在生态翻译学的关照下,从译者角度考察
教育数据挖掘(educational data mining,简称EDM)技术运用教育学、计算机科学、心理学和统计学等多个学科的理论和技术来解决教育研究与教学实践中的问题.在大数据时代背景下