基于聚类的OLAP查询日志挖掘及操作推荐

来源 :浙江大学 | 被引量 : 0次 | 上传用户:rockegg2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
联机分析处理(Online Analytical Processing, OLAP)支持分析人员和决策者从多个角度对数据进行交互访问,但随着数据仓库数据量加大,用户通过OLAP交互式数据浏览和分析变得复杂,不断尝试无效查询操作,降低了实现业务分析目标的效率。针对数据仓库数据量加大,用户通过OLAP交互式数据浏览和分析变得复杂的问题,本文提出了基于聚类的OLAP查询日志挖掘及操作推荐的方法。该方法由两部分组成:为解决查询稀疏性问题,离线挖掘部分对OLAP查询进行聚类形成类别序列集合,在类别序列集合上使用BIDE序列模式挖掘算法形成频繁序列模式集合,再通过前缀树建立算法建立类别序列前缀树;在线推荐部分,通过在前缀树中匹配当前用户查询的类别序列产生候选查询类别,最后将查询类别转化成查询推荐给用户。该方法采用开源的Mondrian OLAP服务器实现,为用户产生查询推荐,实验结果表明:使用合适的距离函数和聚类的类别数量,推荐的正确率可以提高。
其他文献
寄存器分配是编译器后端的一个重要环节。功能是将中间语言中的虚拟寄存器分配到特定目标机的物理寄存器中并进行替换。寄存器分配优化技术是编译器后端优化的重要技术之一,本
随着市场竞争的日益激烈,企业需要不断地加强自身的系统建设来应对挑战。面对业务需求不断变化、业务复杂度越来越高的问题,如何快速、高质量地开发出满足企业需求的信息系统软
随着Web技术的飞速发展以及网络环境的改变、传输内容的变化,当初的HTTP规范已经逐渐无法满足人们的需要,HTTP自身的一些不足(如:单路连接、只允许客户端主动发起请求、HTTP头冗
  轮廓是图像的基本特征之一,准确地提取出物体的轮廓为图像的后续处理提供了重要的信息。它是特征提取和识别的初始步骤,也是计算机视觉领域的一大研究热点,有着十分重要的实
随着感知技术和网络技术的发展,参与感知技术引起越来越多的注意力,因为它能提供一种非常有潜力的方法,使普通大众和专业用户收集、分析隐私数据,进而更好地理解世界。然而在现有
模糊系统是对确定性系统的推广。与确定性系统不同,模糊系统的输入和输出约束于某一模糊区间,令其状态和行为表现出一定的不确定性。对模糊系统不确定性的描述和分析,以及在
粮食是人类赖以生存的物质基础,做好粮食的安全存放工作至关重要。粮食在存放期间需要实时的对粮仓内各环境参数进行监测,并据此采取适当的措施进行处理。过去粮仓工作人员需
随着我国人口日益严重的老龄化,非接触式监护对于非危重病人特别是老年人的监护显得越来越重要。目前,欧美国家在医疗监护领域发展迅猛,特别是对非接触监护仪器的研究和开发
可视化技术将数据以图像、动画等直观方式呈现给用户,用户可查看属性的特点、相关性、数据的分布等,更好地理解数据中隐藏的信息,从而辅助决策。随着数据规模的增加,可视化技
心理学研究指出人的感情主要通过人的面部表情表达,因此,表情是人类情感交流的重要途径之一,表情识别研究对于实现拟人化的人机交互具有重要的理论和现实意义。目前的人脸表情识