【摘 要】
:
数据挖掘是指从大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程,它是一种有趣的知识获取的过程,同时也是解决“数据海量、知识匮乏”的有效途径。数据关
论文部分内容阅读
数据挖掘是指从大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程,它是一种有趣的知识获取的过程,同时也是解决“数据海量、知识匮乏”的有效途径。数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联分析可以找出数据库中隐藏的关联网。电子商务网站中每天数亿的成交量,其中隐藏的商品之间的关联对电子商务的买家具有重要的参考意义。与单层关联规则挖掘相比,多层关联规则能够提供更加丰富、更具普遍意义的知识,能够满足更多用户的需求,因此对多层关联规则挖掘进行研究具有较大的实用价值。互联网世界的不断发展,信息及其丰富,如何快速、准确的从海量的数据中获取满足用户需求的信息,个性化的信息服务应运而生。它为具有不同个性特征的用户提供针对性服务的内容。个性化服务推荐服务作为个性化服务核心技术,其推荐质量直接影响个性化信息服务的性能。个性化推荐已成为研究热点,在很多应用领域都有所应用,如Amazon、CDNOW、Netflix等大型的电子商务系统,都不同程度地使用了个性化推荐系统。而目前的推荐系统在预测精度、推荐质量等方面都有许多可能的改进的地方,例如如何更好的结合用户的兴趣,分析用户的行为。用户兴趣模型是实现个性化推荐的关键,也是本文研究的重点。本文从挖掘多层关联规则和建立用户兴趣模型两个方面入手,在电子商务网站的基础上对数据库和用户浏览行为进行分析和研究,取得主要成果如下:1、研究两种经典数据挖掘算法的优缺点,对3种多层关联挖掘算法研究的基础上提出了改进的基于FP Growth的多层关联挖掘算法,并给出了具体的算法思想和算法描述。2、将关联规则引入到用户兴趣模型中。依赖用户的浏览行为和关联规则,对用户兴趣模型更新。3、构建了个性化的推荐系统,将基于关联规则的用户兴趣模型用到个性化推荐系统中。
其他文献
用静态法研究了6-氨基青霉烷酸在弱碱性阴离子交换树脂IRA67上的吸附行为.在溶液pH为8.0,6-APA起始浓度介于3.00mg/ml~20.00mg/ml条件下,测定了25℃时IRA67树脂的静态交换动力
本论文从内容上分为两个彼此独立的部分:一,重度抑郁症患者静息态脑功能网络分析;二,大鼠脑磁共振解剖图像模板的制作。论文第一章为绪论部分,综合介绍本论文的的研究内容所涉
土壤无机碳在全球碳平衡中具有举足轻重的作用,介绍土壤无机碳循环过程的研究进展,回顾总结国内外岩溶作用与无机碳微生物转化过程研究结果,并结合西南岩溶碳研究的现状,提出
文章在采用相对高差和坡度将公路地貌划分为平原区和山区的基础上,将山区公路洪水灾害分为山区沿河公路水毁和山区公路边坡水毁;采用模糊综合评价法和专家调查法建立了危险性
2010年伊始实行的《城镇企业职工基本养老保险关系转移接续暂行办法》(以下简称为《暂行办法》)将养老保险关系转移提进议程,使其制度化,规范化。
单硝酸异山梨酯(Isosorbide 5-mononitrate,5-ISMN)为二硝酸异山梨酯的主要活性代谢物,与其它有机酸酯一样,其主要药理作用是松弛血管平滑肌,是治疗缺血性心脏病的硝酸酯类药物之
利用东部地区的1982—2001年归一化植被指数(NDVI)资料以及131个标准气象台站的气温、降水资料,用相关分析、奇异值分析(SVD)方法研究了该地区的植被与气温、降水的相互作用,
目的应用庆大霉素(GM)诱导的大鼠亚急性肾损伤模型,研究一组新的生物标志物肾损伤分子-1(kidneyinjury molecule-1,Kim-1)、丛生蛋白(clusterin)和胱抑素C(cystatinC)在尿液
汉语的极性程度动补结构是一个具有强大滋生力的结构,不仅谓语类型丰富,极性程度补语数量也在持续增加。通过搜集目前现代汉语中的极性程度补语,进行原词共性的分析,探索究竟
利用常规观测资料、气象卫星资料和NCEP 1°×1°再分析资料,对0806号台风"风神"登陆后的暴雨强度和落区进行诊断分析。结果表明:台风暴雨主要发生在台风登陆后48 h内,水汽通