基于改进协同过滤的方案推荐方法研究

来源 :上海理工大学 | 被引量 : 0次 | 上传用户:njpolice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着“互联网+”,“工业4.0”等概念提出,互联网技术和规模得到了巨大的提升,海量信息出现在人们的视野中。信息爆炸的时代使得人们接受多方面信息的同时,难以获取自己所需的信息。针对这种情况,传统的搜索引擎技术可以帮助人们筛选并过滤掉无关信息,但某些关键词仍未满足用户某些需求,因而搜索结果会让人失望。针对此问题,个性化推荐方法应运而生,并在电子商务领域,如京东、阿里、头条新闻等得到广泛的应用。而在制造业、服务业领域推荐技术应用较少,目前制造业主要集中于家装方案,社会驱动的学习方案,众包配送的服务推荐方案方面的应用,但是其采用的技术为服务匹配推荐技术。而成熟的协同过滤技术并未在这些领域得到真正的应用,如果制造服务型企业采用强大的推荐技术,可以帮助挖掘新用户,留住老客户,从而提高企业收益。协同过滤技术是当下应用最为成熟的技术之一,其核心为协同过滤算法,主要根据用户对产品或服务的评分值,采用相似度算法筛选最近邻居集,从中选取相似度高的邻居用户已有高评分,且目标用户未评分的产品或服务给予推荐。传统协同过滤算法在执行过程中,常常伴随着数据稀疏性和冷启动问题,以及未考虑用户特征标签,用户评分数据量大等问题对推荐结果和效率的影响。针对这些问题,本文通过采用相似度计算以及预测公式,计算用户相似度并预测空缺数据,减轻数据稀疏性;基于用户兴趣特征计算并获取新用户的近邻集,给予合适方案推荐,解决用户冷启动问题;基于海量的用户数据难以给出合理的推荐,提出采用多粒度粗糙集的属性约简方法,对数据进行精简,解决数据冗余问题。现将本文的研究方法具体介绍如下。(1)针对海量数据存在的数据冗余性问题,以及考虑采用传统粗糙集属性约简的方法未能进行精确约简,提出基于多粒度粗糙集的约简方法,对数据进行删减,既能减少数据维度又能降低数据查询时间。(2)针对用户未评分而导致的数据稀疏性问题,提出采用皮尔森相似度、云相似度以及前两者的综合相似度度量,分别计算方案评分相关度,预测空缺数据。通过计算三种相似度,得出预测的结果与验证集的平均绝对误差值,选出误差值最低的相似度方法来预测和填充本文稀疏的方案评分数据。(3)考虑到用户兴趣偏好各异以及主观性等问题,提出采用模糊聚类算法对用户特征相似性进行聚类,形成用户簇,选择用户簇的中心作为代表用户,计算新用户与用户的兴趣相似度,向新用户推荐兴趣相似用户对应方案,不仅解决冷启动问题,而且提高方案推荐效率。案例部分,以某企业汽车方案推荐为例,根据用户特征等评分数据集,采用本文提出的推荐方法进行例证,并与其它推荐算法对比,发现本文方法在预测填充数据时,选取方法得到的预测结果更精确。而且推荐过程中随着方案数量的增加,推荐结果更加精确。基于同等数量的数据集,采用不同的推荐方法给出推荐结果过程中,发现本文算法执行时间也比其他算法优化很多,突出本文方法在推荐精度和效率方面有了显著的提升。此外,本文采用的推荐技术既可以帮助企业发掘潜在用户,将其转换为实际用户,又能够提高用户查询信息的效率以及用户留存率,还能帮助企业精准目标用户,提高企业效益。
其他文献
<正> 遗尿病的定义是在应当能够控制排尿的年龄不能正常排尿。在儿童年龄组中发现4岁至6岁以上较常见,男孩多见于女孩,其夜间白昼不自主地排尿。因儿童没有完全掌握排尿的技
钢琴学科相较于其他学科而言,对学生的主观思维能力有更多的要求。传统的老师讲、学生听的教学模式已经不能激起学生的学习兴趣,也违背了钢琴学科的艺术性要求。为此,本文详
为探究研究生群体运动类APP的使用对其体育锻炼行为意向的影响,运用文献资料法、问卷调查法、数理统计法,分析了研究生运动类APP的使用的基本情况,并通过相关分析和回归分析
<正>1、基本资料:在本组48例患者中,门诊37例,住院11例,女31例,男17例。病程最长者13年,最短者27天,平均为一年零四个月,年龄最大者63岁,最小者17
用唯物辩证法的观点,探寻大学特色化与就业率之间的辩证关系,更好地推进大学科学发展,既有理论意义,也有现实意义。大学特色化与就业率之间既相互联系,又相对独立,这种辩证统一关系
副干酪乳杆菌是重要的益生菌,被人体摄食后可以在人体胃肠道内定殖发挥其益生作用。由于其显著的益生作用,副干酪乳杆菌可应用于发酵乳中促进人体健康。因此研究安全的、具有
<正> (一)选择适宜环境 种植区域的土壤及灌溉水有关检测指标应符合农业部关于无公害蔬菜的要求。种植区周围没有污染源。高海拔地区,夏季温度相对较低,气候凉爽,棉铃虫、蚜
木霉菌是一种重要的植物病害生防因子,尤其在防治植物病原真菌病害中一直受到极大的关注。木霉菌在植物病害生防中的机制是依靠其在包括趋向生长、识别、接触、缠绕与穿透等