论文部分内容阅读
近些年来,随着“互联网+”,“工业4.0”等概念提出,互联网技术和规模得到了巨大的提升,海量信息出现在人们的视野中。信息爆炸的时代使得人们接受多方面信息的同时,难以获取自己所需的信息。针对这种情况,传统的搜索引擎技术可以帮助人们筛选并过滤掉无关信息,但某些关键词仍未满足用户某些需求,因而搜索结果会让人失望。针对此问题,个性化推荐方法应运而生,并在电子商务领域,如京东、阿里、头条新闻等得到广泛的应用。而在制造业、服务业领域推荐技术应用较少,目前制造业主要集中于家装方案,社会驱动的学习方案,众包配送的服务推荐方案方面的应用,但是其采用的技术为服务匹配推荐技术。而成熟的协同过滤技术并未在这些领域得到真正的应用,如果制造服务型企业采用强大的推荐技术,可以帮助挖掘新用户,留住老客户,从而提高企业收益。协同过滤技术是当下应用最为成熟的技术之一,其核心为协同过滤算法,主要根据用户对产品或服务的评分值,采用相似度算法筛选最近邻居集,从中选取相似度高的邻居用户已有高评分,且目标用户未评分的产品或服务给予推荐。传统协同过滤算法在执行过程中,常常伴随着数据稀疏性和冷启动问题,以及未考虑用户特征标签,用户评分数据量大等问题对推荐结果和效率的影响。针对这些问题,本文通过采用相似度计算以及预测公式,计算用户相似度并预测空缺数据,减轻数据稀疏性;基于用户兴趣特征计算并获取新用户的近邻集,给予合适方案推荐,解决用户冷启动问题;基于海量的用户数据难以给出合理的推荐,提出采用多粒度粗糙集的属性约简方法,对数据进行精简,解决数据冗余问题。现将本文的研究方法具体介绍如下。(1)针对海量数据存在的数据冗余性问题,以及考虑采用传统粗糙集属性约简的方法未能进行精确约简,提出基于多粒度粗糙集的约简方法,对数据进行删减,既能减少数据维度又能降低数据查询时间。(2)针对用户未评分而导致的数据稀疏性问题,提出采用皮尔森相似度、云相似度以及前两者的综合相似度度量,分别计算方案评分相关度,预测空缺数据。通过计算三种相似度,得出预测的结果与验证集的平均绝对误差值,选出误差值最低的相似度方法来预测和填充本文稀疏的方案评分数据。(3)考虑到用户兴趣偏好各异以及主观性等问题,提出采用模糊聚类算法对用户特征相似性进行聚类,形成用户簇,选择用户簇的中心作为代表用户,计算新用户与用户的兴趣相似度,向新用户推荐兴趣相似用户对应方案,不仅解决冷启动问题,而且提高方案推荐效率。案例部分,以某企业汽车方案推荐为例,根据用户特征等评分数据集,采用本文提出的推荐方法进行例证,并与其它推荐算法对比,发现本文方法在预测填充数据时,选取方法得到的预测结果更精确。而且推荐过程中随着方案数量的增加,推荐结果更加精确。基于同等数量的数据集,采用不同的推荐方法给出推荐结果过程中,发现本文算法执行时间也比其他算法优化很多,突出本文方法在推荐精度和效率方面有了显著的提升。此外,本文采用的推荐技术既可以帮助企业发掘潜在用户,将其转换为实际用户,又能够提高用户查询信息的效率以及用户留存率,还能帮助企业精准目标用户,提高企业效益。