论文部分内容阅读
随着Internet的迅速发展、网络信息量不断膨胀,导致用户面对大量的商品信息束手无策,商家也无法及时、准确得了解用户需求并为其推荐商品。在这种背景下,由于协同过滤推荐算法根据用户偏好进行及时的个性化推荐,并且不依赖于用户信息或者商品属性,成为了电子商务网站普遍采用的推荐技术。但随着数据量的爆炸式增长,传统的协同过滤推荐算法的计算量也大大增长,影响了计算效率。解决计算量过大问题的传统方法是引入聚类算法,但传统聚类算法中一条数据只能属于一个类,而现实中一条数据可能和多个类中的数据有不同方面的相似之处,因此传统聚类算法的硬聚类可能影响推荐准确度。于此同时由于在推荐过程中有隐私信息泄露的风险,有些用户不愿意透露隐私信息,这大大降低了推荐质量。针对以上情况,本文的主要工作内容如下:1.针对传统聚类算法的硬聚类问题,使用改进的模糊C均值聚类算法对用户进行聚类。通过引入IKA算法初始化聚类中心,使聚类中心均匀分布。最后根据模糊C均值聚类算法获得的隶属矩阵在目标用户所属类中寻找最近邻,缩小最近邻的计算范围。解决了传统聚类算法的硬聚类问题和局部最优问题。2.为了保护用户隐私信息的同时保证推荐质量,对推荐过程的隐私泄露问题进行深入分析后,在模糊C均值聚类过程的中心点和目标用户的k近邻处引入Laplace噪声。解决了推荐过程的安全性问题。3.为了提高推荐准确度,对推荐算法进行改进。引入基于项目类别的评分矩阵填充算法和基于用户兴趣的相似度改进算法。最后为了验证本文提出的新算法的有效性,将新算法与其他相关的典型算法相比较,通过分析和对比实验结果证明新算法的有效性。4.设计并实现带有差分隐私保护的模糊C均值聚类推荐算法的电影推荐系统,从需求分析、架构设计、数据库设计等方面进行详细地分析。最后利用Myeclipse开发平台和Mysql数据库完成电影推荐系统的实现。实验结果证明,本文提出的带有差分隐私保护的模糊C均值聚类推荐算法能够解决传统聚类中的硬聚类问题和局部最优问题,提高聚类效果;对评分矩阵进行预测填充,对用户相似度的计算进行改进,解决评分矩阵稀疏问题并提高推荐准确度;在模糊聚类和推荐过程中引入满足差分隐私的噪声,在保证推荐质量的同时解决安全性问题。综合分析各项评价指标,本文提出的新算法在保证推荐系统的安全性的同时有较高的推荐准确度。