【摘 要】
:
传统的评论选择算法都是基于商品评论的有用性以及评论中所包含的信息量,这就导致所选择出来的评论集冗余度和重复率较高。所以,基于用户的兴趣偏好从海量的商品评论集中选择
论文部分内容阅读
传统的评论选择算法都是基于商品评论的有用性以及评论中所包含的信息量,这就导致所选择出来的评论集冗余度和重复率较高。所以,基于用户的兴趣偏好从海量的商品评论集中选择出与用户偏好最为相符的评论出来,才能真正满足用户所需。为了解决这一问题,本论文完成了以下的工作:1.将经典的TF-IDF特征提取算法与Skip-gram模型以及Canopy聚类算法进行组合,构建成为混合多模型。该模型解决了基于文本内容挖掘出用户偏好,以及用户对商品属性的评价。2.改进传统的基于观点多样化评论选择算法,改进后的评论选择算法,能够选择出最佳的满足用户偏好需求的评论文本集合,从而实现个性化的网络商品评论选择。3.设计模型和算法的评估函数,对相关的模型和算法进行性能评估。对相关的模型,我们使用均方根误差值进行模型性能评估。对评论选择算法,我们基于准确率和效率这两个测度进行算法的性能评估与分析。4.将构建的相关模型以及改进的评论选择算法进行实际应用,基于结果对相关模型和算法的性能进行评估和总结。
其他文献
<正>9月11日,金华市供电公司工作人员对雅畈镇雅畈村村民光伏屋顶进行验收。顺利通过验收后并网试运行,该光伏屋顶成为浙江中部地区最大一个并网发电的家庭分布式光伏发电站
<正>糖尿病肾病,是糖尿病的慢性并发症,也是危害最大的微血管病变之一。其主要病理改变为弥漫性和结节性肾小球硬化,临床上以蛋白尿、水肿、高血压等为主要表现,严重时可以出
<正>子宫腺肌病是妇科常见疾病,特点为子宫内膜及腺体侵入子宫肌层,临床上主要表现为渐进性痛经、月经量、子宫增大等症状。中医认为,本病属癥瘕,以瘀血阻滞胞宫,胞脉以致"不
近几年,随着我国社会主义现代化建设的不断快速发展、深入,促使我国整体经济建设迅猛提升,从而推动了我国水利工程工作的进步发展。社会整体不断快速发展,提升人们生活质量水
分析了企业信息化环境下人-信息系统交互效率的重要性,提出将工作记忆、认知技巧、计算机自我效能感作为度量人的信息加工能力的3个维度,用实验的方法研究人的信息加工能力对
近年来,随着经济社会的发展和进步,社会对会计工作的需求不断增大,并且所提出来的要求质量也是不断提高。在企业的生产经营中,会计是一个重要的组成部分,会计信息质量抓的好,
随着各种云服务的部署增加,今天的数据中心网络变得越来越大。随着网络规模的不断扩大,细粒度网络监控成为了网络可靠性和闭环流量控制的先决条件。然而,由于控制平面和数据平面之间的连续交互以及有限的CPU能力,这种监视机制是粗粒度的,并且导致在具有高密度数据中心网络的现代网络中无法很好地随剧烈变化的通信动态扩展。为了增加可扩展性,P4语言联盟(P4.org)提出了带内网络遥测(INT)机制,其提供实时数据
背景:许多研究表明,血尿酸与高血压存在一定的相关性,是高血压的危险因素,然而血尿酸导致高血压的发病机制尚不完全清楚,以往研究在探讨血尿酸与高血压的相关性时未对混杂因素进行足够地控制。本文旨在探讨血尿酸与高血压之间的相关性,不同血尿酸水平与高血压患病率的关系。方法:本研究为回顾性病例对照研究。我们抽取了在北京医院心内科住院的1541例高血压患者。经过排除,最终共有365例高血压患者纳入本研究,匹配同
目的研究腰椎间盘突出症CT影像学改变与中医证型间的相关性。方法选取175例腰椎间盘突出症患者,中医辨证分为血瘀证、寒湿证、湿热证和肝肾亏虚证,进行腰椎CT扫描,将检查结果
延边州位于吉林省东部,十分重视对生态环境的保护和建设,森林覆盖率达到82.1%。本文根据延边州生态环境建设现状,分析了存在的主要问题,并提出了推进森林经营的可持续发展;转