基于机器学习的社区内容分类方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:chjj1988mm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的发展,人们越来越愿意在网上发表言论和分享生活,智能手机的广泛普及使得人们在社区或者论坛发帖越来越便利。然而帖子数量的剧增,不仅造成了网站管理的困难,也增加了用户获取资源的难度。因此,如何对以帖子为载体的社区内容进行分类,成为了社区系统一个必不可少的功能。针对社区内容的特点,构建了一个组合分类模型,该模型由以下几个部分组成:首先,针对作为社区内容的帖子存在口语化、特征少的问题,提出以词向量为基础,利用词语词性获得加权词向量的方法丰富帖子的特征,优化组合模型的输入;其次,针对支持向量机单一核函数无法完全匹配所有数据分布的问题,利用混合核函数对支持向量机进行改进,提高该模型的分类能力;最后,为了充分利用卷积神经网络模型强大的特征提取能力和支持向量机的分类能力,以卷积神经网络模型为基础,将softmax层替换成支持向量机分类器完成分类任务。在实验部分,采用从真实社区网站上爬取的帖子作为数据集,对所设计的模型进行评估。实验结果表明,利用组合模型得到的分类准确率要比单一使用卷积神经网络模型高出1%左右,并且分类结果更加稳定,证明了组合模型的正确性和可行性。
其他文献
学位
序列推荐是推荐系统领域近几年来新兴起的一个研究热点,与传统的推荐系统利用用户的长期兴趣偏好进行推荐不同,序列推荐考虑到用户的兴趣会随着时间的变化而发生改变,依靠用户与项目交互而产生的序列信息动态地构建用户的兴趣偏好,可以更为精确的完成对用户的推荐任务。目前,提取用户行为序列信息的方法有很多种,最为新颖的一种是在时间和潜在空间中将用户的行为序列信息嵌入进一幅“图像”中,利用卷积神经网络中的卷积滤波器
学位
随着互联网时代的到来,每天有数以亿计的信息在网络上更新,当用户需求不明确时,如何在纷繁复杂的信息中快速找到用户所需内容成为了挑战。推荐系统不仅可以向用户推荐曾经购买过的其他类似物品,还可以通过推荐物品附件来增加用户购买量,捆绑推荐相比于传统推荐更加符合用户的消费习惯及购买偏好。在捆绑推荐基础上针对捆绑包中各个物品的序列关系,综合考虑静态捆绑包及动态捆绑包,提出序列化的捆绑推荐模型。不仅考虑捆绑包间
学位
随着互联网时代的到来,互联网技术被广泛应用于各个行业、各个领域,其中也包括教育领域。高校针对学生(主要为应届生)提供的就业服务的发展也是日益完善。基于互联网的高校就业服务指导工作创新凸显了互联网时代“互联网+就业服务指导”的创新有效性,为高校在该领域健康有效发展创造了契机,也凸显了互联网的诸多技术优势。本课题针对高校就业指导中心、应届毕业生和企业的实际需要,设计并开发了高校就业服务系统。本课题根据
学位
近年来,随着科技的进步和发展,人类生活的计算和存储需求在不断增加,集群技术的应用也越来越广泛。然而,随着集群规模的扩大,集群管理问题也日益凸显。由于集群中节点的异构性,物理分散性和节点数目的不确定性等问题,目前的集群管理系统在通信复杂度,数据的一致性以及跨平台的可视化上还存在很大的弊端。针对现有集群管理系统的弊端,论文提出了一种基于ZooKeeper的集群管理方案,并使用图形界面程序Qt进行可视化
近些年来,由摩尔定律推动的中央处理器体系结构改进,使得处理器性能以及多核技术取得了高速发展。ARM处理器是典型的多核体系结构,单个芯片可包含几十内核。然而,多核技术加剧了系统中存储器带宽的争用,导致访存密集型应用程序性能下降。内存系统与处理器之间的性能鸿沟越来越大,访存时延成为制约系统性能提升的主要瓶颈之一。为了满足现代多核处理器对数据访问带宽和时延的需求,新兴的异构存储系统已成为继续扩展存储性能
窗口吸波体天线罩技术可以使机载天线在工作频段内正常通信,在带外威胁频段实现吸波,有效降低天线的双站RCS。而吸波/透波中如何实现陡截止性能是高选择性窗口吸波体的关键问题。因此,本文主要对高选择性窗口吸波体的设计方法进行了研究。首先从二端口网络理论出发分析得到窗口吸波体的快速设计方法,将指标分放到每一功能层上,通过单独设计每一层的性能来达到快速设计窗口吸波体的目的。根据传输线理论分析、建立了传输极点