【摘 要】
:
微博通过自身多年的发展,逐渐成为国内最大且具有代表性的社交媒体,每天都有大量用户通过微博浏览新闻信息,发表微博文本,进行社交互动等。但是,在微博被广泛应用的同时,也产
论文部分内容阅读
微博通过自身多年的发展,逐渐成为国内最大且具有代表性的社交媒体,每天都有大量用户通过微博浏览新闻信息,发表微博文本,进行社交互动等。但是,在微博被广泛应用的同时,也产生了相应的问题:海量信息造成的数据冗余与用户实际的数据需求间产生的矛盾,既造成了用户接收无意义信息的负担,也增加了信息传播的成本。对微博用户建模进行研究,不仅有利于各类商业信息的精准投放,同时对社会舆情监控,民生反映等方面都有着十分重要的作用。本文主要针对微博用户建模任务中特征提取不完善,性别分类和兴趣识别准确率不高等问题进行研究,主要的工作内容如下:1.针对中文微博性别分类工作中特征提取有待完善,性别分类准确率有待提高的问题,提出了一种新的基于融合策略的微博用户性别分类模型。该模型首先利用微博用户的微博文本特征构建分类器并得到分类结果;然后利用卷积神经网络模型对用户的性别进行分类;最后采用XGBoost模型将两个分类模型进行融合,得到最终分类结果。实验结果表明,该方法相比一系列对比方法有更好的分类结果。2.针对微博用户兴趣识别问题中语料利用不充分,识别效果不理想的问题,提出了一种用户兴趣三层建模方法。首先利用传统的分类方法对用户兴趣进行分类,得到分类结果,并利用阈值识别出判断正确的用户和判断错误的用户;其次统计错误判断的用户中含有标签信息的用户,比较其用户标签词和兴趣类别主题词的相似度,对误判用户中不含标签信息的用户,比较其用户文档主题词和兴趣类别主题词的相似度,两次比较中都取相似度大者对应的兴趣类别作为用户的兴趣类别;最后综合三层结果得到所有用户所属兴趣类别。实验结果表明,该方法可以提升用户兴趣识别的准确度。
其他文献
伴随着社会的飞速发展,人们的生活水平也得到了质的提高。快速的生活节奏和巨大的工作压力让人们无法喘息。因此,在节假日出门旅游成为了人们缓解压力的首选。人们期望在旅行过程中能够更好的体验当地的风土人情,享受慢节奏的生活方式,回归自然,放松身心。而民宿的出现则满足了人们的这种期望,成为了人们在旅居过程中缓解生活压力和体验绿色生活方式的新场所。它不仅能解决住宿方面的基本需求,还能使旅客体验到当地的历史人文
近年来,伴随着宏观经济下行压力加大、国际贸易摩擦加剧,我国私募股权投资行业无论是募资还是投资都面临着非常大的挑战,“资本寒冬”一词不断在行业内流传。2019年1月至11月,中国股权投资市场募资总额为10,800亿元,同比下降10%,投资总额约7,300亿元,同比下降29.5%。投资公司之间分化明显,行业的优胜劣汰机制逐步显现。由于部分机构的风险控制水平不高,导致机构的投资运作效率低下,容易出现投资
培养低年级学生的写话兴趣,提升写话能力,要从小学生的认知发展规律和心理发展特点,以及实际表达的需要出发,开展行之有效的语文实践活动,激发孩子热爱读书的兴趣并逐步形成
大数据时代,互联网每天都要产生和处理海量的视频信息资源。目前,视频信息的语义挖掘、分析和处理技术是研究的重点和难点,这对提高检索准确率和查全率具有十分重要而深刻的意义。基于此,针对视频检索中视频低层特征和高层语义出现的"语义鸿沟"问题进行了视频信息的语义挖掘研究,分析了视频信息语义挖掘中关键的环节——语义提取技术的现状和各种视频语义提取方法的优缺点,并确定了未来的研究方向。
<正>产业化背景生物技术产业是21世纪最具发展潜力的行业。在生物技术产业化过程中,色谱技术已经成为下游纯化过程中公认的关键环节~①,决定着药物产品的生产成本,而支撑色谱
去年召开的十二届连锁峰会,以“探寻多元零售时代的新价值源”为主题,切中了很多连锁企业的发展脉搏,尤其是地处二三线城市的连锁企业。都说要做到“差异化”生存。但是随着更多