高校舆情个性化推荐的研究与系统实现

来源 :济南大学 | 被引量 : 0次 | 上传用户:josiefeiv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息资源的爆炸式增长,人们接触到的网络信息越来越多。人们在享受着丰富互联网资源所带来便利的同时,也免不了受到各种谣言和负面信息的影响。尤其是在高校中,因为涉世未深,大学生群体更容易受到不良信息的影响,做出不理智的行为。为了应对高校中的舆情问题,让高校管理者对各种事件做出快速的反应,高校舆情系统应运而生。但在高校舆情系统中,用户需要面对海量的信息,出现了严重的信息过载问题。为了解决这个问题,本文在研究了商用舆情系统和个性化推荐算法的基础上完成了多项工作来辅助用户进行信息检索,并开发了一套高校舆情系统。首先,本文对高校舆情系统进行了需求分析和详细设计。系统功能除了舆情系统的基础功能外,还包括情感分析和搜索关键词个性化推荐。系统主要使用Java开发,数据处理和算法部分使用Python实现,搜索功能使用Elasticsearch实现。其中Python实现的相关功能封装成功能脚本,系统通过定时任务运行脚本来实现相应功能。两者之间通过数据库进行交互,有效降低了系统耦合。然后,本文实现了多种情感分析模型。本文搭建了fastText、Bi LSTM、BiGRU和CNN这四种神经网络模型,并使用word2vec生成的词向量和BERT预训练模型的词向量作为嵌入特征。在公开数据集上进行实验之后,本文选择了效果最好的BiLSTM和word2vec词向量组合融入高校舆情系统中,帮助用户筛选舆情信息,缓解信息过载问题。然后,本文提出了两种搜索关键词个性化推荐方法,向用户推荐搜索关键词,帮助用户进行搜索,缓解信息过载问题,提高舆情系统的可用性。第一种方法是通过基于物品的协同过滤算法进行搜索关键词相似度计算,把与用户最新搜索关键词最相似的关键词推荐给用户。第二种方法是融合词向量聚类和热度排序的关键词个性化推荐模型。首先根据词向量进行聚类,把所有关键词分成100个词类。然后通过用户的历史行为数据计算用户对部分词类的评分,通过SVD算法预测用户对所有词类的评分,得到每个用户最感兴趣的10个词类。最后选取用户最感兴趣词类中当天热度排序最高的关键词推荐给用户。除此之外,本文针对用户搜索后场景提供了基于词向量的近义词推荐作为个性化关键词推荐的补充,在扩展用户搜索范围的同时实现了关键词实时推荐。最后,本文对系统进行了功能测试和性能测试,测试结果证明了系统的可用性满足需求。
其他文献
目前对干旱区绿洲土壤-蔬菜系统中重金属在复合污染条件下的迁移特征研究较少。本论文通过盆栽试验,研究了干旱区绿洲土壤-胡萝卜系统中重金属污染物Cd、Pb、Zn、Ni四种元素
农作物害虫种类繁多且易爆发成灾,不仅影响农民的经济效益,而且也会对社会的稳定造成一定程度的影响。因此,如何有效识别农作物害虫是至关重要的。目前,国内外已经有大量的关
视觉一直以来都是人们认识世界很重要的感知方法,机器视觉也渐渐被人们熟知。虽然已有大量学者从各个角度进行了研究,但是目前仍然是一个研究热点。双目视觉既能获取环境的二
近年来,无线传感器网络(Wireless Sensor Network,WSN)作为一种综合了多种信息技术的交叉学科,在国内外引起了学者的极大关注和研究兴趣,也逐渐在工业、农业、军事、环境监测
目前航站楼中人流量大、工作人员工作负担重,导致每位旅客无法获得及时的服务和旅客发生冲突前不能及时发现并规避风险。针对以上问题,研究了基于自注意力机制的多模态情感识
级联功率变换器凭借调压能力强的优势,近年来在电动汽车、太阳能发电等领域得到了广泛应用。但级联结构的控制复杂,传统的效率优化方法很难适用该类变换器的高频应用。遗传算
差分进化算法(Differential Evolution,DE)是一种新型的智能算法,凭借着原理简单,运行参数少等优点,被广泛的应用于解决各类优化问题,近年来,一些学者也将差分进化算法应用到
随着太赫兹技术的发展,越来越多的与之相关应用开始走进我们的生活。由于太赫兹器件的不完善制约了太赫兹技术的发展,因此对于太赫兹器件的研究引发了广泛关注。更宽的频带、
太赫兹波作为最后被人类研究的电磁波频段,早年间受制于太赫兹源和探测器的研究进展,太赫兹的应用方向尚未得到很好的发展。目前,太赫兹波频段展示出的广大应用前景已经涵盖
在当前可用频谱资源极为匮乏的情况下,为应对“大-智-移-云”时代对联网和数据流量需求的爆炸宽式增长,通过在通信物理层进一步提升频谱效率来实现高速率的数据传输成为数字