智能信息处理技术在互联网舆情分析中的应用

来源 :同济大学 | 被引量 : 14次 | 上传用户:moxiaomi521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网络的快速发展,互联网日渐成为舆情产生和传播的主要场所。为了加强互联网管理和监控,互联网舆情信息的汇集整理与分析成为目前各级政府部门急需解决的现实问题。舆情监控分析系统可以实现海量互联网舆情自动实时的监测分析,有效地解决传统人工方式对舆情监测的实施难题。在诸多互联网舆情智能分析功能中,舆情热点自动发现和分析技术的研究和应用是其中重要的一环,可以帮助用户及时快捷地了解和掌握互联网热点,为掌握社情民意起到推动作用。研究了舆情热点的自动发现及深入分析技术,本文针对舆情热点自动检测的实际应用,提出了一个实用的舆情热点动态检测算法。该算法通过引入如下几个步骤提高了舆情热点检测的效果:在主题排序方面,综合考虑了主题的时间和数量特性,为某一时刻的每个主题给出一个合理得分值;引入主题合并和调整的机制,克服同一个主题被误分为多个小主题的问题;引入主题内报道淘汰的机制,避免主题内容过于宽泛;在主题描述方面,提出了将特征词和报道标题相结合的方法。实验表明,在实际应用场景中,本文所述方法明显提高了舆情热点的检测效果。在多文档的自动关键词提取方面,本文提出了结合词性规则和统计信息的方法,有效利用多个文档所反映的的全局性的重要信息,同时又尽可能的过滤掉信息冗余。该方法首先基于词性标注结果找出名词、动词、名词短语作为候选关键词;然后过滤部分候选关键词,并计算其余候选关键词的权重;最后根据用户所需个数给出最终关键词列表。在中文测试集上的实验证明了该方法的有效性。在舆情褒贬分析方面,本文分别在如下三个方面进行了研究。一是提出了基于搜索引擎摘要和基于同义词词林的两种词汇褒贬计算方法:其中前者利用搜索引擎摘要中的词汇共现关系提高词汇褒贬判断的准确率;后者利用同义词词林中的词群关系根据种子词汇扩展褒贬义词词典。二是分析了基于褒贬义词词典和基于机器学习的两种文档褒贬分析方法:其中前者集成了HowNet、同义词词林以及领域褒贬义词词典,具有较高的准确率;后者则利用机器学习方法从训练文档中学习褒贬特征,具有较好的总体性能。三是提出了基于词性规则和已有褒贬词典的观点抽取方法,该方法可以较准确的抽取到文档集中的评论主体及观点。本文最后给出了一个具体的应用实例系统——互联网舆情监控分析系统,说明本文研究的舆情热点自动发现和分析技术有效改进和完善了该系统,具有重大实用意义。
其他文献
中国古典园林属于自然,但又高于自然。中国古典园林景观类型有很多种,且具有较为突出的特点,在生态、建筑学、情感、象征、审美等方面均有较为积极的意义,并且在旅游方面也具
房地产的热潮带动了景观设计行业的快速发展,十几年来,中国的景观设计在地产景观这个版块有了良好的沉淀和积累。高品质的景观示范区能吸引周边客户,体现小区品味,示范区所承
全面预算管理是利用预算对组织内部各条线、各部门的各种财务及非财务资源进行分配、考核、控制,以便有效地组织和协调企业的生产经营活动,完成既定经营目标的过程。以大连万
2004年新加坡的华文教改和前几次的教改最大的不同在于它除了关注认知、促进学生更好地掌握华文知识外,还注重培养学生对华文持久的兴趣。这次教改采用导入、核心和深广的单
中国古典园林是中华上下五千年历史留下来的瑰宝,也是这段时期内物质与精神文明的外在体现。现代园林景观设计不仅汲取了古典园林的理论与精化,又顺应时代发展趋势,把园林建
目的:分析年轻的原发性直肠癌患者的临床特征,以便为此类患者的临床治疗提供参考.方法:将2012年6月至2018年6月期间在徐州医科大学附属医院接受诊治的96例年轻的原发性直肠癌
20世纪90年代以来,我国高等教育由精英化向大众化转化,云南省高等教育实行扩招战略,高等教育规模得到了迅速扩张。地方高等院校是高等教育发展的主力军,它们承担着高等教育大
以昌平区2019年城镇绿化为民办实事工程为实例背景,针对昌平新城滨河森林公园、赛场公园2个典型城市公园现状存在的问题,从种植、道路、水体、桥梁等方面进行提升改造,旨在改