网络舆情热点信息发现及其倾向性研究

被引量 : 9次 | 上传用户:ramondwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展和互联网的日益普及,网络已经成为广大民众获取信息的主要渠道,同时网络也成为人们发表评论、表达民意的重要平台。面对互联网上飞速增长的新闻话题以及人们的评论信息,如何从海量信息中采集到满足特定需求的信息,如何将互联网信息组织整理成有效的机器数据,如何从采集到的数据中区分有用信息和无用信息等等这些问题都是信息科技发展所面临的难题。网络舆情是指民众通过互联网对政府管理以及现实社会中各种现象、问题所表达的政治信念、态度、意见和情绪的总和。网络舆情与社会舆情相互作用、相互影响。两者不仅在内容表现形态方面具有一致性,同时网络舆情在一定程度上会影响社会舆情的发展趋势,对社会影响巨大。因此,政府部门对网络舆情信息必须具备一定的监控能力,能够及时掌握一定时期内民众所关注的热点问题,了解民众对热点事件的看法和态度,从而做出正确的决策,主动引导舆论走向。本文在分析网络舆情热点信息发现和网络舆情热点信息倾向性研究现状的基础上,从舆情信息的来源入手,设计了详细的采集流程。针对大众和政府部门都比较关注的热点信息,本文根据热点信息的概念和特征建立了热点信息的判断标准,并将热点信息的特征定量化,构建数学模型,用算法来描述热点信息的发现和获取。针对热点信息的倾向性分析,本文首先手工构建了极性词典,并对极性词典进行了扩充和修正,将未登录词汇、否定词和强调副词对原始极性词的影响做了进一步分析,并提出相应的解决办法。对于普通的文本信息,用向量来进行表示,通过计算特征词的权重来选取文本的特征词条。由于中文句子以标点符号进行划分,本文对句子进行句法分析,解析出词语之间的依存关系,并对词语进行词性标注。本文建立了语义模板,通过语义模板的匹配来确定句子的语义模式,利用极性词典计算出词语的极性值,再结合句法分析和模式匹配得出其上下文极性。句子的倾向性由组成句子的主题词和极性词及其极性值决定,文本的倾向性由句子的倾向性和句子在整个文本中的权重计算得出。最后,本文对所做的研究工作进行了模拟实验,对实验结果进行了讨论与分析。
其他文献
土地是人类生产和生活所必须的物质基础,任何形态的产业发展最终都要落到土地上,对于处在工业化和城市化进程中的中国来说,人地矛盾尤为尖锐,出现了许多与土地有关的突出矛盾
研究背景:多囊卵巢综合征(polyeystic ovary syndrome, PCOS)是青春期及育龄期妇女最常见的内分泌及代谢性疾病,在育龄期妇女中的群体发病率为5%~10%,该病由于不同个体的临床表
浆态作为一种固态与液态共存的物质(即在液体中含有固体小颗粒且其直径一般可控制在几十微米左右),在固体组分比例合适的情况下仍具有较好的流动性。目前受关注较多的低温浆
随着信息技术的发展,人类逐渐从传统“无纸化办公”过渡到“无址化办公”,逐渐摆脱办公室中电脑和网线的束缚,开始应用移动信息化解决方案。移动信息化方案在众多行业中得到
OTN(Optical Transport Network,光传送网)融合SDH与WDM技术优势而成,既具备超大容量的数据业务承载能力,又能实现更大粒度上的灵活业务调度,同时还具备完善的管理维护能力,
伴随着社会的进步,钢结构以其优良的材料特征在建筑业正日益受到广泛的关注。当前国内大量住宅建设所造成的资源浪费、环境恶化等后果,建设部已多次倡导发展钢结构住宅,从而
..自然场景的实时高保真绘制是计算机图形学的主要研究方向之一,在数字娱乐和虚拟仿真等方面有着广泛的应用。大规模动态森林场景是自然场景不可或缺的重要组成部分。由于其
随着电力电子技术的发展,各种变频电路、斩波电路的应用不断扩大,在这些电力电子电路中的主回路不论是采用换流关断的晶闸管,还是采用自关断能力的新型电力电子器件,都需要一
随着信息技术的持续发展和数据分析和数据挖掘研究的不断深入,如何有效的利用现代信息技术将各种前沿的数据分析方法应用到现代企业的业务流程中已成为计算机应用科学迫切需
判断一个城市的发展水平,人们已不再单纯看发展速度和国民生产总值,还要看城市环境和文化品位,以此来判断城市的综合实力,是否可持续发展。全球化进程推动了文化在城市发展中