基于新闻文本的政府态度智能识别研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:yp0202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
态度是特定主体对特定对象的评价,体现了特定主体的心理反应倾向。政府新闻文本依托于新闻发布制度产生,能有效表明政府立场,体现政府态度。当前学界开展的政府态度研究主要采用量表法、逻辑推理法以及内容分析法,研究方法的智能性有待提升。因此,引入文本挖掘方法对新闻文本中蕴含的政府态度进行识别,有效扩充了该领域的研究方法,提升了政府态度识别的效率,为情报分析工作提供决策支持,具备较强的理论意义与现实意义。在系统总结国内外有关政府态度识别研究成果的基础上,结合基本理论,厘清了政府新闻文本与政府态度的关联性,利用SO-PMI算法、Word2vec模型、LDA主题模型等文本挖掘方法,构建基于新闻文本的政府态度智能识别模型,并进行了实证分析。论文的具体研究内容如下:(1)通过对国内外关于政府态度识别相关成果的梳理,发现当前研究鲜有使用文本挖掘方法对政府态度进行自动识别。在对态度理论、新闻发布、LDA主题模型与文本实体抽取等相关理论、方法进行论述的基础上,分析了以新闻文本作为研究切入点、利用LDA主题模型等文本挖掘法方法进行政府态度智能识别的合理性,提出了基于新闻文本的政府态度智能识别研究的设想。(2)构建领域态度词典,设定态度词典匹配规则。在评价理论的基础上梳理形成基准态度极性词典,结合模糊限制语与程度副词等级关系形成态度强度词典,利用SO-PMI算法、Word2vec模型,扩展态度词典,并设定态度词典匹配算法。(3)基于主题分析与实体抽取结果,构建热门主题下的细粒度政府态度识别维度表。使用LDA主题模型与困惑度对实验语料库进行主题分析,确立最佳主题数,提取热点主题。抽取热点主题下新闻文本包含的命名实体,统计各热点主题下的实体分布情况,形成细粒度的态度识别维度表。(4)构建政府态度智能识别模型,并进行实证分析与模型评价。在实证分析过程中按照态度识别维度表,对热门主题下新闻文本的态度极性与强度进行可视化展现,进行不同维度下态度匹配结果的对比分析。结果表明基于新闻文本的政府态度识别模型具备较好的识别效果,文末进行总结并提出了模型改进意见。
其他文献
人类社会的存量知识不断积累,在教育不断发展过程中,知识按照不同的特征和性质逐渐被划分为若干个学科。学科内的知识具有相近的内涵,并且对外表现出近似的特征,具有高度的凝聚性。大部分知识都在学科内部进行交流,进而融合与创新,但这种知识流动带来的结果往往跳不出原有学科的边界。要想使人类社会的知识得到进一步开发和融合,学科之间的知识流动必不可少。以往研究大多以单个学科内部的知识流动为研究对象或者从某一特殊角
学位
针对配电网多系统数据融合与统一管理难度较大以及大数据量分析管理较为困难的问题,基于ROA架构和大数据分析技术开发了一套配电网多数据采集与智能分析管理系统。该系统采用REST技术将配电网事物抽象成用统一标识符URI标识的资源,并将数据转换成XML结构数据与其他子系统进行交互。同时利用大数据挖掘技术对配电网数据加以分析,进而实现对配电网运行状态的监控。测试结果表明,所设计的系统能够通过构建桌面应用子系
期刊
在集成电路(IC)设计的过程中准确的对顶层与模块的时序进行约束是时序分析及时序收敛的重要保证。为了提高效率,该文提出了一种时序约束的自动化等效传播方法,该方法包括时序约束的向下传播和时序约束的向上传播。相较于传统的时序约束的手动传播,自动化实现能有效避免因设计与时序迭代而带来的时序约束的手动传播工作,降低了设计时序约束的人力成本,从而加速时序收敛的迭代周期,提高时序迭代与时序收敛的效率并节约人力成
期刊
目的:探讨健康体检中彩超检查胆囊息肉样病变的应用优势以及相关因素分析。方法:选取2022年1月—12月于沂源县人民医院行腹部彩超检查的1 000名健康体检人员为研究对象,依据受检者的体检结果分为健康组(n=885)与患病组(n=115),结合患病组病理检查结果分析彩超诊断结果及彩超影像诊断征象,并进行相关因素分析。结果:彩超诊断胆囊息肉样病变的灵敏度为88.89%(8/9),特异度98.11%(1
期刊
为了使广告窗更加智能化、人性化,更吸引人,提升广告宣传效果的作用,设计了一种智能语音滚动式广告窗。该广告窗以Arduino UNO为控制中心,使用HC-SR04超声波模块检测广告窗正面是否有人停留,如果有人停留,则BY8001-16P语音模块播放与广告窗展示广告相匹配的信息;如果没有人停留,则采用Arduino UNO通过TB6600驱动器控制42BYGH34步进电机按照预定的时间周期带动主动轴滚
期刊
针对目前研究的电力终端负荷预测方法在预测过程中,未考虑负荷终端时序性和非线性的特点,存在预测精度较低,速度较慢的问题,提出了基于FCN和LSTM深度学习模型的电力终端负荷预测方法。利用循环神经网络,建立电力终端负荷预测模型,分析记忆状态,对电力终端数据进行预处理,并编码非数字特征,确定预测模型。利用均方误差公式得到的电力终端负荷预测模型的损失函数,通过数据预处理、优化数据参数、训练电力终端负荷预测
期刊
在互联网迅速发展以及人们对自身健康日益关注的背景下,国内外近几年有关医疗健康的网络社区不断涌现,发展迅速,用户量大且不断攀升。网络健康社区以其方便便利、自主性强、无地域差异及高度整合医疗资源的优势,成为人们管理自我健康的平台。因此,通过相关研究来加深对网络健康社区的认识和了解显得尤为重要。本文总结前人对网络健康社区的研究,选取三九健康网的肿瘤问答版块的数据,从网络健康社区的主题和情感角度切入,分别
学位
目的:基于R语言数据挖掘技术分析针灸治疗咳嗽变异性哮喘的取穴规律,为临床治疗方案的制定和优化提供参考。方法:计算机检索PubMed、EMbase、The Cochrane Library、中国知网、万方数据库、中文科技期刊数据库,筛选针灸治疗咳嗽变异性哮喘相关文献,依据标准方案提取针灸处方,建立针灸治疗咳嗽变异性哮喘处方信息数据库;基于R语言对数据库取穴频次、聚类和关联等情况进行规律挖掘。结果:共
期刊
<正>胆囊息肉在临床十分常见,近年来随着人们生活方式、饮食习惯的变化,该疾病的发病率呈现逐年升高的趋势。同时,随着体检的普及以及B超等诊断技术的广泛应用,胆囊息肉的检出率也在不断升高。但很多人对胆囊息肉并不了解,或是觉得无所谓而不加以治疗,或是病急乱投医,都会威胁到患者的健康。下面,我们就一起了解它的形成及治疗,正确认识胆囊息肉。
期刊
知识经济时代下,科技、文化、经济等各个领域都迎来了迅猛发展的时机,但与此同时各个领域都面临着数据量激增、数据质量良莠不齐、数据缺失重复等一系列棘手问题的挑战,其中数据异构的问题更是一大难点,除了制定具有公信力的行业标准、打破垄断等解决方法之外,数据融合分析也成了科研工作者关注的一大热点。文物信息资源建设与数字化保护工作呈现异构化、碎片化态势,一方面,资源建设标准各异,不同的机构往往采用不同的资源标
学位