基于多Agent的高校网络舆情监测与分析系统

来源 :现代情报 | 被引量 : 0次 | 上传用户:redkind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  〔摘要〕[目的意义]为校园舆情信息管理员、校园舆情监管办公室、相关领导等提供舆情信息服务及决策参考。[方法过程]在Jade平台下分析、设计了基于多Agent的高校网络舆情监测与分析系统。详细阐述了信息采集Agent、信息预处理Agent、舆情分析Agent、舆情简报生成Agent的工作机制。构建了由物理层、语法层和语义层组成的多Agent间的通信模型。为了提高Agent的舆情分析能力与分析结果的可视化展示能力,通过Rserve接口对Jade平台与R语言进行集成,使得Jade Agent可以灵活调用R语言丰富的算法包。[结果结论]文中给出了“高校百度贴吧热点分析”的系统运行实例。运行结果表明基于多Agent的高校网络舆情监测与分析系统充分利用了Agent的自主性、智能性和交互性,使得系统更加具有灵活性和实时性;同时系统以大数据思维为指导,并集成了大数据分析利器R语言,使得舆情分析更加全面、客观。
  〔关键词〕高校网络舆情;舆情监测与分析;多Agent;Jade平台;R语言
  DOI:10.3969j.issn.1008-0821.2017.10.009
  〔中图分类号〕G2062〔文献标识码〕A〔文章编号〕1008-0821(2017)10-0053-05
  〔Abstract〕[PurposeSignificance]To provide public opinion information service and decision-making reference for campus public opinion information administrators,campus public opinion supervision office and related leaders.[MethodProcess]Under Jade platform,a network public opinion monitoring and analysis system based on multi Agent was analyzed and designed.The work mechanism of information collection Agent,information pre-processing Agent,public opinion analysis Agent and public opinion report Agent were elaborated in detail.A multi Agent communication model consisting of physical layer,syntax layer and semantic layer was constructed.In order to improve Agents public opinion analysis ability and the ability of analysis result visualization display,Jade platform was integrated with R language through Rserve interface,so that Jade Agent could flexibly call rich algorithms of R language.[ResultConclusion]As a system running instance,“hot spot analysis of university Baidu Post Bar”was given.The running results showed that University Network Public Opinion Monitoring and Analysis System Based on Multi-Agent takes full advantage of Agent good properties such as autonomy,intelligence and interactivity,so that the system became more flexible and real-time.Meanwhile,taking big data thinking as a guide and integrating R language made public opinion analysis more comprehensive and objective.
  〔Key words〕university network public opinion;public opinion monitoring and analysis;Multi-Agent;Jade platform;R language
  新媒體时代,网络舆情传播更加具有多元性、复杂性、集中性、持续性等特点。大学生群体知识层次高、思维活跃、参与意识强但尚未完全成熟,特别是部分大学生主流意识模糊、思想认识偏差、价值观念异化,更容易在校园安全管理、决策部署、师生权益等敏感话题上引发校园网络舆情,并造成舆情传播的“蝴蝶效应”,使学校卷入安全或声誉的危机之中。因此,各高校应充分重视校园网络舆情的监测、分析与引导,完善组织机构,健全校园舆情管理制度。
  传统的网络舆情监测主要依靠搜索引擎人工监测,即安排固定人手,定期浏览目标站点并搜索目标关键词。很显然,人工监测在实时性、全面性和准确性等方面存在很大的局限性。传统的舆情分析也主要采用专家研判的人工方式,尽管专家在舆情研判方面具有丰富的经验,但人工研判依赖的数据往往是样本数据,数据所反映的层次相对简单和浅薄,而且人工研判容易带有人为设计的主观随意性,使得舆情研判在深度、信度、效度、客观性等方面大打折扣。   因此,大数据时代,舆情监管工作应该充分引入大数据思维以及大数据的分析与处理技术,使得舆情研判与引导更加科学。比如,在舆情采集环节,可以考虑分布式采集系统,高效、准确、实时地对覆盖主流的社交平台进行全方位信息采集;在舆情分析方面,应分析全数据而非随机采样,应重视数据的复杂性、弱化精确性,应更加关注数据的关联性而非因果关系,同时要综合运用分类、聚类、时序分析等多种数据分析技术。
  鉴于此,本文提出了基于多Agent的高校网络舆情监测与分析系统,力求在舆情采集、舆情分析等方面减少人工干预,使舆情采集更加自动化、全方位,舆情分析更加客观、科学。Agent是指驻留在某一环境下,能持续自主地发挥作用,具备反应性、社会性、主动性等特征的计算实体[1]。多Agent系统是由多个自主Agent所组成的一种分布式系统,其主要任务是要创建一群自主的Agent,并协调它们的智能行为[2]。
  目前已有很多学者将多Agent思想应用到舆情研究中,研究的侧重点主要集中在舆情传播机制的仿真建模,如孙雷霆等使用Multi-Agent建模技术,建立虚假舆情传播的巴斯扩散仿真模型[3];吴鹏等基于“信念–愿望–意图”模型建立起网络舆情演变过程中各类主体的多Agent交互模型,对网民的心智状态的转换过程建模仿真,从而揭示网络舆情演变的内在动因,支持应急响应策略的科学制定[4];余乐安等基于多Agent技术构建了危险化学品泄漏所造成的水污染事件中网络舆情扩散机制的仿真模型[5]。上述成果大都使用Anylogic、NetLogo等仿真平台揭示舆情信息的传播机理,为我们提供了很好的借鉴。但是,文献研究发现,利用多Agent技术构建网络舆情监测与分析系统的成果很少,目前流行的网络舆情系统大都采用较传统的面向对象的开发方法,没有很好地利用Agent的智能性、通信能力、协商性等优势;在舆情分析方面也忽视了多种分析工具和技术的整合应用。
  本文以大数据思维为指导,在Jade平台下分析、设计了基于多Agent的高校网络舆情监测与分析系统。Jade是基于Java语言的多Agent系统开发框架[6],Jade Agent具有自主性、智能性、适应性以及很强的通信协作能力。为了提升系统中相关Agent的数据分析与可视化展示能力,本文提出了将Jade平台与R语言无缝集成,以便各Agent能够灵活调用R语言丰富的算法包。
  1系统结构及功能分析
  为了进一步加强网络舆情监测及预警防范,营造良好的舆论环境,确保校园网络信息服务健康有序,各高校应根据实际情况设定校园舆情信息管理员,成立校园舆情监管办公室。基于多Agent的高校网络舆情监测与分析系统主要为校园舆情信息管理员、校园舆情监管办公室、相关领导等提供舆情信息服务及决策参考。
  网络舆情监测与分析是一项复杂的系统工程,基于任务分解的思想,将这项工作分解为舆情信息采集、舆情信息预处理、舆情分析、舆情简报生成四部分,每一部分都由相应的Agent类来完成,系统中各Agent在逻辑上或物理上呈分布状态,每个Agent拥有解决指定问题的不完全的信息或能力,Agent间通过协作或协商共同完成校园网络舆情监测与分析工作。此外,在需要的时候舆情分析Agent、舆情简报生成Agent等还可以通过Rserve接口实现与R语言的跨平台通信,远程调用R语言强大的数据分析功能。
  本系统的功能结构如图1所示。
  2基于多Agent的高校网络舆情监测与分析系统的工作机制
  系统中的Agent可以看作是慎思Agent,其内部状态及主要行为使用六元组形式化表示如下:Agent=〈D,K,I,B,C,T〉,其中,D表示Agent的数据库,K表示Agent的知识库,I表示Agent的意图集,B表示Agent的行为能力,C表示Agent的协调控制、解决冲突能力,T表示Agent的通信能力。Agent工作时感知外部环境,根据意图集决定其行为,行为执行过程中通常需要调用数据库和知识库。
  21信息采集Agent
  信息采集Agent相当于校园舆情主题爬虫。主题爬虫是指选择性地爬取那些与预先定义好的主题相关页面的网络爬虫,和通用网络爬虫相比,主題爬虫针对性强,信息采集速度快,极大地节省了网络资源,并能够很好地满足特定人群对特定信息的需求。
  对于高校网络舆情来说,关注度比较高的主题主要包括:教学、科研、考研、招生、师德师风、师生关系、职称评定、学科评估、专业评估、实习就业等,信息采集Agent将这些主题词设为特征关键词,从百度贴吧、校园BBS、微博、QQ空间、QQ群、微信平台等信息源爬取舆情信息。信息采集Agent的工作机制如图2所示。从图2可以看出,信息采集Agent完成主题建模(设定主题词及其权重)、网页相关度计算、网页优先权设置及信息爬取等工作。舆情信息采集时,可运行多个信息采集Agent类的实例,进行分布式采集。
  22信息预处理Agent
  信息预处理Agent主要负责数据清洗和数据转换工作,数据清洗指的是清除无用数据、处理缺失值、删除重复记录等工作;数据转换一般包括特征选择、格式转换等操作。文本分词、去停用词、文档特征提取工作也由信息预处理Agent完成。
  23舆情分析Agent
  舆情分析Agent主要完成信息的相关性分析、传播影响力指数计算、舆情基本属性分析、情感分析、舆情态势预测等。舆情分析Agent要用到大量的数据分析算法,目前,R语言是统计分析领域非常强大的工具,Jade Agent以Java为开发语言,为了提升Agent的舆情分析能力及可视化展示能力,本文采用基于Rserve的跨平台通信方式将Java与R语言有机集成,实现了Jade Agent对R语言的远程功能调用。Rserve可以看作是基于TCPIP协议和CS结构的R语言后台服务器,它提供了远程连接、认证、文件传输等功能,处理来自C、C 、Java、PHP等客户端语言提出的统计建模、数据分析、可视化等任务请求。舆情分析Agent调用R语言服务的主要步骤包括:①在R环境或命令提示符下启动Rserve服务;②在Agent程序中建立与R语言的远程连接RConnection;③在Agent程序中使用eval()函数调用R语句;④Rserve执行R语句并将执行结果返回给Agent。   24舆情简报生成Agent
  舆情简报生成Agent提供若干种简报模板,根据用户自定义的舆情关键词、时间、布局方式等参数,自动生成舆情简报。所生成的简报主要包括:①分类信息简报;②最新信息报道与跟踪;③热点信息跟踪;④专题信息专报。舆情简报生成Agent要用到大量的可视化图表,为了简化操作,舆情简报生成Agent也可以按需调用R语言的绘图功能。
  25Agent间的交互与通信
  在多Agent系统中,为了实现自身的目标,Agent应该在遵循某种会话规则的基础上彼此协作并通过交换信息来对外界产生感知。为此,本研究构建了如图3所示的多Agent通信模型。
  在图3所示的通信模型中,Agent通信模块由物理层、语法层和语义层构成,其中,物理层基于TCPIP、RMI、SOAP等通信协议负责Agent间信息的发送和接收;语法层根据Agent通信语言(KQML或ACL)的语法规则对消息内容、发送者、接收者等进行解析;任何消息只有将其置于一定的语义环境下才有意义,语义可以理解为数据在某个领域上的解释和逻辑表示,目前,主要使用本体对特定领域中的概念及其相互关系进行形式化表达,而本体常以XML作为知识表达语言。因此,在语义层主要使用本体及XML技术保证Agent对信息的正确理解。
  3系统运行实例——高校百度贴吧热点分析
  本实例以大连海事大学百度贴吧为信息源,首先运行信息采集Agent(运行时命名为CollectAgent),爬取2017年6月间大连海事大学百度贴吧的主题帖,作为待处理数据保存到本地文件中。信息采集Agent将待处理的数据集的地址以及预处理请求作为消息内容发送给信息预处理Agent(运行时命名为PreProcessAgent)。信息预处理Agent收到消息后对数据集进行清洗,保留了1 500条有效数据,部分数据内容如图4所示。
  然后,信息预处理Agent选取数据集的title和content字段进行分词和去停用词处理,处理完毕,向信息分析Agent(运行时命名为AnalysisAgent)提出“舆情热点分析”的建议,并将预处理后的结果发送给信息分析Agent。信息分析Agent通过Rserve调用R语言的数据处理功能,以词频分析为例,其核心语句如下:
  RConnection c=new?RConnection(); 建立与R的远程连接
  c.eval("library(wordcloud)"); 在R语言中加载用于绘制词云的wordcloud包
  c.eval("txt.aslist<-unlist(txt)"); 将分词后的词语列表转换为向量
  c.eval("txt.freq<-table(txt.aslist)"); 词频统计
  c.eval("txt.result<-txt.freq[order(txt.freq)]"); 频数排序
  c.eval("wordcloud(names(txt.result),txt.result,random.order=FALSE)");画词云图
  信息分析Agent提取出2017年6月间大连海事大学百度贴吧的热点词如图5所示。从图5可以看出,2017年6月期间,大连海事大学百度贴吧中备受关注的问题主要包括:高考提前录取;选专业;考研;毕业。被讨论较多的专业包括:轮机、航海、电气工程、船舶工程。很多人通过百度贴吧咨询高考录取等问题,咨询者主要来自:辽宁、河南、河北、山东等省份。信息分析Agent将分析结果发送给舆情简报生成Agent(运行时命名为ReportAgent),舆情简报生成Agent对原始数据、分析结果进行整理后按照用户指定的模板生成舆情报告,由于篇幅有限,舆情报告的具体内容略。
  系统运行过程中,Agent间相互协作、共同完成对校园网络舆情监测与分析问题的求解。在Jade环境下,系统运行某一时刻各Agent间的交互如图6所示。
  4结语
  大数据时代的高校网络舆情监管面临前所未有的机遇和挑战,挑战来自于舆情数据量激增、舆情信息源复杂、舆情态势瞬息万变等方面,而機遇则体现在大数据的思维理念日益成熟,舆情信息的采集方式、分析技术日臻完善,以大数据思维为指导、整合多种先进技术必将使校园舆情监管工作更加科学化、智能化,为推进和谐校园建设,维
  图6系统运行时Agent间的交互图
  护正常的教学、科研秩序做出贡献。本文所提出的基于多Agent的高校网络舆情监测与分析系统充分利用了多Agent系统分布式问题求解的优势,同时整合了R语言强大的数据分析与结果可视化能力,为舆情监测与分析系统的分析、设计、实现提供了新的思路。
  参考文献
  [1]唐明圣.基于Agent的人工社会应急管理政策分析方法[D].长沙:国防科学技术大学,2015.
  [2]程世清.基于多Agent的动态协同作战软件设计与实现[D].西安:西安电子科技大学,2015.
  [3]孙雷霆,李春发,陶建强.基于Multi-Agent的虚假舆情传播仿真[J].情报杂志,2017,(4):162-169.
  [4]吴鹏,金贝贝,强韶华.基于BDI-Agent模型的突发事件网络舆情应急响应建模研究[J].现代图书情报技术,2016,(Z1):32-41.
  [5]余乐安,李玲,戴伟,等.危化品水污染事件中政府危机信息公布策略与网络舆情扩散研究:基于多主体模型[J].管理评论,2016,(8):175-185.
  [6]胡晓玉.基于JADE的集装箱港口堆场作业多Agent仿真系统开发[D].大连:大连理工大学,2015.
  [7]邢文雪.自媒体时代高校网络舆情应对研究[D].长沙:湖南大学,2014.
  [8]赵扬.高校网络舆情引导研究[D].长春:东北师范大学,2016.
  [9]徐萍.大数据在高校网络舆情应急处置中的应用探讨[J].图书馆工作与研究,2016,(5):55-58.
  [10]孙莉玲.大数据时代高校网络舆情研判与治理[J].江海学刊,2016,(3):204-209,239.
  (本文责任编辑:孙国雷)
其他文献
期刊
碳纤维增强环氧树脂基复合材料拥有高的比强度、比模量,并且凭借优异的力学性能和耐腐蚀性等性能,广泛应用在航空航天、高铁、军工及建筑等领域。但是随着现代机械系统向高速
金属纤网的均匀性影响金属纤维毡的使用寿命、强度、折波性、过滤性和透气性等。因此,研究金属纤网的均匀性对提高金属纤维烧结毡的性能具有重要意义。文章以丝径为8、12和22
自从机载防撞系统(Traffic Collision Avoidance System,TCAS)诞生以来,便迅速在航空安全领域扮演着至关重要的角色。然而,随着航空工业的迅猛发展,使得空域中的飞机数量急剧增加,飞机之间通过TCAS通信的频率变得越来越高,通信干扰的问题将大大降低TCAS系统的性能,给航空安全带来隐患。广播式自动相关监视(Automatic Dependent Surveillanc
现役天然气管线由于各种因素的影响,易导致管线达不到原来的设计埋深,甚至局部管体裸露等现象,这将威胁到管线的安全运行,因此需要对浅埋或裸露的管线进行整改。整改方式之一
以油溶性引发剂偶氮二异丁腈作引发剂,采用乳液聚合合成了一种性能优良的聚羧酸减水剂.当引发剂用量为1.5%,乳化剂用量为4%,反应温度控制在70℃时,合成减水剂的性能最佳.与普通
本文以我国非遗纪录片的叙事策略作为探讨对象,在完整地梳理我国非遗纪录片发展脉络的基础上,结合笔者的毕业设计《守艺》的创作经验,分别从叙事视角、叙事结构和叙述者三个层面展开论述,目的在于提炼总结非遗纪录片不同时期的叙事特点,分析出不同叙事策略各自的优劣,并为当下非遗纪录片的创作者提供参考和借鉴的经验。从结构上来看,本文一共分为五个章节。第一章为绪论,该章介绍了本文的研究背景并整理了相关的文献资料,然
党的十九大以来,黑龙江省七星农场积极按照党中央的战略部署和《打赢垦区脱贫攻坚战行动实施意见》的具体要求,不断加大扶贫脱贫工作力度,加快贫困场脱贫步伐。七星农场党委
随着城市建设步伐的加快,对建筑物的实用性、科学性以及美观性提出更为严格的新要求,继而出现了各类建筑朝着“大面积、大体量、大跨度”方向发展的趋势,但随之也带来了大型
投资组合优化问题,是在给定的一组资产中选择若干资产以及确定投资于每个选中资产的份额,在满足投资者的最低回报要求的前提下尽可能的降低投资的风险。该问题旨在解决的是金融和经济学中出现的投资组合优化问题,具有很重要的现实意义,虽然该问题的基本公式可以使用线性或二次规划有效地解决,但其更实际和现实的变体(包括各种约束和目标)在许多情况下都需要通过启发式方法来解决;高效求解投资组合优化问题的算法可以在金融和