论文部分内容阅读
〔摘要〕[目的意义]为校园舆情信息管理员、校园舆情监管办公室、相关领导等提供舆情信息服务及决策参考。[方法过程]在Jade平台下分析、设计了基于多Agent的高校网络舆情监测与分析系统。详细阐述了信息采集Agent、信息预处理Agent、舆情分析Agent、舆情简报生成Agent的工作机制。构建了由物理层、语法层和语义层组成的多Agent间的通信模型。为了提高Agent的舆情分析能力与分析结果的可视化展示能力,通过Rserve接口对Jade平台与R语言进行集成,使得Jade Agent可以灵活调用R语言丰富的算法包。[结果结论]文中给出了“高校百度贴吧热点分析”的系统运行实例。运行结果表明基于多Agent的高校网络舆情监测与分析系统充分利用了Agent的自主性、智能性和交互性,使得系统更加具有灵活性和实时性;同时系统以大数据思维为指导,并集成了大数据分析利器R语言,使得舆情分析更加全面、客观。
〔关键词〕高校网络舆情;舆情监测与分析;多Agent;Jade平台;R语言
DOI:10.3969j.issn.1008-0821.2017.10.009
〔中图分类号〕G2062〔文献标识码〕A〔文章编号〕1008-0821(2017)10-0053-05
〔Abstract〕[PurposeSignificance]To provide public opinion information service and decision-making reference for campus public opinion information administrators,campus public opinion supervision office and related leaders.[MethodProcess]Under Jade platform,a network public opinion monitoring and analysis system based on multi Agent was analyzed and designed.The work mechanism of information collection Agent,information pre-processing Agent,public opinion analysis Agent and public opinion report Agent were elaborated in detail.A multi Agent communication model consisting of physical layer,syntax layer and semantic layer was constructed.In order to improve Agents public opinion analysis ability and the ability of analysis result visualization display,Jade platform was integrated with R language through Rserve interface,so that Jade Agent could flexibly call rich algorithms of R language.[ResultConclusion]As a system running instance,“hot spot analysis of university Baidu Post Bar”was given.The running results showed that University Network Public Opinion Monitoring and Analysis System Based on Multi-Agent takes full advantage of Agent good properties such as autonomy,intelligence and interactivity,so that the system became more flexible and real-time.Meanwhile,taking big data thinking as a guide and integrating R language made public opinion analysis more comprehensive and objective.
〔Key words〕university network public opinion;public opinion monitoring and analysis;Multi-Agent;Jade platform;R language
新媒體时代,网络舆情传播更加具有多元性、复杂性、集中性、持续性等特点。大学生群体知识层次高、思维活跃、参与意识强但尚未完全成熟,特别是部分大学生主流意识模糊、思想认识偏差、价值观念异化,更容易在校园安全管理、决策部署、师生权益等敏感话题上引发校园网络舆情,并造成舆情传播的“蝴蝶效应”,使学校卷入安全或声誉的危机之中。因此,各高校应充分重视校园网络舆情的监测、分析与引导,完善组织机构,健全校园舆情管理制度。
传统的网络舆情监测主要依靠搜索引擎人工监测,即安排固定人手,定期浏览目标站点并搜索目标关键词。很显然,人工监测在实时性、全面性和准确性等方面存在很大的局限性。传统的舆情分析也主要采用专家研判的人工方式,尽管专家在舆情研判方面具有丰富的经验,但人工研判依赖的数据往往是样本数据,数据所反映的层次相对简单和浅薄,而且人工研判容易带有人为设计的主观随意性,使得舆情研判在深度、信度、效度、客观性等方面大打折扣。 因此,大数据时代,舆情监管工作应该充分引入大数据思维以及大数据的分析与处理技术,使得舆情研判与引导更加科学。比如,在舆情采集环节,可以考虑分布式采集系统,高效、准确、实时地对覆盖主流的社交平台进行全方位信息采集;在舆情分析方面,应分析全数据而非随机采样,应重视数据的复杂性、弱化精确性,应更加关注数据的关联性而非因果关系,同时要综合运用分类、聚类、时序分析等多种数据分析技术。
鉴于此,本文提出了基于多Agent的高校网络舆情监测与分析系统,力求在舆情采集、舆情分析等方面减少人工干预,使舆情采集更加自动化、全方位,舆情分析更加客观、科学。Agent是指驻留在某一环境下,能持续自主地发挥作用,具备反应性、社会性、主动性等特征的计算实体[1]。多Agent系统是由多个自主Agent所组成的一种分布式系统,其主要任务是要创建一群自主的Agent,并协调它们的智能行为[2]。
目前已有很多学者将多Agent思想应用到舆情研究中,研究的侧重点主要集中在舆情传播机制的仿真建模,如孙雷霆等使用Multi-Agent建模技术,建立虚假舆情传播的巴斯扩散仿真模型[3];吴鹏等基于“信念–愿望–意图”模型建立起网络舆情演变过程中各类主体的多Agent交互模型,对网民的心智状态的转换过程建模仿真,从而揭示网络舆情演变的内在动因,支持应急响应策略的科学制定[4];余乐安等基于多Agent技术构建了危险化学品泄漏所造成的水污染事件中网络舆情扩散机制的仿真模型[5]。上述成果大都使用Anylogic、NetLogo等仿真平台揭示舆情信息的传播机理,为我们提供了很好的借鉴。但是,文献研究发现,利用多Agent技术构建网络舆情监测与分析系统的成果很少,目前流行的网络舆情系统大都采用较传统的面向对象的开发方法,没有很好地利用Agent的智能性、通信能力、协商性等优势;在舆情分析方面也忽视了多种分析工具和技术的整合应用。
本文以大数据思维为指导,在Jade平台下分析、设计了基于多Agent的高校网络舆情监测与分析系统。Jade是基于Java语言的多Agent系统开发框架[6],Jade Agent具有自主性、智能性、适应性以及很强的通信协作能力。为了提升系统中相关Agent的数据分析与可视化展示能力,本文提出了将Jade平台与R语言无缝集成,以便各Agent能够灵活调用R语言丰富的算法包。
1系统结构及功能分析
为了进一步加强网络舆情监测及预警防范,营造良好的舆论环境,确保校园网络信息服务健康有序,各高校应根据实际情况设定校园舆情信息管理员,成立校园舆情监管办公室。基于多Agent的高校网络舆情监测与分析系统主要为校园舆情信息管理员、校园舆情监管办公室、相关领导等提供舆情信息服务及决策参考。
网络舆情监测与分析是一项复杂的系统工程,基于任务分解的思想,将这项工作分解为舆情信息采集、舆情信息预处理、舆情分析、舆情简报生成四部分,每一部分都由相应的Agent类来完成,系统中各Agent在逻辑上或物理上呈分布状态,每个Agent拥有解决指定问题的不完全的信息或能力,Agent间通过协作或协商共同完成校园网络舆情监测与分析工作。此外,在需要的时候舆情分析Agent、舆情简报生成Agent等还可以通过Rserve接口实现与R语言的跨平台通信,远程调用R语言强大的数据分析功能。
本系统的功能结构如图1所示。
2基于多Agent的高校网络舆情监测与分析系统的工作机制
系统中的Agent可以看作是慎思Agent,其内部状态及主要行为使用六元组形式化表示如下:Agent=〈D,K,I,B,C,T〉,其中,D表示Agent的数据库,K表示Agent的知识库,I表示Agent的意图集,B表示Agent的行为能力,C表示Agent的协调控制、解决冲突能力,T表示Agent的通信能力。Agent工作时感知外部环境,根据意图集决定其行为,行为执行过程中通常需要调用数据库和知识库。
21信息采集Agent
信息采集Agent相当于校园舆情主题爬虫。主题爬虫是指选择性地爬取那些与预先定义好的主题相关页面的网络爬虫,和通用网络爬虫相比,主題爬虫针对性强,信息采集速度快,极大地节省了网络资源,并能够很好地满足特定人群对特定信息的需求。
对于高校网络舆情来说,关注度比较高的主题主要包括:教学、科研、考研、招生、师德师风、师生关系、职称评定、学科评估、专业评估、实习就业等,信息采集Agent将这些主题词设为特征关键词,从百度贴吧、校园BBS、微博、QQ空间、QQ群、微信平台等信息源爬取舆情信息。信息采集Agent的工作机制如图2所示。从图2可以看出,信息采集Agent完成主题建模(设定主题词及其权重)、网页相关度计算、网页优先权设置及信息爬取等工作。舆情信息采集时,可运行多个信息采集Agent类的实例,进行分布式采集。
22信息预处理Agent
信息预处理Agent主要负责数据清洗和数据转换工作,数据清洗指的是清除无用数据、处理缺失值、删除重复记录等工作;数据转换一般包括特征选择、格式转换等操作。文本分词、去停用词、文档特征提取工作也由信息预处理Agent完成。
23舆情分析Agent
舆情分析Agent主要完成信息的相关性分析、传播影响力指数计算、舆情基本属性分析、情感分析、舆情态势预测等。舆情分析Agent要用到大量的数据分析算法,目前,R语言是统计分析领域非常强大的工具,Jade Agent以Java为开发语言,为了提升Agent的舆情分析能力及可视化展示能力,本文采用基于Rserve的跨平台通信方式将Java与R语言有机集成,实现了Jade Agent对R语言的远程功能调用。Rserve可以看作是基于TCPIP协议和CS结构的R语言后台服务器,它提供了远程连接、认证、文件传输等功能,处理来自C、C 、Java、PHP等客户端语言提出的统计建模、数据分析、可视化等任务请求。舆情分析Agent调用R语言服务的主要步骤包括:①在R环境或命令提示符下启动Rserve服务;②在Agent程序中建立与R语言的远程连接RConnection;③在Agent程序中使用eval()函数调用R语句;④Rserve执行R语句并将执行结果返回给Agent。 24舆情简报生成Agent
舆情简报生成Agent提供若干种简报模板,根据用户自定义的舆情关键词、时间、布局方式等参数,自动生成舆情简报。所生成的简报主要包括:①分类信息简报;②最新信息报道与跟踪;③热点信息跟踪;④专题信息专报。舆情简报生成Agent要用到大量的可视化图表,为了简化操作,舆情简报生成Agent也可以按需调用R语言的绘图功能。
25Agent间的交互与通信
在多Agent系统中,为了实现自身的目标,Agent应该在遵循某种会话规则的基础上彼此协作并通过交换信息来对外界产生感知。为此,本研究构建了如图3所示的多Agent通信模型。
在图3所示的通信模型中,Agent通信模块由物理层、语法层和语义层构成,其中,物理层基于TCPIP、RMI、SOAP等通信协议负责Agent间信息的发送和接收;语法层根据Agent通信语言(KQML或ACL)的语法规则对消息内容、发送者、接收者等进行解析;任何消息只有将其置于一定的语义环境下才有意义,语义可以理解为数据在某个领域上的解释和逻辑表示,目前,主要使用本体对特定领域中的概念及其相互关系进行形式化表达,而本体常以XML作为知识表达语言。因此,在语义层主要使用本体及XML技术保证Agent对信息的正确理解。
3系统运行实例——高校百度贴吧热点分析
本实例以大连海事大学百度贴吧为信息源,首先运行信息采集Agent(运行时命名为CollectAgent),爬取2017年6月间大连海事大学百度贴吧的主题帖,作为待处理数据保存到本地文件中。信息采集Agent将待处理的数据集的地址以及预处理请求作为消息内容发送给信息预处理Agent(运行时命名为PreProcessAgent)。信息预处理Agent收到消息后对数据集进行清洗,保留了1 500条有效数据,部分数据内容如图4所示。
然后,信息预处理Agent选取数据集的title和content字段进行分词和去停用词处理,处理完毕,向信息分析Agent(运行时命名为AnalysisAgent)提出“舆情热点分析”的建议,并将预处理后的结果发送给信息分析Agent。信息分析Agent通过Rserve调用R语言的数据处理功能,以词频分析为例,其核心语句如下:
RConnection c=new?RConnection(); 建立与R的远程连接
c.eval("library(wordcloud)"); 在R语言中加载用于绘制词云的wordcloud包
c.eval("txt.aslist<-unlist(txt)"); 将分词后的词语列表转换为向量
c.eval("txt.freq<-table(txt.aslist)"); 词频统计
c.eval("txt.result<-txt.freq[order(txt.freq)]"); 频数排序
c.eval("wordcloud(names(txt.result),txt.result,random.order=FALSE)");画词云图
信息分析Agent提取出2017年6月间大连海事大学百度贴吧的热点词如图5所示。从图5可以看出,2017年6月期间,大连海事大学百度贴吧中备受关注的问题主要包括:高考提前录取;选专业;考研;毕业。被讨论较多的专业包括:轮机、航海、电气工程、船舶工程。很多人通过百度贴吧咨询高考录取等问题,咨询者主要来自:辽宁、河南、河北、山东等省份。信息分析Agent将分析结果发送给舆情简报生成Agent(运行时命名为ReportAgent),舆情简报生成Agent对原始数据、分析结果进行整理后按照用户指定的模板生成舆情报告,由于篇幅有限,舆情报告的具体内容略。
系统运行过程中,Agent间相互协作、共同完成对校园网络舆情监测与分析问题的求解。在Jade环境下,系统运行某一时刻各Agent间的交互如图6所示。
4结语
大数据时代的高校网络舆情监管面临前所未有的机遇和挑战,挑战来自于舆情数据量激增、舆情信息源复杂、舆情态势瞬息万变等方面,而機遇则体现在大数据的思维理念日益成熟,舆情信息的采集方式、分析技术日臻完善,以大数据思维为指导、整合多种先进技术必将使校园舆情监管工作更加科学化、智能化,为推进和谐校园建设,维
图6系统运行时Agent间的交互图
护正常的教学、科研秩序做出贡献。本文所提出的基于多Agent的高校网络舆情监测与分析系统充分利用了多Agent系统分布式问题求解的优势,同时整合了R语言强大的数据分析与结果可视化能力,为舆情监测与分析系统的分析、设计、实现提供了新的思路。
参考文献
[1]唐明圣.基于Agent的人工社会应急管理政策分析方法[D].长沙:国防科学技术大学,2015.
[2]程世清.基于多Agent的动态协同作战软件设计与实现[D].西安:西安电子科技大学,2015.
[3]孙雷霆,李春发,陶建强.基于Multi-Agent的虚假舆情传播仿真[J].情报杂志,2017,(4):162-169.
[4]吴鹏,金贝贝,强韶华.基于BDI-Agent模型的突发事件网络舆情应急响应建模研究[J].现代图书情报技术,2016,(Z1):32-41.
[5]余乐安,李玲,戴伟,等.危化品水污染事件中政府危机信息公布策略与网络舆情扩散研究:基于多主体模型[J].管理评论,2016,(8):175-185.
[6]胡晓玉.基于JADE的集装箱港口堆场作业多Agent仿真系统开发[D].大连:大连理工大学,2015.
[7]邢文雪.自媒体时代高校网络舆情应对研究[D].长沙:湖南大学,2014.
[8]赵扬.高校网络舆情引导研究[D].长春:东北师范大学,2016.
[9]徐萍.大数据在高校网络舆情应急处置中的应用探讨[J].图书馆工作与研究,2016,(5):55-58.
[10]孙莉玲.大数据时代高校网络舆情研判与治理[J].江海学刊,2016,(3):204-209,239.
(本文责任编辑:孙国雷)
〔关键词〕高校网络舆情;舆情监测与分析;多Agent;Jade平台;R语言
DOI:10.3969j.issn.1008-0821.2017.10.009
〔中图分类号〕G2062〔文献标识码〕A〔文章编号〕1008-0821(2017)10-0053-05
〔Abstract〕[PurposeSignificance]To provide public opinion information service and decision-making reference for campus public opinion information administrators,campus public opinion supervision office and related leaders.[MethodProcess]Under Jade platform,a network public opinion monitoring and analysis system based on multi Agent was analyzed and designed.The work mechanism of information collection Agent,information pre-processing Agent,public opinion analysis Agent and public opinion report Agent were elaborated in detail.A multi Agent communication model consisting of physical layer,syntax layer and semantic layer was constructed.In order to improve Agents public opinion analysis ability and the ability of analysis result visualization display,Jade platform was integrated with R language through Rserve interface,so that Jade Agent could flexibly call rich algorithms of R language.[ResultConclusion]As a system running instance,“hot spot analysis of university Baidu Post Bar”was given.The running results showed that University Network Public Opinion Monitoring and Analysis System Based on Multi-Agent takes full advantage of Agent good properties such as autonomy,intelligence and interactivity,so that the system became more flexible and real-time.Meanwhile,taking big data thinking as a guide and integrating R language made public opinion analysis more comprehensive and objective.
〔Key words〕university network public opinion;public opinion monitoring and analysis;Multi-Agent;Jade platform;R language
新媒體时代,网络舆情传播更加具有多元性、复杂性、集中性、持续性等特点。大学生群体知识层次高、思维活跃、参与意识强但尚未完全成熟,特别是部分大学生主流意识模糊、思想认识偏差、价值观念异化,更容易在校园安全管理、决策部署、师生权益等敏感话题上引发校园网络舆情,并造成舆情传播的“蝴蝶效应”,使学校卷入安全或声誉的危机之中。因此,各高校应充分重视校园网络舆情的监测、分析与引导,完善组织机构,健全校园舆情管理制度。
传统的网络舆情监测主要依靠搜索引擎人工监测,即安排固定人手,定期浏览目标站点并搜索目标关键词。很显然,人工监测在实时性、全面性和准确性等方面存在很大的局限性。传统的舆情分析也主要采用专家研判的人工方式,尽管专家在舆情研判方面具有丰富的经验,但人工研判依赖的数据往往是样本数据,数据所反映的层次相对简单和浅薄,而且人工研判容易带有人为设计的主观随意性,使得舆情研判在深度、信度、效度、客观性等方面大打折扣。 因此,大数据时代,舆情监管工作应该充分引入大数据思维以及大数据的分析与处理技术,使得舆情研判与引导更加科学。比如,在舆情采集环节,可以考虑分布式采集系统,高效、准确、实时地对覆盖主流的社交平台进行全方位信息采集;在舆情分析方面,应分析全数据而非随机采样,应重视数据的复杂性、弱化精确性,应更加关注数据的关联性而非因果关系,同时要综合运用分类、聚类、时序分析等多种数据分析技术。
鉴于此,本文提出了基于多Agent的高校网络舆情监测与分析系统,力求在舆情采集、舆情分析等方面减少人工干预,使舆情采集更加自动化、全方位,舆情分析更加客观、科学。Agent是指驻留在某一环境下,能持续自主地发挥作用,具备反应性、社会性、主动性等特征的计算实体[1]。多Agent系统是由多个自主Agent所组成的一种分布式系统,其主要任务是要创建一群自主的Agent,并协调它们的智能行为[2]。
目前已有很多学者将多Agent思想应用到舆情研究中,研究的侧重点主要集中在舆情传播机制的仿真建模,如孙雷霆等使用Multi-Agent建模技术,建立虚假舆情传播的巴斯扩散仿真模型[3];吴鹏等基于“信念–愿望–意图”模型建立起网络舆情演变过程中各类主体的多Agent交互模型,对网民的心智状态的转换过程建模仿真,从而揭示网络舆情演变的内在动因,支持应急响应策略的科学制定[4];余乐安等基于多Agent技术构建了危险化学品泄漏所造成的水污染事件中网络舆情扩散机制的仿真模型[5]。上述成果大都使用Anylogic、NetLogo等仿真平台揭示舆情信息的传播机理,为我们提供了很好的借鉴。但是,文献研究发现,利用多Agent技术构建网络舆情监测与分析系统的成果很少,目前流行的网络舆情系统大都采用较传统的面向对象的开发方法,没有很好地利用Agent的智能性、通信能力、协商性等优势;在舆情分析方面也忽视了多种分析工具和技术的整合应用。
本文以大数据思维为指导,在Jade平台下分析、设计了基于多Agent的高校网络舆情监测与分析系统。Jade是基于Java语言的多Agent系统开发框架[6],Jade Agent具有自主性、智能性、适应性以及很强的通信协作能力。为了提升系统中相关Agent的数据分析与可视化展示能力,本文提出了将Jade平台与R语言无缝集成,以便各Agent能够灵活调用R语言丰富的算法包。
1系统结构及功能分析
为了进一步加强网络舆情监测及预警防范,营造良好的舆论环境,确保校园网络信息服务健康有序,各高校应根据实际情况设定校园舆情信息管理员,成立校园舆情监管办公室。基于多Agent的高校网络舆情监测与分析系统主要为校园舆情信息管理员、校园舆情监管办公室、相关领导等提供舆情信息服务及决策参考。
网络舆情监测与分析是一项复杂的系统工程,基于任务分解的思想,将这项工作分解为舆情信息采集、舆情信息预处理、舆情分析、舆情简报生成四部分,每一部分都由相应的Agent类来完成,系统中各Agent在逻辑上或物理上呈分布状态,每个Agent拥有解决指定问题的不完全的信息或能力,Agent间通过协作或协商共同完成校园网络舆情监测与分析工作。此外,在需要的时候舆情分析Agent、舆情简报生成Agent等还可以通过Rserve接口实现与R语言的跨平台通信,远程调用R语言强大的数据分析功能。
本系统的功能结构如图1所示。
2基于多Agent的高校网络舆情监测与分析系统的工作机制
系统中的Agent可以看作是慎思Agent,其内部状态及主要行为使用六元组形式化表示如下:Agent=〈D,K,I,B,C,T〉,其中,D表示Agent的数据库,K表示Agent的知识库,I表示Agent的意图集,B表示Agent的行为能力,C表示Agent的协调控制、解决冲突能力,T表示Agent的通信能力。Agent工作时感知外部环境,根据意图集决定其行为,行为执行过程中通常需要调用数据库和知识库。
21信息采集Agent
信息采集Agent相当于校园舆情主题爬虫。主题爬虫是指选择性地爬取那些与预先定义好的主题相关页面的网络爬虫,和通用网络爬虫相比,主題爬虫针对性强,信息采集速度快,极大地节省了网络资源,并能够很好地满足特定人群对特定信息的需求。
对于高校网络舆情来说,关注度比较高的主题主要包括:教学、科研、考研、招生、师德师风、师生关系、职称评定、学科评估、专业评估、实习就业等,信息采集Agent将这些主题词设为特征关键词,从百度贴吧、校园BBS、微博、QQ空间、QQ群、微信平台等信息源爬取舆情信息。信息采集Agent的工作机制如图2所示。从图2可以看出,信息采集Agent完成主题建模(设定主题词及其权重)、网页相关度计算、网页优先权设置及信息爬取等工作。舆情信息采集时,可运行多个信息采集Agent类的实例,进行分布式采集。
22信息预处理Agent
信息预处理Agent主要负责数据清洗和数据转换工作,数据清洗指的是清除无用数据、处理缺失值、删除重复记录等工作;数据转换一般包括特征选择、格式转换等操作。文本分词、去停用词、文档特征提取工作也由信息预处理Agent完成。
23舆情分析Agent
舆情分析Agent主要完成信息的相关性分析、传播影响力指数计算、舆情基本属性分析、情感分析、舆情态势预测等。舆情分析Agent要用到大量的数据分析算法,目前,R语言是统计分析领域非常强大的工具,Jade Agent以Java为开发语言,为了提升Agent的舆情分析能力及可视化展示能力,本文采用基于Rserve的跨平台通信方式将Java与R语言有机集成,实现了Jade Agent对R语言的远程功能调用。Rserve可以看作是基于TCPIP协议和CS结构的R语言后台服务器,它提供了远程连接、认证、文件传输等功能,处理来自C、C 、Java、PHP等客户端语言提出的统计建模、数据分析、可视化等任务请求。舆情分析Agent调用R语言服务的主要步骤包括:①在R环境或命令提示符下启动Rserve服务;②在Agent程序中建立与R语言的远程连接RConnection;③在Agent程序中使用eval()函数调用R语句;④Rserve执行R语句并将执行结果返回给Agent。 24舆情简报生成Agent
舆情简报生成Agent提供若干种简报模板,根据用户自定义的舆情关键词、时间、布局方式等参数,自动生成舆情简报。所生成的简报主要包括:①分类信息简报;②最新信息报道与跟踪;③热点信息跟踪;④专题信息专报。舆情简报生成Agent要用到大量的可视化图表,为了简化操作,舆情简报生成Agent也可以按需调用R语言的绘图功能。
25Agent间的交互与通信
在多Agent系统中,为了实现自身的目标,Agent应该在遵循某种会话规则的基础上彼此协作并通过交换信息来对外界产生感知。为此,本研究构建了如图3所示的多Agent通信模型。
在图3所示的通信模型中,Agent通信模块由物理层、语法层和语义层构成,其中,物理层基于TCPIP、RMI、SOAP等通信协议负责Agent间信息的发送和接收;语法层根据Agent通信语言(KQML或ACL)的语法规则对消息内容、发送者、接收者等进行解析;任何消息只有将其置于一定的语义环境下才有意义,语义可以理解为数据在某个领域上的解释和逻辑表示,目前,主要使用本体对特定领域中的概念及其相互关系进行形式化表达,而本体常以XML作为知识表达语言。因此,在语义层主要使用本体及XML技术保证Agent对信息的正确理解。
3系统运行实例——高校百度贴吧热点分析
本实例以大连海事大学百度贴吧为信息源,首先运行信息采集Agent(运行时命名为CollectAgent),爬取2017年6月间大连海事大学百度贴吧的主题帖,作为待处理数据保存到本地文件中。信息采集Agent将待处理的数据集的地址以及预处理请求作为消息内容发送给信息预处理Agent(运行时命名为PreProcessAgent)。信息预处理Agent收到消息后对数据集进行清洗,保留了1 500条有效数据,部分数据内容如图4所示。
然后,信息预处理Agent选取数据集的title和content字段进行分词和去停用词处理,处理完毕,向信息分析Agent(运行时命名为AnalysisAgent)提出“舆情热点分析”的建议,并将预处理后的结果发送给信息分析Agent。信息分析Agent通过Rserve调用R语言的数据处理功能,以词频分析为例,其核心语句如下:
RConnection c=new?RConnection(); 建立与R的远程连接
c.eval("library(wordcloud)"); 在R语言中加载用于绘制词云的wordcloud包
c.eval("txt.aslist<-unlist(txt)"); 将分词后的词语列表转换为向量
c.eval("txt.freq<-table(txt.aslist)"); 词频统计
c.eval("txt.result<-txt.freq[order(txt.freq)]"); 频数排序
c.eval("wordcloud(names(txt.result),txt.result,random.order=FALSE)");画词云图
信息分析Agent提取出2017年6月间大连海事大学百度贴吧的热点词如图5所示。从图5可以看出,2017年6月期间,大连海事大学百度贴吧中备受关注的问题主要包括:高考提前录取;选专业;考研;毕业。被讨论较多的专业包括:轮机、航海、电气工程、船舶工程。很多人通过百度贴吧咨询高考录取等问题,咨询者主要来自:辽宁、河南、河北、山东等省份。信息分析Agent将分析结果发送给舆情简报生成Agent(运行时命名为ReportAgent),舆情简报生成Agent对原始数据、分析结果进行整理后按照用户指定的模板生成舆情报告,由于篇幅有限,舆情报告的具体内容略。
系统运行过程中,Agent间相互协作、共同完成对校园网络舆情监测与分析问题的求解。在Jade环境下,系统运行某一时刻各Agent间的交互如图6所示。
4结语
大数据时代的高校网络舆情监管面临前所未有的机遇和挑战,挑战来自于舆情数据量激增、舆情信息源复杂、舆情态势瞬息万变等方面,而機遇则体现在大数据的思维理念日益成熟,舆情信息的采集方式、分析技术日臻完善,以大数据思维为指导、整合多种先进技术必将使校园舆情监管工作更加科学化、智能化,为推进和谐校园建设,维
图6系统运行时Agent间的交互图
护正常的教学、科研秩序做出贡献。本文所提出的基于多Agent的高校网络舆情监测与分析系统充分利用了多Agent系统分布式问题求解的优势,同时整合了R语言强大的数据分析与结果可视化能力,为舆情监测与分析系统的分析、设计、实现提供了新的思路。
参考文献
[1]唐明圣.基于Agent的人工社会应急管理政策分析方法[D].长沙:国防科学技术大学,2015.
[2]程世清.基于多Agent的动态协同作战软件设计与实现[D].西安:西安电子科技大学,2015.
[3]孙雷霆,李春发,陶建强.基于Multi-Agent的虚假舆情传播仿真[J].情报杂志,2017,(4):162-169.
[4]吴鹏,金贝贝,强韶华.基于BDI-Agent模型的突发事件网络舆情应急响应建模研究[J].现代图书情报技术,2016,(Z1):32-41.
[5]余乐安,李玲,戴伟,等.危化品水污染事件中政府危机信息公布策略与网络舆情扩散研究:基于多主体模型[J].管理评论,2016,(8):175-185.
[6]胡晓玉.基于JADE的集装箱港口堆场作业多Agent仿真系统开发[D].大连:大连理工大学,2015.
[7]邢文雪.自媒体时代高校网络舆情应对研究[D].长沙:湖南大学,2014.
[8]赵扬.高校网络舆情引导研究[D].长春:东北师范大学,2016.
[9]徐萍.大数据在高校网络舆情应急处置中的应用探讨[J].图书馆工作与研究,2016,(5):55-58.
[10]孙莉玲.大数据时代高校网络舆情研判与治理[J].江海学刊,2016,(3):204-209,239.
(本文责任编辑:孙国雷)