论文部分内容阅读
背景研究显示,未来60年将出现世界能源危机。而作为新能源的页岩气发展潜力巨大,在中国正处于快速发展的时期。相关的页岩气新闻文本资讯越来越多,如何从这些新闻资讯当中快速获取所需的页岩气信息成为了一个可研究的有意义的课题。本研究选取了2009年12月至2013年3月的中国非常规油气新闻网上的页岩气新闻文本集进行信息可视化研究。本研究首先对页岩气新闻文本集的内容结构进行分析,界定了时间、地点、主体和事件四类信息实体,通过这四类实体在网络可视化视图中构成一个闭合回路来表示每一条新闻资讯。并且通过中科院研制的汉语词法分析系统ICTCLAS部分实现了信息实体的自动提取;在确定了网络的点之后,将边界定为若信息实体同时存在一条新闻文本资讯中则产生一条边的关系。并且着手编写软件,实现对信息实体关联的自动提取。然后,建立了页岩气新闻文本集可视化概念模型。模型包含数据转换、可视化映射、视图转换三个主要过程。对于可视化的结果,本文首先整体上分析,发现虽然国内页岩气参与企业众多,但是三桶油还是牢牢占据着主导地位,而国外切萨皮克等专注于页岩气的企业受到的关注也很多等等;其次本研究结合中心度与介数中心性选取了政府、北京、美国、四川、中石化、中石油作为重要信息实体作了进一步深入分析,发现中石油比中石化更加注重国外页岩气市场等等;最后,从主体——事件及地点——事件信息实体关联情况分析得出外企与页岩气领域投资、收购及合作事件的联系要远大于国企等等。总之,本研究成功地将复杂网络理论分析方法与文本集的信息可视化研究结合起来。一方面是直观地可视化文本信息,另一方面对信息之间的关系进行了挖掘,有效地对页岩气行业发展相关的企业及地区关联信息进行了可视化展示,实现了节约相关人员的信息获取时间、提高其掌握所需要的信息的效率的目的。