论文部分内容阅读
随着世界经济的发展与变革,商业竞争日趋激烈,情报、信息作为竞争的战略资源已经在市场竞争中占领着主导地位。互联网技术发展的飞速提升,也带动着企业的信息化变革。作为企业信息化的主要内容,企业竞争情报系统随着信息和网络技术的发展得到了一定的促进。对企业竞争情报系统在互联网时代如何高效、精确和智能的对情报进行搜集、处理和呈现,对于企业在新的市场环境下更好的生存有着重要的意义。本文在深入剖析了有关银行情报以及企业竞争情报收集系统的基础上,开发了一套基于互联网技术,可以自行对网络信息进行情报收集的银行竞争情报收集系统。设计一套自动化情报收集系统的工作难点是如何判断出得到的信息是不是对银行有用的情报,是不是值得收集,也就是要对信息进行主题相关度的计算,因此本文在这方面查阅了大量的资料并进行了深入研究,提出了自己的解决方案。(1)web页面的主要内容块发现是计算web页面的主题相关度的前提,本文通过对现有的一些研究成果的分析和总结,采用了一种新的主题相关度的计算方法,以提高分类器的准确率和召回率。(2)在web页面的主题相关度计算方面,本文选择了一种基于动态匹配的主题相关度计算模型。和目前已经应用的计算模型相比,本文提出的模型能够在保持比较高的处理速度的前提下还实现了高精确度。并通过实验对于我们算采用的主要内容块的识别理论和主题相关度计算方法进行了验证,证明这两种方法都是优于现在的理论和方法的。(3)最后本文提出了一个企业竞争情报系统的整体设计结构和流程,并完成了对基于互联网的银行竞争情报收集系统的开发和实现。