论文部分内容阅读
                            
                            
                                随着国际形式的日益发展和愈发严峻,每天都有各种新闻事件被媒体报道出来,但正因为新闻数量的繁多以及各新闻媒体之间的隔离性,读者往往需要花费较多的时间和精力去选择和检索。本文针对这个问题,通过对国内三大主流媒体(新浪网、搜狐网和凤凰网)的军事新闻进行自动采集、归纳,并引入百度地图来对新闻发生主体进行定位,研发出一个统一平台来管理不同媒体来源的新闻事件。平台综合案例推理技术,把新闻作为案例的组成部分(案例起因、发展过程、结果与影响等),提供新闻与案例相互关联的功能,并且结合新闻本体概念提出一种基于语义的文本检索算法,既能提高信息检索的效率,同时通过对关键词进行语义分析,使得检索结果更加准确和完善。本文首先对新闻地图和案例推理的国内外研究现状做了调查和分析,发现新闻地图的数据丰富性和案例推理强大的数据分析功能。文章针对二者的特点,进行合理的融合,研究出一种基于军事新闻的案例检索方法,一方面提升了新闻数据的应用水平,使其在传统的信息传播功能的基础上,又具备地图定位和事件推理功能;另一方面通过将具有共同主题的军事新闻数据进行整合成案例,解决了案例推理中数据源匮乏的难题;文章在新闻数据的采集、案例的归纳管理、新闻本体树的构建分析和案例检索的算法研究上分别做了详细介绍;最后结合查全率、查准率和F-test值的概念,对基于本体的语义匹配和传统的字符匹配做了性能测试,实验结果表明,语义匹配充分考虑了词语含义之间的内在关联性,查询性能有很大的提高。