论文部分内容阅读
随着通讯技术的发展和大数据的广泛应用,电信企业的数据量迅猛增长。使用以往的搜索技术查询信息速度慢、效率低,想要获得有效信息犹如大海捞针。同时,由于业务扩张,需根据企业特点定制搜索引擎来满足不同用户角色的搜索需求。因此,如何快速、精准地查找信息,个性化搜索成为电信企业迫在眉睫的问题。本文针对电信企业提出企业搜索引擎的设计方案,根据电信数据异构的特点进行有效抽取和检索,同时实现个性化定制应用和搜索的可配置化。论文以电信业务具体需求为出发点,具有很好的应用价值。论文的主要研究工作包括:(1)研究电信企业搜索现状,针对电信数据异构、需求个性化等特点,给出设计目标、设计要求和系统需要实现的功能需求和非功能性需求。(2)研究分析企业搜索引擎的组成架构、检索原理和相关技术,进行总体分析,给出系统的总体架构、系统框架和数据库逻辑结构。将系统分为数据抽取、引擎服务、应用接口和可视化系统配置四个模块。(3)设计并实现电信搜索引擎。数据抽取,针对多种数据源、数据类型设计并实现抽取程序,支持数据源增量和全量抽取、热词统计、词库同步等功能;引擎服务,修改开源的中文分词器IKAnalyzer以兼容系统使用的Solr高版本,重写Solr方法,可根据响应参数返回分词结果或者进行词库导入;应用接口,设计实现六个业务接口,分离业务逻辑和Solr的引擎服务,提供用户使用;可视化系统配置,提供可视化界面使用以便进行系统的维护、参数配置等日常工作。(4)实验结果表明,该电信搜索引擎系统在功能上和性能上均满足了电信企业的搜索需求,能够为电信企业提供更有效的搜索服务。