蒙古族历史人物信息检索系统的实现

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:caritasSD
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网数字信息的爆炸式增长,人们越来越依赖信息检索工具。目前,就中英文信息检索领域而言,公开的检索系统和工具有很多且效果较好。然而对于蒙古文信息检索领域,无论是从相关研究还是落地应用系统均不成熟。近年来蒙古文信息化得到了高速发展,蒙古文网络应用层出不穷,积累了大量的数字化资源,因此用户迫切需要一种利用这些数据资源的平台。针对实际应用需求,本文的工作内容如下:首先,通过文献调研梳理当前蒙古文搜索引擎的研究现状,分析蒙古文用户群体对蒙古文信息检索的需求,确定本文研究目标为蒙古族历史人物相关信息检索,为历史爱好者和研究者提供检索平台。其次,针对现有蒙古文检索系统欠缺语义检索和深度挖掘信息的能力,本文研究了基于知识图谱的信息检索。在构建蒙古族历史人物相关知识图谱的过程中,首先在充分考虑用户需求的基础上进行了本体构建,其次通过开发数据采集系统提高了人工抽取知识的效率,并为将来的知识加工搭建了平台,之后爬取了大量蒙古文历史相关的数据,并根据用户需求详细分析了蒙古文编码的处理以及数据存储格式,最后采用Neo4j图数据库作为知识图谱的存储和查询平台。对于知识图谱的查询,本文结合用户需求和知识图谱的定义,设置了5种查询模板供用户查询。接着,针对结构化数据量少的问题,本文研究了基于Elastic Search的蒙古文信息检索。通过蒙古文索引粒度的分析以及停用词的设计,本文开发了符合蒙古文最新标准编码的Elastic Search蒙古文分析器插件,并通过分析文档字段的特征,改进了Elastic Search排序算法的文档排序效果。最后,本文开发了一个集成知识图谱和Elastic Search的蒙古族历史人物信息检索系统。与现有蒙古文检索系统相比,该系统不仅提高了检索的效率和准确性,功能更加丰富,具有知识查询、全文查询、查询词提示、基于同义词库的查询扩展以及基于Word2Vec的查询扩展等多个功能。该系统采用了模块化开发,具有很好的实用性和扩展性,本文系统为其他类型数据搭建了一个通用检索平台。
其他文献
<正>条件概率和全概率公式是概率中的重要内容之一,也是新高考考查的重点,尤其在2022年新高考Ⅰ卷解答题中条件概率的“闪亮登场”,不但给人清新之感,而且条件概率和全概率公式的应用成为高考的热点,可以预测条件概率和全概率公式的应用问题将成为2023年乃至以后新高考卷命题新的增长点.为此,本文以高考或各地模拟考试中的有关试题为例,
期刊
近年来,无线传感器网络(Wireless Sensor Network,WSN)发展迅速,已经被广泛地应用于农业、商业、军事和环境保护等领域。然而,随着不同应用场景需求的变化,无线传感器网络的局限性愈发明显。能量已经成为限制无线传感器网络大规模部署和长期工作的主要瓶颈问题和挑战。无线能量传输技术(Wireless Power Transfer,WPT)的出现,为解决无线传感器网络的能量瓶颈问题提供
学位
为保障网络安全,通常需要将数据流通过由多个网络服务功能(Network Function,NF)按照一定顺序串联起来的服务功能链(Service Function Chaining,SFC)。NF在SFC又被称为服务功能(Service Function,SF)。现有的串行SFC的端到端延迟会随着SFC长度的增加呈指数式增加。SF并行化处理是减少延迟的有效方式,但绝大部分都是只基于网络功能虚拟化(
学位
对于高中数学而言,解题是学生学习的重要环节,然而在过去的教学中,教师单纯地重视解题技能的教学,忽视了学生核心素养的培养,这使得学生的发展受到了影响.在当前,教师需要围绕核心素养的培养来对高中数学命题思路进行调整,从学生的现实发展入手来进行习题的命制.在进行习题命制研究的同时,教师也需要结合命题的进行设计针对性的教学方案,引导学生从习题出发联系所学知识,推动其综合发展.基于此,文章对有效命题的价值进
期刊
大数据时代背景下,随着互联网信息的急速增加,推荐系统成为应对信息过载的重要手段。推荐系统的本质是在用户个性需求不明确的情况下,通过分析和挖掘用户的相关数据,从中推荐用户所感兴趣内容的一种技术手段。获取用户的个性特征成为推荐系统有效与否的关键。随着社交媒体的飞速发展,越来越多的用户喜欢在社交网站上分享自己的体验、态度和感受。这些文本内容作为用户情感、爱好和兴趣的载体,包含有大量用户个性特征信息。然而
学位
随着5G技术的迅速发展和移动设备的数量激增,用户在移动设备上执行工作流应用的需求日益增加。在移动边缘计算网络中,当移动设备从一个区域移动到另一区域时,其计算任务可以继续在源区域的边缘服务器上执行,并通过回程链路将任务执行结果传输给用户,也可以迁移到目标区域的边缘服务器上执行。第一种情况会延长工作流应用的执行时间,第二种情况会导致额外的迁移成本。因此,如何有效地权衡任务执行时间与迁移成本是目前移动边
学位
当今时代科学技术日新月异,目标检测作为计算机视觉领域的一项基本任务,被广泛应用在众多行业中。提升目标检测的精度,使其性能符合现代社会的需要成为热门研究方向。为了进一步提升目标检测模型的性能,本文探究了目标检测任务与目标掩码信息之间的联系。考虑到目标检测任务属于对象级分类,而目标掩码信息通常由属于像素级分类的实例分割任务获得,其具有丰富的像素级信息,有助于目标检测任务。鉴于此,本文提出一种基于掩膜信
学位
现如今,人们在旅游出行前通常会首选旅行服务软件搜索目的地的相关信息。面向旅游领域的关系抽取是构建旅游知识图谱以及开发智能推荐系统等工作的重要基础。目前面向旅游领域关系抽取工作的相关研究方法在中文和英文等大语种语言环境中较为成熟,但在蒙古文关系抽取方面的研究工作仍处于起步阶段。为了推进边疆地区旅游业智能化发展,开展面向旅游领域的蒙古文关系抽取研究工作具有重要意义。本文面向旅游领域的蒙古文关系抽取工作
学位
在无线传感器网络(Wireless Sensor Network,WSN)中,节能相关研究一直都受到学者们的高度关注。随着科技的发展,能量收集技术的完善有效解决了这一问题。能量收集技术使节点能够从周围环境中收集能量,并存储多余的能量供以后使用,这种有效延长网络寿命的解决方案随着研究的深入逐渐形成了一项新的研究领域——能量收集型无线传感器网络(Energy Harvesting Wireless S
学位
随着无线传感器网络(Wireless Sensor Network,WSN)的广泛应用,业界开始应用环境能量收集技术解决传感器节点的能量补充问题。而这类网络被统称为能量收集型无线传感器网络(Energy Harvesting Wireless Sensor Network,EH-WSN)。在能量收集型无线传感器网络中感知数据的可靠传输是值得研究的问题。近年来,也有少数专家学者研究数据传输的可靠性问
学位