中文信息检索及相关问题的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:divide2058
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展,网络上电子可读文本的日益增加,呈指数膨胀的文本信息资源,使得如何准确有效地获取用户所需要的信息成为人们关注的热点,促进了文本处理领域的形成和发展。自动收集和整理所需要的各类信息成为信息产业面临新的挑战和新的发展契机,而信息检索技术是解决这些问题的关键。根据不同的应用背景和不同的使用目的,信息检索技术已经演化为信息检索、信息过滤、信息分类、文本摘要,和问题回答等方向。 由于信息主要是以文本形式表示,本文主要讨论中文文本检索和相关应用的处理技术。文本检索主要研究的对象是大规模、非结构化的真实文本,进行文本分类、文本检索、文本过滤和文本摘要等方面处理,以满足用户的信息需求。 本文主要讨论的问题包括:提高文本检索效率的相关技术、中文文本处理的预处理中文分词技术、和问题回答系统技术等。 文本分类既可以作为独立应用系统,也可以作为检索系统的组件用以提高系统的效率。作者提出了两种提高分类系统效率和精度的方法:利用汉语分析技术进行标题分析和层次分类方法。 中文分词是中文信息处理的第一步,快速分词算法对于实际应用系统有着重要意义。例如,在中文信息过滤系统中,中文分词的速度至关重要。作者提出了一种快速分词算法,通过理论分析和实验对比,验证了它的有效性。 作为检索系统的较高应用形式,问答系统近年来得到了广泛的关注。本文介绍了同国内某门户网站合作研究的问答系统的相关技术,包括命名实体的识别和基于滑动窗口的动态摘要算法和问答系统中的相关反馈。
其他文献
推荐系统是数据挖掘领域的研究热点之一。如何从大规模的高维稀疏用户行为数据中挖掘有效的行为关系,并为用户快速产生准确的个性化推荐,已成为推荐系统领域所面临的、迫切需
当前,我国的电信网管系统存在着诸多问题,一个省内的各专业网管系统相互独立,缺乏一个全省统一的综合网管系统,并且许多省的备品备件管理也需要更好地统筹规划。针对这种现状
近年来,随着移动设备的普及,无线通信技术的迅速发展以及组播应用的增加,将组播技术和移动技术结合,在无线网络中确保组播通信的安全性成为了一个重要的研究领域。LKH和IOLUS
企业信息门户(Enterprise Information Portal,EIP)是一个集成化的企业信息平台,可以为企业提供单一的访问各种信息资源的入口,企业的员工、客户、合作伙伴等通过该入口获得个性
随着USB技术的飞速发展,USB设备的更新速度越来越快,通过USB接口来升级USB设备固件是一种实用高效的方法,本论文的主要研究内容就是如何通过USB接口实现USB设备固件的升级。
随着对等网络技术的飞速发展,对等网络中共享的文本、图像、音频、视频等数据信息量正以惊人的速度增长,但当前对等网络信息检索仍采用文件名等关键字来描述文件内容,通过布
随着社会经济的发展,航空工业也取得了巨大的发展。由于空中飞行的航空器数量越来越多,因此对地面的管制系统也提出了巨大的挑战。为了确保空中交通的安全与畅通,空中交通管
空中交通管制服务(ATC)是空中交通服务的主要部分,空中交通管制服务的任务是防止航空器与航空器相撞及在机场机动区内航空器与障碍物相撞,维护和加快空中交通的有序流动[1]。
随着现代力学、计算数学和计算机技术等学科的发展,有限元分析软件作为一个具有巩固理论基础和广泛应用效力的数值分析工具,为解决复杂的工程分析计算问题提供了有效帮助,在
目前,国内软件企业急需提高软件过程能力以保持综合竞争力。能力成熟度模型集成(CMMI)不仅在学术界被公认为是软件过程模型的标准,在欧美、印度等业界也获得了巨大成功。CMMI