全文检索系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:dave463
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着企业规模的不断增加,一个企业内部拥有的文档数量也在不断的增长。由于这些文档的数量较多,并且分布较为分散,这使得企业的业务人员想要获取自己所需要的文档时,会耗费大量的时间和精力。这种情况不但会导致业务人员的工作效率降低,也可能会因为不妥善的管理造成重要文档的丢失,对企业造成十分大的损失。因此设计一套全文检索系统来管理与检索企业中的文档数据具有重要意义。论文首先介绍了课题背景与意义以及论文在实现过程中使用的相关技术,并根据企业的实际业务需求对系统的角色与功能进行分析。根据需求分析结果完成对系统的总体设计、界面设计与数据库设计。最后根据模块化设计思想将系统划分为全文检索、文档管理、文档实时热度排名、系统日志、系统管理六个模块。其中系统管理模块解决对用户信息、部门信息、文档库信息的管理问题。全文检索模块解决用户对文档检索需求。文档段落检索模块可以对上传文档的每个段落进行段落级别检索。文档管理模块帮助用户上传并解析多种类型的文档,并提供修改、删除等功能。文档实时热度排名模块采用实时数据流处理技术实现。首先对用户点击文档行为进行数据埋点,之后进行数据采集,然后通过实时计算得到文档实时点击热度排名。系统日志模块采用日志处理技术将系统日志进行采集,解析,最后可视化的展示。管理员可以通过系统日志功能时刻监控系统的运行、报错、不同用户的访问行为等信息。论文最终完成了对全文检索系统的全部开发工作,系统帮助业务人员管理并检索自己所需要的文档,并为其提供友好的交互页面,提高了业务人员的工作效率。
其他文献
情感具有多维性的特点,在生物、神经、认知、文化和结构等不同层面运行.情感社会学奠基者沿着各自路径强调了不同向度.其中,霍克希尔德的情感劳动理论所代表的认知主义建构论影响最为深远.但经验研究对霍氏的理论命题提出了诸多挑战,而这与其将情感视为被社会文化规范所决定的被动客体密切相关.本文提出不能仅仅将情感视为社会效应,还应关注情感的社会动因面向.在情感社会学的早期理论、心理学的基本情感理论以及跨学科的情动转向中,本文挖掘出被霍克希尔德"心灵的整饰"这一意象所遮蔽的反意向主义情感维度:情感的具身性、非意识性、自治
近年来,正交频分复用(Orthogonal frequency division multiplexing,OFDM)技术在许多无线宽带通信系统中得到广泛应用,然而,OFDM技术对频偏的高敏感性导致其在快时变信道中的系统性能大幅衰减;正交时频空(Orthogonal Time Frequency Space,OTFS)技术的提出正是为了解决这一问题,OTFS的创新之处在于其提出了在时延-多普勒域中
任务型多轮对话系统构建方法主要有基于管道(pipeline)方法的和基于端到端(end2end)方法的。传统的基于pipeline方法的模块数量过多,模块之间存在误差传播,难以全局优化。基于end2end的方法则是将模块之间的信息表征为特征向量,解决了误差传播的问题,但是由于缺少对话管理模块的独立控制,导致模型缺少鲁棒性。针对上述两种对话系统存在的问题,本论文提出了一种新的基于pipeline方法