基于互联网的智能问答系统关键技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:lyh682020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,大规模开放网络课程MOOC引发全球的关注和参与。自动答疑是MOOC平台中重要的辅助教学模式,采用问答系统实现自动答疑是目前研究的热点内容。目前国内多数教学问答系统对用户问题的理解仍然局限在关键词匹配和FAQ库检索的模式。但是,特定课程领域问答通常涉及对领域专业词汇的理解,而关键词匹配的方式不能达到此要求;同时,FAQ库资源有限,对于超出其范围的问题无法回答。因此,现有的教学问答系统智能性和开放性不足,不能满足用户需求。  针对以上问题,本文提出了针对特定课程的基于互联网的智能问答系统模型,通过构建课程的知识结构体系来实现对领域专业词汇的理解,并且利用内容丰富的互联网资源对FAQ库进行补充。当FAQ库中检索不到有效答案时,系统为用户问题自动制定检索策略,通过搜索引擎对互联网信息进行检索,并且结合领域背景知识对检索结果进行处理,最终形成易于理解的答案返回给用户,并进行FAQ库自动扩充。  本文的主要工作包括:  1)分析课程知识语料,采用领域知网作为课程知识表达模型,通过填充课程内容构建课程的知识结构体系,并且在此基础上提出基于互联网的智能问答系统模型。  2)研究互联网信息检索技术,提出检索策略,通过领域知网的丰富语义对用户的自然语言问题进行语义理解,结合搜索引擎使用技巧生成检索内容提交给搜索引擎,并获取检索结果。  3)研究影响搜索引擎检索结果排序的因素,提出基于特定课程领域的用户问题与网页内容相关度计算方法;同时综合考虑页面的内容相关度和重要度两项因素,提出用于页面排序的权重计算方法。  4)研究答案抽取技术,提出段落检索算法用于提取页面文档中与用户问题相关度最高的段落,将其作为用户问题的答案。  5)在上述研究的基础上,设计应用于特定课程的基于互联网的智能问答系统——Doraemon,最终实现Doraemon原型系统并进行了必要的实验分析。实验结果表明,本文提出的Doraemon系统能为用户提供兼具准确性与有效性的答案。
其他文献
目前,部分石油公司已采用石油客户卡进行油品销售。使用IC卡,减少了由于油价波动给企业带来的经济损失;使油品调拨合理、科学,降低了运输成本;加速了财务、业务、储运信息流
特征提取是模式识别中的一个关键步骤。提取包含丰富判别信息的特征对于模式识别系统来说,具有非常重要的意义。而且,近年来,随着生物特征识别技术和相关应用的发展,对特征提取算
电子选举是采用电子化手段进行注册、投票和计票的选举形式。电子选举方案的研究主要包括Mix-net方案、盲签名方案、同态加密方案和各种特殊形式的电子选举方案。这些方案各
互联网的飞速发展使人与人之间的交流超越了时间和空间的限制,打破了国家与地区间有形和无形的壁垒,实现了全球性的资源共享,但同时也对网络安全提出了新的挑战。 入侵检测系
企业生产过程中产生的各种数据是企业进行生产管理、实施生产控制、乃至生产决策的重要依据。因而,数据采集已经成为企业生产过程中不可或缺的重要环节,成为企业科学管理,安
在20世纪90年代中期,Shor量子因子分解算法和Grover量子搜索算法的相继提出,引起了人们对量子计算与量子信息的极大兴趣,这是因为这两个算法充分展示了量子计算机在某些方面能够
随着IP(Internet Protocol)技术的日益成熟,光靠降低通信价格和提高话音质量的IP终端已经无法满足人们日益增长的个性化需求,也很难在日渐白热化的市场竞争中占有一席之地,电信
学位
可靠性是机电产品的重要质量指标,本文依据机电产品的特点详细介绍了可靠性试验、可靠性特征量、寿命分布类型和失效分析等可靠性理论,为信息管理系统和寿命数据解析系统的开
计算机的普及以及计算机网络技术的成熟与发展,为基于Web的远程教育提供了发展的契机。Internet上多媒体通信的发展引发了对传统教育模式的新一轮革命,以网络为特征的多媒体
嵌入式图形用户界面通常具有空间占用小、运行速度快、控件丰富、开发周期短、稳定可靠等特征。X Window(通称X)作为Linux系统领域最为成熟的窗口系统,可支持多种风格的用户