论文部分内容阅读
随着互联网的快速发展,网上的信息资源越来越丰富。全球网页数量已经超过百亿,每天以百万数量增长。网络已经成为人们日常获取信息的重要方法之一,要想能从海量网页中快速找到自己所需的信息就需要借助搜索引擎。目前由于没有结合语义的理解在自动问答领域中很难分析清楚用户表达的真正意图。尤其是对中文信息的搜索效果常常不理想。本课题是在实名申领信息系统这个领域内进行的研究和测试。本系统研究的自动问答就是在现有搜索技术普遍采用的关键字匹配基础上,加入了词语的语义匹配,问句结构的分析,句法的分析等自然语言处理技术,克服了传统搜索引擎缺乏对语义信息的理解及知识关系的推理能力的缺陷,查找答案的准确率会大大提高。系统开发过程结合理论的研究和实际的应用,采用了关键词匹配、语义分析、句法分析相结合的方法。采用构建FAQ问答库、构建领域本体库,构建领域文本库并在此基础上进行领域知识语义匹配和逻辑推理来实现智能自动问答。在问句分析过程中,借助自然语言处理技术能快速、正确分析出问句意图,并采用多种策略的答案抽取方法。在实名申领信息系统这个领域内通过测试,验证了此方法是有效的。自动问答系统的开发实践结果证明,结合语义分析和句法分析的搜索技术是非常行之有效的,能够快速的并且更加的准确的返回用户需要的答案。同时在课题的研究、开发与应用的实践中,总结出了进一步改进和完善答案搜索的方法,为进一步的研究工作打下了良好的基础。