关系抽取中学习算法的研究

被引量 : 0次 | 上传用户:AsiaITt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,各种各样的信息大量的出现在人们面前。人们很难迅速地找到需要的信息。为了节约人们宝贵的时间,迫切的需要一些自动化的工具帮助人们在海量数据源中迅速地找到需要的信息。信息抽取的研究正是在这种背景下产生的,关系抽取是其中任务之一。关系抽取的任务是判断一句话中的两个实体是否形成某种预先定义的关系。通常,将关系抽取问题转化为一个分类问题。与解决其他分类问题一样,本文首先对关系抽取问题中的特征提取进行了研究。将自然文本中的关系实例表达成学习算法能够使用的方式并确定实例间的相似度计算公式。本文通过对关系数据的分析完成了特征提取。通过对相似度度量方法进行研究设计了实例间相似度计算公式。然后,本文使用了支持向量机(SVM)和最近邻算法(NN)对特征提取结果进行实验检验,取得了较好的实验结果。在分类过程中,不同特征通常具有不同的相关(重要)程度。通过赋予每个特征一个恰当的权值可以提高分类的效果。本文对特征加权(feature weighting)方法进行研究,针对NN算法提出了特征权向量学习算法:PSO-NN算法。本文通过赋予相似度计算公式中的每个特征不同的权值,并使用PSO-NN算法对特征的权值进行优化,提高了在使用NN算法进行关系抽取时的性能。最后,本文设计并实现了关系抽取实验平台。在该实验平台下,可以集中精力进行关系抽取中特征提取和学习算法研究,并快速进行实验,节省了时间。
其他文献
词的理据指词表示某一意义的理由和根据。应用词的理据可以帮助学生记忆单词,在中文和英文教育中,已经有很多应用词的理据的教学法。目前,在对日语的研究中,词的理据还未受到
目的观察对功能性子宫出血患者应用中西医结合治疗的效果。方法随机将2013-12-2015—01间收治功能性子宫出血患者分为2组,每组30例。对照组采用西医治疗,观察组患者使用中西医
本试验选用番茄、黄瓜两种作物做为试材,通过热激处理、ABA处理和低温锻炼三种方式对番茄、黄瓜幼苗抗冷性影响的研究,以及外源Ca2+处理对番茄、黄瓜幼苗热激效果的影响,得出了
在互联网时代,报纸面临严峻的考验和挑战,也迎来前所未有的发展机遇。一方面,网络的即时性、无限性、互动性、创意性,对报纸的组织和传播方式造成了冲击;另一方面,网络也给报
本论文基于某型导弹电视导引头系统研究项目,主要研究其模拟体制的图像处理系统,并在此基础上,进行了电视导引头数字图像采集与处理系统的研究。该系统是为了实现数字视频信号处
<正>清明上河园是中国著名古都河南开封的一座大型历史文化主题公园,它是依照北宋著名画家张择端的传世之作《清明上河图》建造的,于1998年10月28日正式对外开放。在大众传播
人民法院审判团队改革是司法改革的一项重要内容。目前,学者们对审判团队改革进行了一定的研究探讨,但存在“能破而未立”、缺乏明确化、具体化对策建议等问题;最高人民法院
唐代和亲政策是唐代采用最广泛的安边方式。据统计,唐代与少数民族和亲28次之多。28次的和亲在不同的历史背景下有不同的特点,呈现不同的类型,并衍生出丰富的文化现象。
当前,中国城市社区建设正以前所未有的速度在全国范围内展开,社区建设过程中产生的一系列理论问题也引起了多方关注。如何借鉴国外经验,结合本地区实际,形成有中国特色的社区建设
青年奥运会发源于欧洲青年奥林匹克节、澳大利亚青年奥林匹克节等。其存在项目流动性强、传媒关注度低等问题。应关注青年奥运会,关注青少年体育的发展。