基于支撑向量机的人物关系抽取

来源 :第七届中文信息处理国际会议 | 被引量 : 0次 | 上传用户:zkw8229630
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网逐步的渗透在人们的社会生活中,人们试图通过网络扩展交往的范围,寻找自己感兴趣的人并与之取得联系。本文定义了8种人物关系,通过分类的方法实现了自由文本中人物关系的自动抽取.在特征词的选取上,根据抽取对象自身的特点提出了人物主体上下文、人物主体上下文词性、人物分组数与核心特征词四种选择方法,其中核心特征词是结合bootstrapping算法选取的。实验结果表明:分类的方法适合人物关系的抽取,人物分组与核心特征词的选择有利于实验结果的提高。
其他文献
本文针对类词缀在三字词中能产性强的特征,提出构建一个三字词的类词缀知识库.我们对《现代汉语语法信息词典》数据库的8万多词语进行了抽取,共有13778个三字词,然后综合考虑
本文报告对汉英双语香港法律条文内容及层次结构特征进行XML自动标注的工作。标注好的语料库的整体结构与实际法律逻辑组织结构相同,并且利用标记信息实现条文内容的检索定位
数量短语的识别是现代汉语语句分析的一个局部难点。现代汉语中数词千变万化,量词的种类繁多,数量短语的组合方式多样。本文以识别数量短语为立足点,在探讨数量短语构成模型
依存关系的标注一直是近年来计算语言学界语言资源建设的的主流之一。本文从理论研究和实践研究两大方面对国内外依存语法标注的进展做了一个大致梳理,针对汉语依存语法标注
基于Web的信息检索中,用户希望的是得到与关键词(key words)相关的,准确而全面的搜索结果,而基于Web的民文信息检索中深入研究本民族语言特征并对搜索关键词进行一些必要的预
本文介绍了一种以灾难性事件为研究背景,综合信息检索、Web挖掘等多方面知识的灾难性事件信息抽取系统。系统采用了对网页URL相关度评价的收集机制,以框架结构作为信息抽取的
本文设计了一种可行的通用文本信息抽取平台的框架,使得用户可以在平台上轻易的针对不同数据集尝试不同机器学习算法进行信息抽取.按照该框架,我们开发了一个信息抽取平台原
会议
随着空间信息系统研究的不断深入,相关技术的研究越来越受到重视.星间链路作为空间信息系统的重要组成部分,对于系统性能具有重要影响。对于星间链路,除了要研究链路长度、指
调制信号识别对于认知无线电这种智能通信系统具有重要意义。本文提取了反映调制类型显著差异的七个特征参数,并从提高收敛速度和网络识别性能出发,构建了有效识别信号的BP神
央行接连降息,使降息通道渐显,那么,我们又该如何面对降息后的理财生活呢?持有现金,或选择货币基金。降息了,股市也受利好反弹,但因上市公司业绩下滑等因素,熊市并未因此结束