【摘 要】
:
实体关系抽取是信息抽取的重要组成部分.基于核函数的中文实体关系自动抽取系统应用改进的语义序列核函数,结合KNN机器学习算法构造分类器来分类并标注关系的类型.通过对ACE
【基金项目】
:
上海市科委国际合作基金项目(045107035);中德语言技术联合实验室德方资助项目
论文部分内容阅读
实体关系抽取是信息抽取的重要组成部分.基于核函数的中文实体关系自动抽取系统应用改进的语义序列核函数,结合KNN机器学习算法构造分类器来分类并标注关系的类型.通过对ACE评测定义的三大类6子类实体关系的抽取,关系抽取的平均精度可以达到88%,明显高于基于特征向量和传统的序列核函数方法,该方法适合小训练集,易于学习新的实体关系.系统由8个独立的模块构成,便于维护和升级.系统既可以独立运行,也可以嵌入在开放的文本处理平台GATE环境.为了更好地利用关系抽取的结果,系统扩展传统的二元关系,抽取关系的同时,抽取该关系的描述,形成完整的中文实体关系抽取系统.
其他文献
使用了基于最大熵的方法识别中文基本名词短语 在开放语料ChineseTreeBank上 ,只使用词性标注 ,达到了平均 87 4 3% / 88 0 9%的查全率 /准确率 由于 ,关于中文的基本名词短
在论述流域水土保持型生态农业模式设计的内涵、原则和技术路线的基础上,以澧水流域慈利县为例,结合该流域发展生态农业的潜力、优势与障碍因子分析,因地制宜设计了不同类型的水
<正>毛泽东同志曾经指出“应该使受教育者在德育、智育、体育几方面都得到发展”。而这种全面发展并非是一个简单相加的问题,诚如苏霍姆林斯基所说:“没有单独的智育,也没有
小型农田水利建设是保证农民增产、增收、国家繁荣稳定的基础保障设施;加快小型农田水利建设对于国家的农业产业结构调整和经济的发展来说十分重要。在我国经济体制转轨的过
<正>2014年12月,大连合成纤维研究设计院股份有限公司与山东天鼎丰非织造布有限公司共同承担的"高效节能聚酯纺粘针刺防水卷材胎基布成套装备关键技术与产业化"项目通过由中
本文以印度授予的第一起药物专利强制许可为例,概述了对药品授予强制许可的主要理由和重要意义。该案不仅从政府层面宣示了对强制许可理念的思考和运作,也给各国希望和有能力
知识产权服务业是现代服务业的高端环节,是高技术服务业的优先发展领域。本文以部分省市调研结果为基础,梳理了我国知识产权服务业发展的基本情况,阐述了知识产权服务业在经
提出一种新的基于混沌系统及Henon映射的图像加密算法·使用经过取模处理的可逆二维非线性Henon映射对各像素点的灰度值进行链式循环迭代,每个迭代环节中Henon映射的参数与迭
隐喻是人类普遍存在的一种思维方式,也是一词多义现象产生的一个重要因素。英语中的一词多义现象就是人类通过认知手段由一个词的中心意义或基本意义向其它意义的延伸,隐喻认