【摘 要】
:
针对中文实体关系抽取的难点问题,本文在原有的基于Bootstrapping思想进行实体关系抽取的方法上进行了改进.一方面提出了使用《同义词词林》作为计算词语语义相似度的工具,从
【机 构】
:
山东大学计算机科学与技术学院 济南 250101
【出 处】
:
全国Web信息系统及其应用学术会议、全国语义Web与本体论学术研讨会暨全国电子政务技术与应用学术研讨会
论文部分内容阅读
针对中文实体关系抽取的难点问题,本文在原有的基于Bootstrapping思想进行实体关系抽取的方法上进行了改进.一方面提出了使用《同义词词林》作为计算词语语义相似度的工具,从而获取更多的与种子词相似语义关系的特征词;另一方面通过自学习种子集合不断扩展,并利用最终得到的种子信息获取正例.然后使用查询扩展技术从这些正例中生成查询,通过这些查询可以从大量的文本数据库中检索出潜在的文档,减少了抽取的时间.实验结果表明,该方法能够有效地抽取出实体关系,并且有较高的召回率和准确率。
其他文献
存储设计是影响SoC系统性能和功耗的重要因素.在SoC系统级设计过程中,早期存储需求分析,有助于SoC设计与优化并缩短上市时间.本文提出一种面向SoC软硬件划分的多粒度应用程序
解释可满足性模理论(Satisfiability Modulo Theories,SMT)公式不可满足的原因在众多领域都具有非常重要的理论与应用价值,而极小不可满足子式能够为公式不可满足的原因提供
针对用户的个性化兴趣,满足人们对个性化高质量搜索引擎的需求,本文将面向特定领域的垂直搜索引擎与Web信息挖掘技术相结合,构建了可完成个性化Web信息检索的模型.在模型构建
文本分类有助于用户有选择地阅读和处理海量文本,因此其预备工作——分词系统的研究很有意义。汉语分词是计算机中文信息处理中的难题,也是中文文献内容分析中必须解决的关键
1.迄今,有多位科学家的肖像被印在货币上。其中,欧拉的肖像被印在瑞士法郎上。欧拉是18世纪最伟大的数学家,成就斐然,著作等身。“欧拉函数”、“欧拉公式”、“欧拉定理”、
为图像提供替换文本是提高Web可访问性的重要工作之一.我们进行了一系列的研究,得出结论表明,网页中没有替代文字的图像在所有图像中占有相当大的比例.为了解决这个问题,我们
宋书同在《审判南京大屠杀案主犯谷寿夫的回忆》一文中指出:南京大屠杀案主犯谷寿夫毕业于日本陆军大学,为日本侵略运动中的激进军人。一生充任军职,历任陆军士官学校学员,参
本文通过提出Web框架分层解耦,由不同框架管理不同层次的思想,同时在深入研究J2EE核心模式的基础上得出几种计算模式,并在筛选、整合和对比几个具体的开源框架的基础上,结合S
随著网络信息资源的逐渐增长,如何为不同的网络应用系统而不仅仅是针对单一应用系统向用户提供有效的个性化服务已经变得越来越重要。在本文中,在经过对已有的用于网络中多用户
前几日,笔者在深圳见到王石。到场的大多是地产商或地产代理商,大家就集中议论一下房地产行业“过冬”的事情。几乎所有人脸上都带有难色,纷纷为前途担忧。
A few days ago,