【摘 要】
:
为提高中文开源数据集间属性关系识别的准确率,提出一种数据驱动的细粒度对齐方法,综合利用属性的扩展、定义域等对属性间的同义、包含、相关等关系进行统一识别.方法首先利
【机 构】
:
中科院空间信息处理与应用系统技术重点实验室,中国科学院电子学研究所,中国科学院大学
【基金项目】
:
国家高技术研究发展计划(863计划)资助项目(2012AA011005)
论文部分内容阅读
为提高中文开源数据集间属性关系识别的准确率,提出一种数据驱动的细粒度对齐方法,综合利用属性的扩展、定义域等对属性间的同义、包含、相关等关系进行统一识别.方法首先利用统计理论确定属性的数据类型,并给出类型感知的属性相似度计算方法.在此基础上,将属性关系识别建模为多分类问题,抽取有效特征对不同关系进行描述并用于随机森林模型的构建.实验结果表明,该方法中属性数据类型判别的准确率达94.6%,最终对同义、包含、相关关系识别的F1值分别为71.3%,57.3%及59.9%.相比只关注同义属性的传统方法,细粒度属性对
其他文献
课文的背诵,也就是语言的输入,在语言学习过程中有着重要意义,不论是第一语言还是第二语言的习得。这一点在心理学和教育学上都有相关的理论依据。第二语言习得理论认为,语言
学习数学总离不开解题,可以说,使学生牢固掌握数学知识,提高学生的数学能力的最有效的方法就是通过解题教学.关键的问题是如何进行富有成效的解题教学,或者说,怎样的解题教学才能够
即使从来不曾想过留学的人也知道,留学美国需要通过托福或者雅思等英语考试。如今苏州某留学中介机构打出招牌:“不用考托福、雅思,我们出能送你去美国留学”,这是天上掉下来的馅
对兰州市区2002年春季3~4月近地层TSP连续观测资料进行分析,结果表明:(1)兰州市区TSP的质量浓度随着沙尘天气的发生而显著增加,沙尘天气越强,TSP的质量浓度越高,对兰州市区的空气污染
<正> 在研究光泵远红外激光器工作参数优化和工作气体压强最佳值时发现:工作气体压强与远红外激光样品管长度成反比关系;但在高气压区域,理论计算和实验值之间是不相符的。这
利用甘南州8个气象站自建站到2005年的雷暴资料,对雷暴的时空分布特征进行了分析,发现甘南州雷暴多发区位于西南部的玛曲、碌曲到东北部的合作之间;从年际变化看,大部分地方
在教学研究和实践中,我们经常能听到教师抱怨说:"现在的学生真是笨啊,有些问题我都讲了不知道多少遍了,可他们还是弄不明白。"的确,有很多时候,老师教得很辛苦,学生学得也很痛苦
按下快门后不到一分钟,相机就能“吐”出照片来,五分钟从无到有逐渐显影——这就是人见人爱的宝丽来。然而,到2009年底,宝丽来公司将停产所有相机胶片,并逐渐淡出人们的视线。胶片
树林、湖泊、山谷,独门独院,明亮小花园,花草纷芳,宽阔而又气派的大厅。这些能与自然亲密接触的环境,成为别墅消费者梦想的乐园。随着城市的扩大,一批向往山水田园生活的人迁至了郊