基于Web的实例扩展与属性值扩充方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:nqwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实例扩展与属性值扩充是Web抽取与集成领域中的一个重要研究课题,将Web数据列表和实例建模成二分图,根据扩展实例的质量分数,对扩展集合进行迭代更新直到扩展集合的质量分数最大,且扩展集合不再更新来实现实例的扩展。同时,为了完善扩展实例的属性信息,对结构化数值属性或离散属性进行抽取,提出了基于整数线性规划的属性值扩充方法。实验表明,与以前的方法相比,本方法能更好地处理含有噪声数据的Web网页,并提高了抽取的准确率和召回率。
其他文献
顺应高素质技能型人才培养的需要,遵循“教、学、做”一体化的教学理念,对药物制剂技术课程体系的教学内容、教学方法、教学手段和教学评价等方面进行改革,以利于学生主体性的发
函数P-集合(functionPacketsets)是把函数概念引入到P-集合(Packetsets)内,改进P_集合得到的,函数P-集合具有动态特性、规律(函数)特性。函数P-集合是由函数内P-集合S^F(functioninter
行政事业单位内部控制工作是单位管理的重要组成部分,是规范单位经济活动和社会经济秩序的重要手段。做好内部控制建设有利于提高行政事业单位的管理水平,也有利于加强廉政风
相异度和相似度度量是聚类算法中非常重要的一种因素,往往会影响到聚类分析的结果。很多聚类算法采用欧式距离作为计算数据相似度的度量。而欧式距离不能反映属性值的全局特性