【摘 要】
:
目前大多数的Deep Web信息抽取方法依赖Web页面结构,忽略了页面中包含的语义信息及关系,导致抽取结果不理想.针对此问题,提出一种基于领域本体的Deep Web实体信息后处理方法.
【机 构】
:
安徽工程大学计算机与信息学院,安徽工程大学计算机应用技术重点实验室
【基金项目】
:
安徽省教育厅基金资助项目(20138020).
论文部分内容阅读
目前大多数的Deep Web信息抽取方法依赖Web页面结构,忽略了页面中包含的语义信息及关系,导致抽取结果不理想.针对此问题,提出一种基于领域本体的Deep Web实体信息后处理方法.首先,根据DOM树节点相似性原理和VSM(Vector Space Model)的余弦值方法确定数据区域和实体区域;然后,依据数据区域和实体区域的概念和实例构建领域本体,在领域本体的指导下对实体进行语义标注,将量化的标注结果添加到实体与本体的相似度计算中;最后,提出基于领域本体的实体信息抽取算法,获得实体中与本体相似度最大的
其他文献
随着时代的不断进步,科技日新月异,只有靠逻辑思维能力和抽象逻辑思维能力的相互结合才能跟上科技和时代的发展.高中物理是一门逻辑性很强的学科,其对抽象逻辑能力的要求相对
在语文课堂教学中,课堂设疑提问的质量直接影响着教学的质量,影响着学生思维的训练.如何精巧设问,才能使思考不再是学生精神上的负担,而是一种身心上的愉悦呢?我认为教师一定
作为高考热点和重点的同分异构体,学生经常出现书写错误,判断不全的情况,为解决这个问题,提高答题准确率,学生就要熟悉同分异构体的异构形式,掌握同分异构体的解答技巧,做到全面、有
抗日战争时期,“汉奸们横行无忌:在战区则援助敌人,在后方则肆行捣乱”[1]376,给中华民族的抗战造成极大的破坏。中国人民抗日战争之所以达八年之久,是与汉奸、伪军的罪恶行
从微博里读到这么一个小故事——一位青年总是碌碌无为,于是去找智者。智者说:“帮我烧壶开水!”墙角正放着一把极大的水壶,旁边是一个小火灶,可是没柴火 。
摄影专业人才的摇篮华光摄影学院是中国第一所私立摄影高等学院(前身为华光摄影成人中等专业学校),创办于一九九二年。世界著名摄影大师郎静山先生亲笔为学校题写校名,校训,并担任
8月13日至16日,以四川省档案局副局长张新为组长的全国社会主义新农村建设档案工作示范县验收组对大连庄河市、金州新区创建全国社会主义新农村建设档案工作示范市(区)工作进行
陶行知先生指出:“教育是要在儿童自身的基础上,过渡并运用环境的影响,以培养加强这创造力,使他长得更有力量,以贡献于民族与人类,教育不能创造人才什么,但他能启发解放儿童创造力以
在现有信息成长模式的基础上,对中文数据库中收录的以信息为主题的文献信息作为数据源,然后运用文献计量学方法分析了信息研究领域的学科、机构、作者等分布。结果发现,国内在信