基于跨领域本体互联的数据融合平台

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lm4194
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代飞速发展的今天,每时每刻各个领域都有成千上万的系统采集着数据。解决实际生产活动中的问题时,我们通常需要同时利用这些领域数据集。而不同领域的信息系统由于构建方式、存储形式和领域背景的不同,容易形成信息壁垒。传统的数据融合技术仅作用于相同领域下的不同数据集,对跨领域的数据集还没有很完备的方法体系。因此,将不同领域的数据进行抽取和融合,既是现代越来越复杂的应用的迫切需求,也是数据融合领域技术上的重要挑战。针对以上问题,本文提出了基于跨领域本体互联的数据融合方法,采用本体的技术解决不同领域间的数据融合问题。通过领域本体的连接,支持数据和信息的融合。由于跨领域本体在知识背景、概念维度和构建方法上存在诸多不同,因此本文有针对地提出适用于跨领域本体的匹配方法,建立起多领域本体网络,形成领域间的数据共享平台。本文的研究工作主要有以下几点:(1)提出了跨领域本体网络的模型本文针对互联网上存在的众多独立本体提出了跨领域本体网络的概念,挖掘不同的领域本体间的概念合集,以图的方式组织这些本体。该模型具有很高的通用性和扩展性,存在概念交集的本体均可通过本模型实现连通,同时在业务扩展时,支持新的领域本体动态接入。(2)针对跨领域本体的特点,设计了本体匹配方法不同领域的本体在描述语言、知识背景和概念维度上都各不一致,因此传统的本体匹配方法还不适合这类匹配需求。本文设计了一种“乐观匹配”的方法,首先采用文本匹配,将两个本体进行初级连接,再利用结构关系发现更多的概念和实例匹配。(3)利用各领域构建语料库,从多角度实现了语义排歧根据各个领域的知识背景不同的特征,构建领域语料库,作为系统进行语义学习的基础。同时采用多层过滤的方法,利用词性排歧、结构排歧和关联义项排歧的方法逐层过滤错误的概念匹配,进一步提高本体匹配的准确度。(4)通过本体网络的建立,实现跨领域的数据融合利用构建的本体网络,可发现某个概念在不同领域的信息侧面,并有针对性地抽取各部分数据,重新组合后对数据更为全面地描述,是数据共享和知识发现的基础。本文围绕跨领域本体网络,分成本体构建、本体匹配、词义排歧和跨领域本体网络构建这几部分内容展开,针对跨领域的数据特征,设计并验证了融合方法。通过本体的连接,支持跨领域的数据融合。最后使用茶产业与电子商务结合的案例进行了场景验证,证实本文提出的方法对于跨领域的数据融合具有较高的通用性和完整性,可用于日益复杂的跨领域业务需求。
其他文献
宁家河流域属西北干旱内陆河流域,具有丰富的自然资源,但是生态环境脆弱,水资源可利用量较少,区域经济的可持续发展受水资源制约严重。总结了宁家河流域径流的年内、年际变化
对新疆某闸室的结构进行了设计,为水库的按时下闸蓄水提供了有力的保障,对类似工程有一定的参考价值。
讨论了学员课外科研活动组织实施过程的具体注意事项,包括课外科研活动的目的、对指导教师的选择和要求、参与活动的学员的选择、课题的确立和考核办法.对该活动的进一步推广
2011年的大旱给鄂尔多斯市带来了严重的经济损失。此次干旱形成的主要原因是气候异常,降水稀少,但许多人为因素也在一定程度上加剧了旱情。通过对鄂尔多斯市各产业的用水调查,提
2011年12月23日,《鹿鼎记》年度大型资料片“龙脉传说”震撼上演,众多绚丽闪亮的新内容随之登场,瞎了笔者那双800度的深度近视眼。你若不信,我随意列举几个给你讲讲。
针对北京地铁7号线百子湾站基坑开挖后,出现大量渗漏的情况,采用疏干井抽水、分段开挖挂网喷混凝土支护、截断从基坑东边流向西边的水源、增设应急预案降水井、水不漏等速效堵