论文部分内容阅读
随着云计算和互联网技术的发展与广泛应用,以大规模服务器集群作为存储介质,以高速互联设备作为传输载体,以服务计算和社交元素为基础的开放式的因特网分布式资源已经成为世界上数量最多、种类最为丰富的信息资源。但是,由于资源的不确定性和海量特征,也直接或间接的导致了领域信息获取的难度,垃圾和冗余信息筛选成本的梯度式增加,以及计算机硬件基础设施和软件系统的粗放式扩充。因此,如何在分布式信息源中针对特定领域,采用开放式的系统以自动或半自动的方式感知、采集、跟踪、应用环绕于个人或企业边界的具有商业价值的信息和服务,比如企业的产品、技术、专利、金融、财务、SNS(SocialNetworking Services)资源、医疗信息,已经成为服务计算重要的研究和发展课题。本文以传统的信息采集和Web信息抽取技术(Web Information Extraction,WIE)、面向服务的开放式软件体系结构为理论基础,设计并实现了面向智能商务领域的、基于SOA(Service-Oriented Architecture)的知识感知系统。主要的工作体现在:(1)设计一种面向商务智能领域的开放式软件体系结构(Business IntelligenceOriented SOA,BIOSOA)。本文参考业界成熟的SOA实现模型,以商业应用内的领域实体和业务逻辑为元素,设计出可持续性演进的、支持以插件方式开发的、面向服务的体系结构,实现系统功能组件的动态性配置和降低IT成本的良性软件生态系统(Software Ecosystem)。(2)以BIOSOA体系结构为参考模型,设计并实现环绕商务智能感知系统(Ambient Business IntelligenceAwareness System,ABIAS)。论文中详细的探讨和研究了如何有效地从分布式数据源中感知面向领域的知识,并建立感知模型的过程,以及如何将传统的感知系统模块转化为服务组件和组件的交互方式。系统涵盖了分布式信息源服务管理、领域数据库建模、核心算法服务组件、可配置ABIAS采集器设计与实现、领域信息抽取服务组件、数据仓库设计与实现、人性化报表展示、Web服务实现和集成等功能。