论文部分内容阅读
随着互联网的普及和旅游业的蓬勃发展,旅游信息量激增,旅游大数据时代随之而来。然而现有的旅游数据资源,一方面呈现多源、异构、非标准化的特征,为旅游信息的分类集成与管理造成困难;另一方面,旅游数据资源缺乏时空语义关系,存在语义缺失、语义模糊等问题,使得旅游数据资源成为一个个‘知识孤岛’,无法实现高精度旅游信息的语义检索。本体是对领域内共享概念模型的形式化表达和规范说明,具有良好的概念层次结构和语义关系,通过为海量数据资源添加语义标注,实现多源异构信息的互联互通,解决信息的语义异构问题,对于数据资源的管理与共享具有重要的意义。在旅游领域,已有学者将旅游相关的知识、信息等内容抽象和概括为具有共识的概念,按照其层次结构组成可共享的知识体系,并用计算机可理解的语言对其进行形式化表达,构建出旅游空间本体。然而,已有旅游空间本体的研究仅涉及部分要素,缺乏对旅游活动全过程的考虑,导致旅游空间本体的概念体系不够全面,限制了旅游空间本体的应用范围。因此,亟需构建概念体系全面、结构完整的全要素旅游空间本体模型,为旅游领域本体提供统一参考。现阶段,本体构建以手工方式为主,通过领域专家手工搜集信息并构建本体,构建过程缓慢、费时费力,难以满足海量、多源、异构数据管理的需求。因此,如何快速构建大规模旅游空间本体,成为旅游空间本体研究的关键问题。众包技术,是一种把过去由特定员工执行的工作任务,以自由自愿的形式外包给非特定的网络大众的做法,众包数据具有来源广泛、现势性强、成本低廉等特点。众包作为一种开放式集合互联网大众智慧的协同工作方式,可有效解决本体构建过程中数据获取的瓶颈问题,支撑本体的构建工作。因此,本文开展基于众包技术的旅游空间本体构建方法研究与实践,提出了全要素旅游空间本体模型,设计并开发了旅游空间本体构建系统,实现了众人协同构建山东省旅游空间本体。具体研究内容与成果如下。(1)建立了可共享的全要素旅游空间本体模型。通过系统调研旅游者在旅游活动中涉及的吃、住、行、游、娱、购等行为,重点分析了旅游领域内旅游者、旅游景区、旅游资源、旅游设施、旅游服务机构及从业人员等相关概念的内涵与本质,定义了旅游空间本体模型及其概念体系、属性和关系,建立了概念体系完整、属性全面、关系丰富的全要素旅游空间本体模型,为众包系统的设计提供了语义支撑。(2)设计并实现了基于众包技术的旅游空间本体构建系统。在全要素旅游空间本体模型的指导下,设计开发了基于众包技术的旅游空间本体构建系统,包括数据标注功能模块、数据质量控制模块、旅游空间本体数据查询与展示模块、系统管理模块。引导志愿者在地图上标注旅游空间对象并填写其属性和关系数据,同时采取志愿者投票和管理员审核相结合的方式保证众包数据的质量,实现了从获取众包数据到构建旅游空间本体的完整流程。此外,为用户提供旅游空间本体的数据查询与展示服务,以本体知识图的方式直观展现旅游空间信息。(3)以山东省旅游空间本体构建为例开展了实践。以山东省为例开展实验,召集志愿者参与众包活动,在系统引导下贡献旅游空间数据,实现了由众人协作的山东省旅游空间本体构建。综上所述,本文提出的基于众包技术的旅游空间本体构建方法,实现了本体构建工作与众包数据采集工作的结合,解决了本体构建过程中数据获取的瓶颈问题,避免了手动构建本体的复杂过程,提高了本体构建与更新的效率,对分散、多源、异构的旅游空间数据资源的组织管理具有重要意义。此外,通过众人协作的方式构建旅游空间本体,为其他本体的自动化构建与更新工作提供了新思路,本文的方法对本体构建工作具有一定参考意义。