论文部分内容阅读
随着信息技术知识化和智能化的发展,知识服务越来越受到人们的重视。然而,目前知识服务存在着服务语义缺失和服务个性缺失的问题。停留在语法层面上信息和数据表示已经不能满足个性化信息服务的要求。高质量的知识分类体系和针对用户个性化信息的建模成为解决这一问题的必然途径。本体作为从语义层面上表述数据间关系的概念模型是目前常用的知识分类体系。但是,本体的构建方法仍是以手工构建为主,构建效率和更新速度远远满足不了现今互联网发展的要求。虽然,自动化本体构建研究也己取得了一定的成果,实际运用的准确度仍较差。大众分类作为一种新兴的知识分类方法,为用户提供了丰富的元数据,并且隐含了大量的数据关系。然而,大众分类是采用非结构化数据为主,缺乏语义处理机制,对概念的表述也只能停留在较浅显的层面。 针对以上问题,本文通过借鉴知识本体和语义方面的相关研究成果对大众分类进行知识挖掘从而生成一种灵活的可动态扩展的本体模型。同时引入Wordnet中的语义关系进一步丰富和完善分类模型,从领域知识和概念语义的层面更加规范、细致的描述用户个性化信息及资源内容。该方法实现了本体构建的自动化,其中本体概念来自大众分类中用户标记的高频标签,语义关系的获取结合了统计方法和Wordnet语义关系引入两种方式。通过实验验证,构建的概念和语义关系比较准确,同时可以满足本体的动态扩展性,实现了本体不断进化完善的需求。该方法使得本体构建效率和内容更新都有所提高。通过对用户信息及标记行为进行挖掘,本文进一步构建了基于概念本体的细粒度用户偏好模型。用户偏好模型是深层次的个性化信息推荐服务的基础。计算不同用户的偏好的相似度还可以为用户提供潜在社群的推荐服务。 本文对基于大众分类的本体构建的研究为解决当前高效率知识分类体系提出了一条有效的途径,有利于知识的分享和管理。构建动态的用户偏好模型更加细致准确的描述了用户的当前偏好及潜在发展趋势。同时,本研究对构建结构化资源组织方式和为用户提供个性化推荐服务也具有重要意义。