论文部分内容阅读
Web向社会化与语义化的不断演进和信息资源组织理论的不断革新共同促生了folksonomy并推动其不断发展,而folksonomy的不断优化又离不开folksonomy知识发现理论的支撑,同时形式概念分析、本体等理论的发展又为folksonomy知识发现注入了新的活力,一种基于形式概念分析的folksonomy知识发现理论呼之欲出!回顾当前folksonomy知识发现理论的优势劣态,虽在folksonomy知识发现的各个主要方向取得了一些散落的成果,体现于folksonomy用户行为、folksonomy用户偏好和folksonomy语义关系等方面,但仍未建立完善的将三者统一到一套完整框架下的Folksonomy知识发现理论体系,更缺少对对Folksonomy知识发现的基本原理、基本方向、目标产物、技术工具和详细流程等全面介绍与阐述。基于形式概念分析的folksonomy知识发现理论为弥补上述缺陷提供了可能。在确立folksonomy是数据,形式概念分析是工具,知识发现是目标的角色定位后,基于形式概念分析的folksonomy知识发现螺旋演进模型应运而生,其高度概括了基于形式概念分析的folksonomy知识发现的组成要素、角色要素、功能要素及各个要素之间的紧密关系,并将基于形式概念分析的folksonomy知识发现过程归纳为问题定义、数据获取、数据准备、数据组织、数据挖掘、知识生成和评估反馈七个阶段。另外,在用户需求和数据组织的一唱一和下,基于形式概念分析的folksonomy知识发现核心方向的歧化也通过folksonomy多值形式背景的选择得以实现,folksonomy的用户行为背景、用户偏好背景和语义关系背景分别决定了基于形式概念分析的folksonomy知识发现的三大方向。基于形式概念分析的folksonomy用户行为分析以单用户的用户标记行为、用户群的聚集与形成、用户群标记行为和用户群的遴选为知识发现目标,通过基于形式概念分析的folksonomy用户行为分析模型,先利用folksonomy数据集构建相应的folksonomy用户行为形式背景——“用户-标签”形式背景FU:= (U,T×R,YU)并将其转换为folksonomy用户行为概念格,并在folksonomy用户行为概念格分析的基础上使用回溯法获取folksonomy单用户用户标记行为链,使用用户群层级结构映射规则获取folksonomy用户群层次树,使用FREtirj计算公式获取folksonomy用户群标记行为频率,使用folksonomy用户群遴选的规则遴选出folksonomy典型用户群。folksonomy用户行为分析为folksonomy用户偏好挖掘提供活跃用户、典型用户群及folksonomy用户标记行为频率等参数,为folksonomy语义关系发现提供低频标签过滤、稳态folksonomy系统判断及语义浮出判断的依据。基于形式概念分析的folksonomy用户偏好挖掘以folksonomy用户偏好树的构建为目标,通过基于形式概念分析的folksonomy用户偏好挖掘模型,分别从活跃单用户和典型用户群的用户偏好各自的数据集出发构建相应的folksonomy用户偏好形式背景——“资源-用户”形式背景FR:= (R,U×T,Y~R),并分别将单用户folksonomy用户偏好形式背景和用户群folksonomy用户偏好形式背景转化为各自的用户偏好概念格。通过在概念格基础上识别用户偏好,并借鉴TF/IDF原理充分考虑了用户偏好的“频率”和“普遍重要性”两项因素,分别提出了folksonomy单用户偏好权重计算公式和folksonomy用户群偏好权重计算公式,进而分别利用相应的用户偏好权重计算公式(PW公式)和用户偏好相似度计算公式(PS公式)遴选单用户的用户偏好和用户群的用户偏好,最终构建folksonomy用户偏好树来表示folksonomy用户偏好知识。基于形式概念分析的folksonomy语义关系发现以发现folksonomy中的隐含语义为目标,确立了本体在folksonomy语义关系表示中的重要作用,通过基于形式概念分析的folksonomy语义关系发现模型,从“语义浮出”的稳态folksonomy的数据集出发构建相应的folksonomy语义关系形式背景——“资源-标签”形式背景FR:= (R,T×U,Y~R),并将之转化为相应的概念格。在folksonomy语义关系概念格基础上,利用folksonomy语义关系概念格向folksonomy局部本体的映射规则,得出相应的folksonomy局部本体模型,之后选用合适的本体编辑工具(如protégé等)和本体描述语言(如owl语言)对folksonomy局部本体模型进行形式化,最终得到一个形式化的揭示folksonomy各种隐含语义关系的folksonomy局部本体。基于形式概念分析的folksonomy知识发现的理论体系充分利用了folksonomy多值形式背景的不同形式适宜地表示了folksonomy知识发现的三大核心方向,并针对不同类型的概念格分别提出了相应的模式识别和知识解释方式,从而依托概念格实现了folksonomy知识发现。另外,基于形式概念分析的folksonomy知识发现的螺旋演进思想也为获取用户满意的folksonomy知识提供了保障。经过在Delicious系统数据的测试,基于形式概念分析的folksonomy知识发现理论具有创新性、科学性、合理性和操作性。基于形式概念分析的folksonomy知识发现理论不仅深化了folksonomy理论研究,也拓展了知识发现理论的内涵和外延,最重要的是揭示了基于形式概念分析的folksonomy知识发现的客观规律。该理论必将提高folksonomy系统中知识发现的效率和能力,进而带来folksonomy自身的不断优化,最终促进web2.0下folksonomy的不断发展和广泛应用。因此,无论是理论上还是实践上,基于形式概念分析的folksonomy知识发现理论都具深远意义!