论文部分内容阅读
Web2.0时代,分众分类系统被广泛应用在各种社交分享网站,如:delicious、豆瓣网、新浪微博等。随着分众分类系统在互联网各社交分享网站的广泛应用和发展,使更多的普通上网者参与到互联网信息的创造及发布中。分众分类系统作为一种平民分类方法,其分类标签具有由个人自发性定义;标签分类公开共享等特点,但是分众分类系统标签具有语义模糊、不精确、随意的缺点,导致用户信息发现和分享效率低下。另外,个别标签拼写错误、中文标签分词结构模糊、语义认知在不同语言环境存在明显差异等问题也急需解决。面对分众分类系统出现的发展瓶颈,我们求助于传统分类法。以学科为中心的传统分类法经过多年发展和实践运用,其体系结构已经很成熟和完善。借鉴传统分类法,我们对分众分类进行优化改进,从而提高网络信息组织和分类的质量和效率,即能够运用汉语主题词表的语义关系扩展用户使用的标签,起到推荐标签、实现检索的作用,并对用户标签集的数据进行实时分析,研究用户偏好度,以作为叙词表词汇更新的数据源。本论文首先介绍了论文的研究背景,研究目的及意义。在收集分众分类系统delicious网站用户、标签、资源等数据基础上,分析delicious标签特征。而后对中文标签(教育类)与《汉语分类主题词表》中主题词(教育类)进行比较分析,探讨标签和主题词融合的可能性和技术实现方法,提出了相互借鉴融合的理论模型和方法。接着在对用户分布与资源类型分析的基础上,运用社会网络分析法聚类分析用户群、资源类、标签集,从中找到核心用户、核心资源、核心标签;而后在分类分析(层次分析)和聚类分析的基础上,结合社会行为学知识对用户如何选择资源、如何选择标签等行为详细分析。然后从资源分享情况、标签特点、关注其他用户等方面实例分析一活跃用户具体行为和用户偏好。最后对论文的主要工作与结论进行了总结,并提出了论文研究的不足之处以及课题下一步研究的问题。