论文部分内容阅读
借助互联网技术的发展,网络信息的增长呈现出惊人的速度。每天面对海量的信息,我们常常手足无措。为应对这个信息爆炸的时代,自由分类法应运而生。
自由分类法,Folksonomy,是由美国学者Thomas Vander Wal于2004年8月在Aifla(阿斯罗玛信息架构研究所)的一次邮件列表中提出的。Folksonomy,是“Folk”(民间、名俗)和“Taxonomy”(分类法)的组合,故名思议,该分类法产生于民间,其操作者是一般的网络用户,而并非专业人员。因此,自由分类法也被称为大众分类法、公众分类法、民俗分类法、通俗分类法和社会分类法等。它是用户根据自己的需求和主观感受,以标签为类目的“自上而下的社会化分类”信息组织方法。由此可见,自由分类法是个人用户为了其检索的需要,对特定信息资源自由添加一个或多个标签来对其进行组织,并最终根据标签被使用的频次选用高频标签作为该类信息类名的方法。
目前已经有许多网站利用了自由分类法,如delicious:https://delicious.com ;Flickr:http://www.flickr.com/ ;抽屉书签:http://dig.chouti.com/ ;豆瓣:http://www.douban.com/ 等等。通过对于部分网站的实战操作与分析,我们可以得出自由分类法突出的优势和存在的问题,并据此提出了几点可能的改进建议。
1.自由分类法的优势
以用户为中心,充分体现用户个性化特点:
自由分类法是由网络用户根据自己的认知、规则创建的,通过标签的形式来定义自己的信息特征,可以说是用户为满足自身的信息需要而产生的。自由分类法的类目是由标签组成的。标签首先由用户自己定义,如果有一个或者多个标签被最多地用来描述同类信息时,它们就被确定为该类信息的类目名称。用户不再是被动地接受网络分类,而是成了网络信息的生产和管理者。用户有权在相应社区中对于自己有用的信息按个人习惯、兴趣爱好等添加标签,以便管理和检索。因此自由分类法的类目体现了网络用户的个性化特点,同时又代表了所有网络信息用户的共性。
如豆瓣音乐标签,他们都是根据用户个人的定义,最后综合得出的。同时我们也看到,一些热门的标签被放大,可以很好地让我们了解当下的流行趋势。
同时,有些网站还具有像豆瓣猜这样的内容,可以根据用户平时的浏览记录,分析用户读过、想读、在读、评价等行为,为用户从海量数据里挑选其可能感兴趣的内容。
1.1有效提高检索效率
自由分类法是非等级的。用户不必从根目录开始经过几级类目才找到所需要的信息,因此能在很大程度上节省查询所需的时间。目前网络门户的信息组织方法是以分类组织法、主题组织法为主进行信息组织活动的。它们大多通过层层划分,按照从总到分的原则逐级展开,用户为了找到信息通常需要层层搜索,以至于浪费了大量的时间。对于主题词的设置有些也不是从用户的角度出发的,不符合用户的检索习惯。此外,有些网站还存在类目设置不准确、划分不合理等弊端,导致检索的信息存在大量的冗余。而自由分类法进行信息组织时是根据个人的理解,对于特定信息赋予一个或几个特定标签,能从不同的侧面揭示对信息内容的理解认识,同时分到不同的类目中。实现了在同一站点时空内以多种方式整合网络信息的可能性。并通过对信息之间的多位关系进行全面揭示,可以帮助用户从多个角度接入信息,满足用户的多种需求,极大地方便了用户,在提高了信息被利用的可能性和利用效率的同时也提升了网站本身的可用性。
1.2快速适应词汇动态变化,吸纳新词
自由分类法是动态变化的,容易更新。传统分类法只能在分类体系已经设定的类目中对号入座,对于新出现的难以对号入座的新理论、学科、事物、技术、材料等主题概念常常只能归入上位类或者靠类。而自由分类法的类目标签是由用户直接用自然语言进行标注的,具有显著的动态性,标签总图能够清晰直观地反映自由分类法的这种动态变化。通常,随着用户和资源规模的扩大,新的标签会不断进入系统中,并作为新的标签出现在标签总图上。如果某些标签被越来越多的用户使用,其对应的标签云面积也越来越大,在标签总图上就会越来越明显。相反,对于一些曾经热门而如今不怎么被关注的标签则会被更多更大的标签云所吞噬,甚至最终被取代。
1.3简单易用
简单易用体现在用户不需要经过专业的训练就可以使用。传统分类法严格遵循学科性原则,有复杂的标引技术和严格的分类规定,只有经过专门培训的专业人员才能掌握这方面的技能,进行分类标引工作。而自由分类法最大的特点就是自由,标签的用词不必受到各种分类表或工具的束缚,分类技术不必经过专门培训。用户标签可以根据个人习惯、认识、理解和兴趣爱好等对网络信息资源进行分类和整理。
2.自由分类法的缺陷
2.1存在垃圾标签
由于缺乏控制,标签的质量参差不齐。有些用户出于个人目的,故意将某些信息加上瞩目的标签,影响了信息标引的准确性。
2.2标签泛滥、不规范一定程度上导致了信息的分享和交流
由于用户的文化程度、语言习惯、认知水平和兴趣爱好的差异,使得他们对于相同的信息内容会形成不一样的分类标签。用户通常首先考虑的是自身的使用和重要性,因此单个用户上传的标签,反映的是个人的兴趣爱好。用户越多,标签也就越多,最终会导致标签难以控制。
2.3不能提供与、或、非式检索
如在flickr上查找有关信息化图片。如果输入信息化or数字化是查找不到任何结果的。只能输入其中的一个词检索。
2.4关系揭示不全面,限制了查找新资源的途径
在系统中的信息在整体上的组织是一个用词构成的平面结构,并不存在根节点,标识信息的标签或者是按子顺显示或者随机罗列面上,无法揭示标签之间的复杂关系。在查找信息的时候可能不清楚类目的上位类和下位类,减少了检索的切入点。
3.改进建议
3.1设计合理的元数据,建立可控的、动态发展的元数据词汇表
为应对多义词、同类词不规范所造成的交流障碍,我们可以通过设计元数据词汇表的方式来解决。用户在建立标签的时候,可以选择词汇表中的词任意组配描述信息。必须注意的是词汇表中的元数据必须经常更新,以适应高速发展的信息社会。在描述某些特定用语的时候则需要符合一定的规范,这些规范预先设立规则。比如关于苹果的标签,可以加上限定,“苹果(水果)” 和 “苹果(电子产品)”;或者对于一些可以用多种方式表达的信息内容,限定其只有一种标签。如“自由分类法”,只能用“只有分类法”标签,而限制用户用“大众、分众分类法”来标签。
3.2运用记忆功能,增加检索效率
在delicious上操作,我们可以发现,书签的排序是按照字母排列的。每次查找信息都需要一次搜索。如果对于某一高频使用的书签,每次使用都需要搜索一次将是麻烦的。如果能够增加使用记忆功能,将经常使用的书签置于顶部,那么就能在很大程度上提高检索效率。
3.3对于不同类别的信息能够先进行基本分类,再定义不同的标签
在定义标签的时候,标签名只是作者根据个人认识填写的,之后就直接提交。这样对于不同类别,如食品、服装等不同的事物出现了相似的标签名,最终就会导致它们会一同呈现在用户面前,如下图。这樣就不能很好地对不同类别的事物进行分类。为此,可以在用户定义标签时,增加一个选项,将所要定义的信息能够先归入事先预定的基本大类中。
自由分类法作为一种新兴的分类法,虽然存在着一定的局限性,但是其优势是不可否认的。相信,伴随着互联网信息爆发而产生的自由分类法必将在网络信息资源组织中发挥巨大作用。 [科]
自由分类法,Folksonomy,是由美国学者Thomas Vander Wal于2004年8月在Aifla(阿斯罗玛信息架构研究所)的一次邮件列表中提出的。Folksonomy,是“Folk”(民间、名俗)和“Taxonomy”(分类法)的组合,故名思议,该分类法产生于民间,其操作者是一般的网络用户,而并非专业人员。因此,自由分类法也被称为大众分类法、公众分类法、民俗分类法、通俗分类法和社会分类法等。它是用户根据自己的需求和主观感受,以标签为类目的“自上而下的社会化分类”信息组织方法。由此可见,自由分类法是个人用户为了其检索的需要,对特定信息资源自由添加一个或多个标签来对其进行组织,并最终根据标签被使用的频次选用高频标签作为该类信息类名的方法。
目前已经有许多网站利用了自由分类法,如delicious:https://delicious.com ;Flickr:http://www.flickr.com/ ;抽屉书签:http://dig.chouti.com/ ;豆瓣:http://www.douban.com/ 等等。通过对于部分网站的实战操作与分析,我们可以得出自由分类法突出的优势和存在的问题,并据此提出了几点可能的改进建议。
1.自由分类法的优势
以用户为中心,充分体现用户个性化特点:
自由分类法是由网络用户根据自己的认知、规则创建的,通过标签的形式来定义自己的信息特征,可以说是用户为满足自身的信息需要而产生的。自由分类法的类目是由标签组成的。标签首先由用户自己定义,如果有一个或者多个标签被最多地用来描述同类信息时,它们就被确定为该类信息的类目名称。用户不再是被动地接受网络分类,而是成了网络信息的生产和管理者。用户有权在相应社区中对于自己有用的信息按个人习惯、兴趣爱好等添加标签,以便管理和检索。因此自由分类法的类目体现了网络用户的个性化特点,同时又代表了所有网络信息用户的共性。
如豆瓣音乐标签,他们都是根据用户个人的定义,最后综合得出的。同时我们也看到,一些热门的标签被放大,可以很好地让我们了解当下的流行趋势。
同时,有些网站还具有像豆瓣猜这样的内容,可以根据用户平时的浏览记录,分析用户读过、想读、在读、评价等行为,为用户从海量数据里挑选其可能感兴趣的内容。
1.1有效提高检索效率
自由分类法是非等级的。用户不必从根目录开始经过几级类目才找到所需要的信息,因此能在很大程度上节省查询所需的时间。目前网络门户的信息组织方法是以分类组织法、主题组织法为主进行信息组织活动的。它们大多通过层层划分,按照从总到分的原则逐级展开,用户为了找到信息通常需要层层搜索,以至于浪费了大量的时间。对于主题词的设置有些也不是从用户的角度出发的,不符合用户的检索习惯。此外,有些网站还存在类目设置不准确、划分不合理等弊端,导致检索的信息存在大量的冗余。而自由分类法进行信息组织时是根据个人的理解,对于特定信息赋予一个或几个特定标签,能从不同的侧面揭示对信息内容的理解认识,同时分到不同的类目中。实现了在同一站点时空内以多种方式整合网络信息的可能性。并通过对信息之间的多位关系进行全面揭示,可以帮助用户从多个角度接入信息,满足用户的多种需求,极大地方便了用户,在提高了信息被利用的可能性和利用效率的同时也提升了网站本身的可用性。
1.2快速适应词汇动态变化,吸纳新词
自由分类法是动态变化的,容易更新。传统分类法只能在分类体系已经设定的类目中对号入座,对于新出现的难以对号入座的新理论、学科、事物、技术、材料等主题概念常常只能归入上位类或者靠类。而自由分类法的类目标签是由用户直接用自然语言进行标注的,具有显著的动态性,标签总图能够清晰直观地反映自由分类法的这种动态变化。通常,随着用户和资源规模的扩大,新的标签会不断进入系统中,并作为新的标签出现在标签总图上。如果某些标签被越来越多的用户使用,其对应的标签云面积也越来越大,在标签总图上就会越来越明显。相反,对于一些曾经热门而如今不怎么被关注的标签则会被更多更大的标签云所吞噬,甚至最终被取代。
1.3简单易用
简单易用体现在用户不需要经过专业的训练就可以使用。传统分类法严格遵循学科性原则,有复杂的标引技术和严格的分类规定,只有经过专门培训的专业人员才能掌握这方面的技能,进行分类标引工作。而自由分类法最大的特点就是自由,标签的用词不必受到各种分类表或工具的束缚,分类技术不必经过专门培训。用户标签可以根据个人习惯、认识、理解和兴趣爱好等对网络信息资源进行分类和整理。
2.自由分类法的缺陷
2.1存在垃圾标签
由于缺乏控制,标签的质量参差不齐。有些用户出于个人目的,故意将某些信息加上瞩目的标签,影响了信息标引的准确性。
2.2标签泛滥、不规范一定程度上导致了信息的分享和交流
由于用户的文化程度、语言习惯、认知水平和兴趣爱好的差异,使得他们对于相同的信息内容会形成不一样的分类标签。用户通常首先考虑的是自身的使用和重要性,因此单个用户上传的标签,反映的是个人的兴趣爱好。用户越多,标签也就越多,最终会导致标签难以控制。
2.3不能提供与、或、非式检索
如在flickr上查找有关信息化图片。如果输入信息化or数字化是查找不到任何结果的。只能输入其中的一个词检索。
2.4关系揭示不全面,限制了查找新资源的途径
在系统中的信息在整体上的组织是一个用词构成的平面结构,并不存在根节点,标识信息的标签或者是按子顺显示或者随机罗列面上,无法揭示标签之间的复杂关系。在查找信息的时候可能不清楚类目的上位类和下位类,减少了检索的切入点。
3.改进建议
3.1设计合理的元数据,建立可控的、动态发展的元数据词汇表
为应对多义词、同类词不规范所造成的交流障碍,我们可以通过设计元数据词汇表的方式来解决。用户在建立标签的时候,可以选择词汇表中的词任意组配描述信息。必须注意的是词汇表中的元数据必须经常更新,以适应高速发展的信息社会。在描述某些特定用语的时候则需要符合一定的规范,这些规范预先设立规则。比如关于苹果的标签,可以加上限定,“苹果(水果)” 和 “苹果(电子产品)”;或者对于一些可以用多种方式表达的信息内容,限定其只有一种标签。如“自由分类法”,只能用“只有分类法”标签,而限制用户用“大众、分众分类法”来标签。
3.2运用记忆功能,增加检索效率
在delicious上操作,我们可以发现,书签的排序是按照字母排列的。每次查找信息都需要一次搜索。如果对于某一高频使用的书签,每次使用都需要搜索一次将是麻烦的。如果能够增加使用记忆功能,将经常使用的书签置于顶部,那么就能在很大程度上提高检索效率。
3.3对于不同类别的信息能够先进行基本分类,再定义不同的标签
在定义标签的时候,标签名只是作者根据个人认识填写的,之后就直接提交。这样对于不同类别,如食品、服装等不同的事物出现了相似的标签名,最终就会导致它们会一同呈现在用户面前,如下图。这樣就不能很好地对不同类别的事物进行分类。为此,可以在用户定义标签时,增加一个选项,将所要定义的信息能够先归入事先预定的基本大类中。
自由分类法作为一种新兴的分类法,虽然存在着一定的局限性,但是其优势是不可否认的。相信,伴随着互联网信息爆发而产生的自由分类法必将在网络信息资源组织中发挥巨大作用。 [科]