网络时代新型信息分类法探究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:pansheng5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:传统信息分类法是自上而下金字塔式的系统的、详细的、全面的分类法,而随着信息高度发展化和透明化的时代的到来,互联网上出现了新型信息分类法--自编分类法和分众分类法,二者采用了独特的信息分类法,方便了用户信息的检索。文章主要概述传统信息分类法和新型信息分类法,并将二者进行比较,分析新型信息分类法的优劣。
  关键词:传统信息分类法;自编分类法;分众分类法
  中图分类号:TP311      文献标识码:A
  文章编号:1009-3044(2021)30-0074-02
  开放科学(资源服务)标识码(OSID):
  网络信息的无序增长,使网络信息非常的多样化,即有可利用信息,又有垃圾信息;另外,网络信息用户在面对网络空间的海量信息,无法高效地获取所需信息。因此,许多的门户网站开始进行探索和开发新的信息分类方法,以解决和缓解网络信息不断增加与有价值的网络信息能够有效利用之间的矛盾,为网络信息用户提供便利的信息获取途径和方法。
  1传统信息分类法
  传统信息分类即传统文献分类法。传统信息分类法是自上而下金字塔式的系统的、詳细的、全面的分类法,主要是依据文献的内容、特征及其性质,用科学方法和理论把文献分门别类地进行分类,形成体系。它是读者用户利用文献的分类检索语言,也是图书情报部门编制文献分类检索工具、分类排列图书和进行分类统计的基本工具和重要依据。[1]通俗地讲,传统文献分类就是图书馆用来划分图书、组织图书的一种工具,它是由一些根据不同的属性,按照一定的原则,划分出的大小不同的类目组织起来的分类体系。文献分类法主要包括3种类型:等级列举式分类法、分面组配式分类法、半分面分类法等。
  2新型信息分类法
  网络上的信息分类组织主要采用两种方式:一是采用自编分类法,由后台程序员根据用户的常用搜索词条进行统计得出。二是采用分众分类法,用户根据自己的意愿进行内容分类。由于网络信息类型、表现方式、传播方式、信息基本单元等复杂性,使得网络信息分类组织模式更具多样性。有些网站采用了多维的分类模式,以此满足用户信息检索的需要。
  2.1自编分类法——以网易网为例
  网站大部分都采用自创的分类体系,运用学科和主题相结合的原则而不是按学科划分类目,主要用于通用性网络信息资源的组织与检索。许多网站的大型综合搜索引擎往往是参考一个或几个分类标准开发自己的分类导航系统。
  网易作为“中国四大门户网站”之一,凭借丰富的资源、先进的媒体理念、领先的互联网技术等,在门户网站业务方面,一直保持领先的地位[2]。网易设有新闻、娱乐、财经、汽车、体育、女人、科技、数码、手机、房产、读书、游戏、教育、旅游、酒香、公益、校园、传媒、视频、论坛、博客、应用、健康23个一级类目。
  在一级类目中比如“健康”“旅游”“财经”等是以主题为分类原则设立的,而“科技”“教育”“体育”等则是按照学科属性原则来设立的,总体来说网易分类体系的设立是以主题为主,学科属性为辅。在网易网中每个一级类目皆有设立有二级类目。一级类目下的二级类目的分布情况如表1所示。
  自编分类法以类目的使用频率、重要性来排列,突出日常生活所相关的、一般用户都感兴趣的类目设置,如健康、教育、娱乐、生活等;对学术性科技类目的设置有些弱化。另外还采取多重列类法来显示类目之间的关系,每个大类又分出若干二级类目,如果需要还可继续细分三级、四级,并且通过超文本与超链接技术灵活、多维和有效地提示了类目之间的关系。但同时也存在分类体系涵盖能力较差、列类较杂、缺乏逻辑性与严密性等缺点。由此可见,目前的网络信息分类法并不能完全满足用户的需要。
  2.2 分众分类法
  分众分类法是在互联网时代的产生的,表示的是由非专业信息人员来创造的分类法,国内也有称为“自由分类”“通俗分类”“社会分类”等。分众分类法与传统分类法不同,它强调的是一种自下而上的、社会性的、用户共同创造的、自由的分类法。这些网站并不是按照专家建立起来的目录分类学来给网站分类,而是基于一种由大众逐渐发展起来的分类体系———分众分类法,创建者并不是想把他对互联网结构的看法强加给用户,而是将权利交给用户自己,希望大众能够自己发展出一套分类体系。
  3传统文献分类法与网络信息分类法的分析比较
  3.1分类体系上的区别
  传统文献分类法是以文献的内容特征为主要分类标准。如《中图法》就是在此基础上的一种等级列举的分类体系。这种分类体系使用概念层层划分的方法,首先将所有科学划分为22个基本大类,这22个基本大类中仅有5个是按照主题立类的,其余17类均按照学科立类的。后将基本大类划分成若干个二级类目,再将二级类目划分为众多三级类目等。由此形成了由一般到具体、从宽到窄层层划分比较纵深的信息等级结构。
  目前,大多数网站及网络搜索引擎放弃了传统文献分类法以学科为原则建立类目体系的方法,而从信息用户的角度出发,多采用以主题为中心或主题与学科相结合的立类方法,多采用自然语言来命名类目。这种学科与主题相结合的方式,可以在一定程度上弥补完全按主题立类时实用性差、无法完全列举所有主题的缺点,也可以在一定程度上克服了按学科立类实用性差、用户不易掌握复杂的分类方法的缺点。但这种方法同样也会带来一定的内容重复的问题。例如在网易网中23个大类:新闻、娱乐、财经、汽车、体育、女人、科技、数码、手机、房产、读书、游戏、教育、旅游、酒香、公益、校园、传媒、视频、论坛、博客、应用、健康。其中“新闻”一级类目下的二级类目“博客”和“视频”就与一级类目“博客”“视频”在内容上发生重复的问题。
  3.2分类标准上的区别
  传统文献分类法在分类标准使用数量上,一般要求一次划分使用一个分类标准。例如在《中图法》中自然科学大类的分类体系皆按照学科—主题细分,地区复分、时代复分等皆放在分类号的末尾。   网络信息分类法由于类目逻辑关系不够严密,加上又不需要以标记符号标识类目之间的关系,客观上每一等级的划分都使用了多种分类标准,划分后子类之间的内涵相互交叉。例如在网易新闻大类中,将其划分为最新、排行、国内、国际、社会、评论、深度、军事、历史、探索、图片、娱乐、财经、博客、媒体、视频、公益等多个二级类目。其中国际和国内是按照新闻发生地点进行划分的;军事是按照学科进行划分的;娱乐、财经是按照主题来划分的。其中国际与国内包括军事、娱乐、财经的新闻,军事、娱乐、财经也包括国际与国内的新闻。由此可以看出,其各子类所包含的内容相互交叉。
  3.3类名设置上的区别
  类目名称限定类目所代表的事物概念的内涵和外延。传统文献分类法要求所使用的类目名称要准确、科学、简介,能够恰当地反映类目的实际内容范围,所采用的语词要科学、通行、精炼,要符合大多数用户的使用习惯。传统文献分类法主要用于文献分类、文献排架、文献检索,一般将类名用特定的符号加以标识,《中图法》采用的就是字母加数字的混合标识符号,如A849表示邓小平理论学习和研究[4]。
  与传统文献信息分类法不同的是,网络信息的分类方法所采用的类目名比较随意,多采用自然语言,不少类目名称不能够科学、准确地表达类目的内涵和外延。在分类名的选择上更注重向网络信息用户通俗易懂、易于理解的方面选择,但准确性却不如传统文献信息分类法。如网易网中一级类目“女人”“视频”“读书”等。而且网路信息分类法不涉及文献排架的问题,因此不要应用字母与阿拉伯数字混合的名称。
  3.4同位类排列方式上的区别
  传统文献分类体系对处于同位的类,一般按照类目的关系排列。例如在《中图法》中类目排列的基本方法是:按照事物客观发展的次序、事物内部固有次序、科学的系统次序以及人们认识事物的逻辑次序排列次序。始终贯彻从总到分、从一般到具体的原则。
  网络信息分类法中对于处于同位的类,种类众多,在具体的排列形式上往往表现出多样性的特点。例如在網易网中在同位类的排列中,采用了分类字顺的方式。
  3.5类目交叉关系处理上的区别
  网络信息分类法对类目交叉关系的处理采用的是类目重复反映的方法,也就是涉及多个学科的主题在多个类目下重复设置。例如在网易网中一级类目“博客”“媒体”“视频”同样也存在于“新闻”的二级学科类目中。
  网络信息分类方法虽有很多长处,但也存在一些缺陷。如一级类目知识领域不全、分类体系不严密、类目排列缺乏规律等。造成这些缺陷的原因主要是因为目前网络上的搜索引擎大都是研究机构和电脑工作设计者,他们非常重视用户需求,又熟悉网络信息,所以设计出的分类体系有较好的实用性,并且能够体现网络的环境特点。而网络信息公司与图书情报专业人员在知识结构方面存在很大差异,各有所长,所以在建构网络信息分类体系方面有坚实的合作基础,必将网络信息分类体系做得越来越好。
  参考文献:
  [1] 欧洁,俞学宁,朱礼军,等.基于网易的网络信息分类体系研究[J].图书馆学研究,2012(1):50-53.
  [2] 陈树年.网络信息分类法研究[J].现代图书情报技术,2002(3):54-57,80.
  [3] 马费成,宋恩梅.信息管理学基础[M].武汉:武汉大学出版社,2011.
  [4] 方晓红.网络信息分类法与传统文献分类法比较研究——以网易网和《中图法》为例[J].江西图书馆学刊,2010,40(3):47-50.
  [通联编辑:李雅琪]
其他文献
摘要:抢票软件的出现,在一定程度上缓解了铁路12306官方购票系统的售票压力,并被人们加上“买票快”,“买票方便”的标签,但其实抢票软件类似于生活中的一种插队现象,不仅没有抢票率的保证,而且从用户隐私安全和系统操作性能而言,抢票软件存在泄漏用户隐私、隐形收费、对服务器资源造成破坏等问题。  关键词:多线程并发;模拟分析危害  中图分类号:TP393 文献标识码:A  文章编号:1009-304
摘要:随着高职院校在宣传手段、影响力范围、信息公开程度等方面的拓展需求不断增多,站群管理应更加注重意识形态的积累和沉淀,传统的单站单人采编、审核、发布已经无法满足高速信息时代碎片化信息的高频率展示需求,针对高职院校网站内容质量、服务器管理、意识形态等保障性工作无法得到长期有效落实的问题, 该文基于站群系统建设与应用,充分利用先进的站群管理和采编中心技术,从站群管理层面提升新闻质量、加强队伍建设、强
摘要:数据治理系统作为大数据平台的核心基础支撑系统,旨在为数据仓库、数据服务平台、大数据基础平台以及实时共享交换平台,提供统一、便捷、高质量和价值最大化的数据资源,是数据应用和实现数据跨部门联通的基本保障。该文提出基于大数据平台的数据治理系统建设方案,为降低后续数据治理的改造成本、实现各部门互联互通和达到数据资源价值最大化,提供有效基础支撑。  关键词:数据治理系统;大数据平台;数据仓库;数据服务
随着三维点云数据在计算机视觉任务的逐渐流行,合成或重建高分辨率、高保真点云的能力变得至关重要。虽然深度学习模型最近在点云识别和点云分类任务中取得了成功,但点云生成任务还困难重重。本文提出了一种基于流模型的点云生成模型,使用深度学习技术训练好该模型之后,只需要从简单的高斯分布随机采样数据,然后通过我们的模型就可以产生全新的高质量的点云形状。基于我们模型生成的点云的质量比大多数现存的模型都要好,可以为
摘要:该文将研究移动终端大数据的文件存储技术,以电子邮件和短彩信消息文件的存储为实例,提出了一种在移动终端大数据环境下的消息文件存储和操作的算法,实现精确控制读写数据正确位置,避免了重写所有数据,极大减少IO操作负担,提升移动终端大数据读写操作性能。  关键词:移动终端;数据存储  中图分类号:TP3 文献标识码:A  文章编号:1009-3044(2021)30-0037-03  开放科学
摘要:随着计算机信息技术飞速发展和应用,各行业领域逐渐向现代化、信息化方向发展,人们工作生活更加便捷。然而在网络技术发展大背景下,计算机网络信息系统安全问题也随之出现,如信息资源共享带来的安全问题、软件及操作系统的安全问题、黑客入侵病毒泛滥以及环境危害引发的安全问题等安全问题。对此,相关技术人员要加强物理安全防护,及时备份和恢复数据库内容,同时要不断提高系统反病毒能力及软件操作系统安全性。该文分析
图像超分辨率是由低分辨率图像重建生成高分辨率图像的过程,是计算机视觉领域的一个研究热点。近年来,随着图像超分辨率技术理论的不断创新,从传统的插值法、重构法发展到主流的深度学习算法。文中从图像超分辨率的定义出发,梳理了图像超分辨率各个时期的代表性算法,详细介绍了基于卷积神经网络、残差网络与生成对抗网络三个主流的超分辨率模型,并讨论了各个模型的网络结构、学习策略以及损失函数等问题。最后,对图像超分辨率
摘要:为了避免因IP地址规划导致一系列网络问题,结合网络工程项目实际经验和教学经验,针对校园网的网络互连系统提出网络IP地址规划与设计的基本原则、规划方法,并通过一个具体的实例说明IP地址规划的过程。希望对网络初学者和一些缺乏IP地址规划经验的网络工程师提供有价值的参考。  关键词:校园网;局域网;IP地址规划  中图分类号:TP393 文献标识码:A  文章编号:1009-3044(202
摘要:为了研究网络社交平台对大学生主流意识形态的关系影响,该课题以全国大学生为主要研究对象,以反映当代大学生在网络社交平台使用行为情况的五个维度:社交互动、信息获取、自我表达、休闲娱乐、网络影响程度为自变量,反映大学生主流意识形态的三个指标知晓、认同、践行为因变量,建立相应的二元Logistic回归模型,进行实证调查分析。基于实证分析结果表明,网络社交平台的五个维度对大学生主流意识形态三个维度均具
摘要:科学技术水平提高推动了通信网络的发展,但在其实际应用环节,仍然存在许多安全隐患。本文就机房网络安全隐患进行了简要分析,并以此为基础进行机房网络安全技术策略研究,并提出机房网络安全管理防护举措。为保障机房网络安全,管理人员应设立机房网络安全权限,应用防火墙加密技术,提高机房网络安全水平,保障机房网络正常运行。  关键词:机房网络;安全隐患;网络安全技术  中图分类号:TP393 文献标识码