Web2.0向Web3.0过渡下的网络信息资源组织发展

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:toveyhzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:从Weh 2.0向Weh 3.0过渡的过程中,网络信息的组织是一个动态过程,而不是静态过程。面对庞大烦琐的网络信息资源,传统的人工组织方式已经不能满足网络信息资源组织的新要求。只有将各种传统的信息组织方法与新的网络信息组织方法相结合,才能提高网络信息组织的质量,搜索效率和信息利用率。通过大众分类法、网络信息自组织、知识组织和本体语义网的发展,网络信息资源组织将得到进一步的发展。
  关键词:网络信息资源;weh2.0;web3.0;信息组织社会化媒体
  中图分类号:TP391
  文献标识码:A
  文章编号:1009-3044(2019)36-0033-03
  1面向社会化媒体的网络信息资源
  1.1网络信息资源概念
  网络信息资源以电子数据的形式在存储在非纸质印刷载体中的各种形式的信息,例如文本,图像,声音,动画,视频等,并且通过以下方式再现:网络通信,计算机或终端等方式。网络信息资源是计算机网络可以使用的各种信息资源的总和。[1]网络信息资源是电子化、数字化了的,并通过计算机网络进行传输、共享和利用的资源。
  1.2社会化媒体概述
  Web2.0的出现,不但使得因特網上的内容丰富,并且满足了与用户共同创新与分享的需求,形成了彼此沟通协作的社区。随着互联网技术的进一步发展,2006年一种新型的媒体形式:社会化媒体(Social Media)进入了人们的视野,加快了人类迈向信息社会的步伐,社会化媒体是一种给予用户极大参与空间的新型在线媒体,这是人们彼此共享想法,见解,经验和观点的工具和平台。[2]具有传统媒体并不具备的独有特性:公开性、参与性、共享性、交流性、联通性以及社区化特性,它模糊了时间和空间的界限,也模糊了媒体和受众之间的界限。用户被鼓励主动参与到社会化媒体的平台中,参与信息创建,交流,反馈,协作,贡献等,在没有任何障碍或限制的情况下加入和使用社交媒体,并轻松地形成一个社区以与、对共同感兴趣的信息内容进行交互。[3]而Web3.0是Web2.0技术的进一步发展,通过互联网与通讯的融合,用户可以用所有智能终端及时、轻松享受各种信息服务,在Web2.0的基础上,基于SPARQL(SimpleProtocol and RDF Query Language)、RDF(Resource DescriptionFramework)等标准,可以智能地使用各种数据库程序,这些数据库程序基于语义Web连接本体信息资源,并通过具有及时性,集成性和交互性的智能技术为用户提供个性化服务,Web3.0的技术核心是语义网技术。[4]
  1.3面向社会化媒体的网络信息资源特点
  1.3.1信息量基数大、增速快
  大数据时代,我们无时无刻不面临着海量并且不断激增的数据,网络平台的开放性和自由性使得信息在发布时没有统一的标准。同时也缺乏宏观的管理,这就导致了信息数量的庞大、复杂并且排列无序。
  1.3.2形式多样,分布广泛
  内容丰富,形式多样,涵盖不同学科、领域、地域、语言,并且包括文本、图像、音频、视频等多种格式,除了结构化数据外,更多的是半结构化和非结构化的数据类型。网络信息的全球化分布,使得社会化媒体连接了世界的每一个角落,信息的分布也遍布不同国家、不同地区。
  1.3.3网络信息流动加速
  在面向社会化媒体的网络种,信息流的运动成为信息传递的主要形式,是信息资源的时空转移,并且在流动的过程中还会不断地产生与之相关的其他信息。在传统的网络信息资源中,信息的传递大部分是单向的,但面向社会化媒体的网络中信息的传递、接收和创造都是双向的,甚至是多向的,[5]网络主体可以不受时间和地域限制实现信息的交换和共享,信息流动速度也更迭迅速。
  1.3.4个性化信息增多
  面向社会化媒体的网络信息都是围绕用户产生的,每一个用户的信息组织体系都是个性化的存在,这也使用户在信息传递系统中是被动的,被动的接收信息。个性化信息的增多,会影响信息传递的过程,随着兴趣、关注热点、参与度以及需求的改变,会造成个性化信息的不确定性。那么信息的组织方式也会受到信息有序化程度的影响。
  1.3.5版权问题复杂化
  由于传统的信息资源大多是纸质的,而且大部分资源已经具有完善的版权保护制度以及法律法规,而在网络平台上的信息资源相关保护制度将更加复杂,且难以规定。
  1.4面向社会化媒体的网络信息资源组织
  在Web2.0和Web3.0的理念和技术应用环境下,网络信息资源组织的方式方法也分为面向用户、面向协作、社会化、面向机器理解几个方面。
  在面向用户的信息组织中,比较有代表性的有博客,信息组织方法主要有:时间排序法、大众分类法、信息行为排序方法等。
  在面向协作的信息组织中,比较有代表性的有维基百科,是通过协作的方式来创建、组织、维护信息资源。它具有如下特征:信息内容具有一定的编辑规则、信息行为具有一定的规范、信息内容不是一成不变,二是不断地更新和演进的。
  社会化特征主要体现在用户对信息对象的处理行为上,例如在抖音中,用户浏览、下载、评论、搜索信息对象,赋予了信息资源本身社会化的特性,同时个性化的信息资源也增加了信息共享的需求和程度。
  面向机器理解的信息组织与面向用户是相对的,HTML这类信息视图适合于用户理解,但不适合机器理解。XML是促成机器理解信息的基础,建立在XML基础上的各类协议(RSS、ATOM、OWL等)可以支持不同层次的机器理解,提高机器智能。[6]
  2网络信息资源组织研究现状
  2.1关于信息组织的技术
  这方面的研究对象,主要是关于搜索引擎、元数据、数据挖掘、数据仓库、知识发现、标记语言、数据库技术、自动跟踪技术、机器翻译技术、信息检索的推拉技术、虚拟图书馆技术、专业指引库技术、智能代理技术、多媒体技术、人T智能技术等。武汉大学信息管理学院的晏凌与王应解基于联机分析挖掘技术(OLAM),提出了一种新的网络信息组织策略——智能化信息导航系统及其组织原则:空间暗示原则、用户原则、同一性原则及平衡原则。[7]李洪、隋利玲概括了三种多媒体信息组织和管理技术,即扩展现有的关系数据库模型,面向对象的数据模型,超文本和超媒体技术,介绍了“中国路桥多媒体数据库”的功能及其多媒体信息的组织管理方式。[8]   2.2关于社交媒体的信息组织
  在对社交媒体信息组织的相关研究中,前人的工作分别在内容摘要、内容分类和聚类等不同的技术领域提出了相应的解决方案。
  例如摘要(document summarization)[9]技术从数据压缩的角度来完成对海量信息的组织。其中,许多研究者通过从给定文档集中抽取出代表性的句子和可读性高的句子来为产品评论数据生成更为简短的摘要。而Yang等人[10]提出利用社交媒体之间的引用以及社交媒体用户的社交网络来提高微博摘要质量的方法。此外,如果给定一个已知的内容分类体系,我们也可以利用文档分类(document classiflcation)算法[11]将数据划分到不同的类别上去。
  3网络信息资源组织的层次和实现方法
  3.1传统网络信息组织方法
  3.1.1分类组织法
  分类组织方法是指网络分类组织方法。它首先对从网络获得的各个主题领域的信息资源进行标识和汇总,然后根据详细信息对它们进行分类和汇总,然后将信息整合到相同的字段中,然后再根据特定的顺序和规则来进行系统的索引编号。[12]分类组织法是从宏观的角度出发为用户揭示信息的内涵。
  分类组织的方法是按总体轮廓对信息资源进行分类。这样可以清晰地组织复杂的信息资源,并允许用户从根据索引分类的类别中选择所需的信息资源。其优点主要体现在高搜索成功率和易学习的操作步骤,节省了管理成本、提高了检索效率。但是,分类组织方法仅适用于初步信息资源管理的建立,不同信息资源之间没有办法进行有效的联系。且面对信息时代的大量资源,这种方法有一些局限性,例如无法规范的描述信息资源的准确性,及时性,权威性等,用户只能在使用信息时自行判断。
  3.1.2主题组织法
  主题组织方法提供作者,标题,类名或关键词,标题词和其他形式来揭示和组织知识,用户可以在搜索关键词后获取相关的超链接。主题合成方法使信息的揭示更加直观,并允许根据信息的特征,结合信息手段本身的搜索手段,方便地搜索目标信息。但这种组织方式对信息的描述还不够深入,必须在建立严格的主题树网络之后应用。由于关键词的广泛关联作用,其搜索的准确性较低,也造成了整体的复杂冗余,也一定程度上降低了信息利用率。
  3.1.3元數据组织法
  专门用于描述数据特征和属性的数据,即有关该数据的数据被称为元数据。包括数据库和搜索引擎。元数据是对资源信息的描述。目前常见的类型有MARC、GILS、TEI、FGDC、DC、IAFA等[13]。
  应用元数据法,可以对信息资源的现有一般信息即内容和主题等进行更深入的描述,网络信息资源的描述和组织使用户可以更方便地组织和评估信息资源,以便做出快速,合理的决策和选择。元数据组织是相比前两种传统组织法方法而言更深入的组织方法。
  3.2新型数字信息组织方法
  随着网络的扩展,互联网上的信息量呈爆炸式增长趋势。信息系统需要维护的数据库也变得非常庞大。采用传统的检索方法来查询这样的量网络信息是非常耗时的,有时也很难满足用户的信息需求。在对异质异构的海量网络信息资源进行组织时,急需更加自由简便、灵活易用的信息组织方式。在此背景下,本体、主题词表、分众分类法等新型的信息组织方式应运而生。
  3.2.1本体
  在信息科学领域,为了提高网络信息检索系统检索精度和效率,人们引入本体技术作为技术手段。作为一种工具,本体使用独特的功能来提供一种有效的方法来解决网络中信息资源的各种问题。本质上,它描述了网络中的概念及其之间的关系,并在共享范围内具有清晰唯一的定义。[14]本体技术最近已引起计算机和情报界的关注。如今,本体已广泛用于语义Web,智能信息检索,信息集成和数字图书馆等领域。
  3.2.2分众分类法
  最早由信息科学家托马斯·范德(Thomas Vander)首先提出的分众分类法是一种适应互联网发展的新型知识自组织方法。该分类方法更加方便灵活,结合了用户的认知度,突出了群体智慧与合作的重要性,促进了用户信息的获取与交流。分众分类法的执行主体是普通网络用户,用户是直接参与信息组织工作的,用户可以在发布信息时标记信息资源或标记信息,也可以在没有专家或工具协助的情况下单独完成知识组织任务。分众分类法主要用于组织网络信息资源,但由于其等级结构划力不明确,准确性和时效性差,应用范想较为狭窄。
  3.2.3主题词表
  主题词表,又称叙词表、检索词表或词库,与自然语言相比,主题词表是经过标准化,系统化的定义的名词术语的集成。主题词汇表是指专家如何使用领域叙词表来定义和组织单词及其语义关系。主题词表已经从传统的知识组织方法转变为构建知识组织系统的重要手段,并已成为大规模网络知识组织系统中必不可少的工具之一。但是词汇量的可扩展性很低,并且编译复杂需要大量的人力和时间资源,并影响词表的及时性。
  4网络信息资源信息组织的发展趋势和影响
  在web2.0不断向web3.0演进的过程中,作为交互层的结构性要素的信息组织也呈现出自动化和个性化的演进趋势。我们就这两个特征出现的依据和它们涉及的技术进行梳理,不难发现技术架构和标准与用户需求不断耦合的过程,而随着技术的进步,用户对互联网信息也有了更高更个性化的需求,也为更高层次的信息组织方式乃至网络信息的自组织和建构的演进指出了前进的方向。下面先就信息组织的自动化和个性化两个特征进行探讨:
  4.1网络信息资源组织的自动化发展
  基于大数据和云计算等技术的发展,网络信息资源从数量到结构与以往相比都有了飞跃式的丰富,而存储和计算的设备和架构也与以往有了本质的不同。另外,越来越多的技术和设备被引入到有关网络信息资源的组织和评估的研究工作中,当前的研究方法和模型页已经改变和完善。同时,随着信息资源总量的增加,基于海量数据乃至图片和流媒体的无监督学习成为可能,给信息组织的自动化铺平了道路。对于用户而言,可以更便捷的享受研究成果,对网络资源组织者来说,应该致力于改善用户体验、强化以用户为中心的原则,我们可以从以下两个层次对网络信息资源组织的自动化进行展望:   4.1.1主题分类一体化的发展趋势
  在信息资源的数量和种类日益丰富的当下,进行网络信息资源组织可以更尊重它们本身的属性和粒度,具体而言就是使用分类主题一体化方法来组织网络信息。在以往的信息资源组织中,分类方法基于事物的主题属性执行族性检索,但是主题方法是一种特征搜索,具体取决于反映人类思维的两个不同方面的主题类别和执行。而在当下的技术条件下,我们可以尊重人们本来的认知过程,通过将分类法和主题方法有机地结合在一起,分类主题一体化对于加强分类搜索和主题检索之间的关系是有用的,便于从主题角度充分利用分类系统。
  4.2社交网络的兴起为网络信息资源组织引入的个性化要素
  标签是标准的Web 2.0组件之一,最初旨在满足多维分类的需求。这是基于对信息资源的概括和理解,是对信息内容的个人理解的注释,可以不一定是主题,且可以是与时间,内容或信息资源无关的词,标签比关键词更方便,并且可以从多个维度来提示信息的内容和分类。大众标注是取决于用户决定的一种分类方式。用户可以通过为博客、照片、喜炊的网页等添加一个或多个标签来自己组织内容。这种更自由和灵活的功能极大地增强了网站的可用性,功能和个性化。
  特别是在社交媒体兴盛的当下,大众标注多维度的特性能够准确反应网络信息的传播和使用的状况,通过改变一个事件的标注就可以让传播和利用的途径和方式发生根本的改变,使用户对网络信息资源的自我组织和管理成为可能,让网络资源的信息组织更趋于个性化。另外,公共标签是灵活可变的标签,信息资源标签的粒度是可变的,因此用户信息资源标签更适合于用户时代的需求。通过将公共注释的多维特征和注释的灵活可变功能同时应用于信息資源注释,信息资源的组织和分类变得更加详细和灵活。
  传统意义上的信息组织更偏重于信息分类,识别系统来表述信息内容、导航系统负责查看信息和控制信息,用户可以通过搜索找到所需的信息。社交网络将上述的模块整合起来,基于庞大的数据流和自然语言处理技术导向了处理过程的自动化,在使用社交网络的过程中,社交网络信息资源组织根据用户的需求进行个性化,这必然指向信息组织向信息建构发展的趋势。
  参考文献:
  [1]周宁.信息组织[M].武汉:武汉大学出版社,2017:337-339.
  [2]社会化媒体[EB/OL].[2019-05-18].https://wiki.mbalib.com/wi-ki/% E7
其他文献
摘要:分析了大学计算机基础课程存在的问题,构建了一种新的教学模式,根据学生的计算机能力对学生进行分层教学,实现“因材施教”,借助SPOC平台实施翻转课堂的教学改革,使得学生成为教学的主体,打破传统的以教师为中心的教学模式,结合在线学习和课堂学习的优点,突破课内与课外的限制,使教学和学习空间得到延伸,提高学生的学习积极性和主动性,从而提升教学质量,增强学生的计算机知识和能力。  关键词:分层教学;S
摘要:随着大数据时代的到来,商业、政府机构等许多部门和行业都面临着数量越来越多的数据资料,因此数据挖掘受到外界越来越广泛的关注。该文就阳光集团所提供的西南某省的具体数据,基于python语言对其进行数据清洗、数据挖掘以及回归分析。  关键词:python;数据挖掘;数据清洗;回归分析  中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)23-0015-06  1 涉及
摘要:结合湖南汽车工程职业学院在智慧校园建设中的实践,提出了以“物联网 大数据分析”为智慧的建设定位;坚持“以人为本、服务为先、流程驱动”的建设思路;以校园泛网络平台、PC端和移动端业务系统、数据采集及存储以及大数据分析和决策辅助为主要建设内容分步实施。  关键词:智慧校园;物联网;信息化  中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)14-0233-01  1
摘要:基于传播学与社会心理学,采用问卷调查法,从社交媒体使用情况、阅读现状、基于社交媒体的阅读特征、社交媒体影响阅读的途径等几个方面,调查了大学生基于社交媒体的阅读现状以及社交媒体影响大学生阅读习惯的途径。得出大学生基于社交媒体的阅读通常处于浅阅读状态、阅读时间和内容碎片化、阅读内容娱乐化等结论。根据结论对大学生基于社交媒体的阅读,以及基于社交媒体的阅读内容的设计提出相关建议,以期实现最优化阅读。
摘要:该文将以《办公软件综合应用》课程教学为例,阐述教学中如何引入任务驱动教学法,以及该教学法在该门课程教学过程中的实施效果评估。由于整个计算机应用类课程教学的相似之处,《办公软件综合应用》课程的教学方法可起到抛砖引玉的作用,推而广之为此类课程教学可选择的方法。  关键词:计算机;课程教学;办公软件;任务驱动  中图分类号:G642 文献标识码:A 文章编号:1009-3044(2018)06-0
摘要:经管专业大数据原理与实践课程的设计,应该参照Python语言的特点,以培养基本的科研素质为出发点,设计作业和考核形式与标准。同时结合目前时代背景,比如人工智能、机器学习、大数据、物联网技术等为经管专业的研究生定制个性化的教学模式,使得Python语言课程内容更具有实用价值,培养学生的计算思维和解决实际问题的能力,培养适应产业发展需要的跨学科等复合型人才。该课程建设对于其他语言的教学也具有一定
摘要:随着信息技术的迅猛发展,如何将信息技术渗透到教育领域,促进信息技术与专业教学深度融合,从而推动学校教学模式变革、提升实训教学效果则显得尤为重要。该文以长春汽车工业高等专科学校虚拟现实(VR)技术在企业现场管理实训教学中的深度应用为例,通过对课程信息化模式创新、实训教学成效剖析、运行机制建设三个方面进行综合分析,阐述了该项目在实施过程中的工作要点,旨在对同类院校如何将信息技术与专业教学进行深度
摘要:随着数字化、网络化的快速发展,校园无线网络的全覆盖,传统的教学模式已经不能完全满足当前高职类院校课程教学的需求了,这就使得很多课程的教学需要转换模式。以艺术类高职《计算机应用基础》课程教学为例,基于超星学习通云平台技术,构建该门课程线上和线下交互教学体系,将现有的课程资源和教学资源进行有效的整合,并共享到云端,让学生可以通过手机利用超星学习通实现线上线下课程学习。  关键词:存在的问题;超星
摘要:在数据类型不断增加,规模逐渐扩大的趋势下,NO SQL技术与MapReduce并行处理理念开始备受关注。而作为N0SQL数据库典型代表,MongoDB可索引并查询大量数据,但是其所提供的MapReduce无法满足太过繁杂的数据分析与并行计算。而Hadoop具备强大的MapReduce计算能力,但实时服务延时较长。对此,可基于扩展性、数据本地化等相关要素分析,整合Hadoop与MongoDB,
摘要:英语课程资源的开发与英语课堂教学的整合以及教师自身的发展密切相关。课程资源的开发对于大多数教师来说已不陌生,但具體到教师自身,在英语学科范围内进行课程资源的有效获取是促进英语课堂效率和教学质量提升的必然途径。该文从英语教师科研类网站的推荐和英语教师可访问的国外免费资源角度着手,提供一些可供参考的外语相关资源。  关键词:英语;教师;科研;教学