论文部分内容阅读
新闻出版总署署长柳斌杰在2010年初提出,未来10年我国将努力实现从出版大国向出版强国的转变。这一目标的实现,需要有各种支撑条件,标准体系的建立就是其中的重要基础条件。
对于数字出版行业而言,数字出版标准化,有利于数字出版链条上的参与各方实现利益均衡,分工合作,整体降低成本,用有限的资源实现效益的最大化,实现技术兼容、数字内容的互联互通和共享。
对于一个市场中的竞争主体而言,构建市场中的标准是体现其地位的标志,也是进一步巩固其垄断市场地位的一种重要策略。
对于一个传统出版机构而言,标准的确立意味着未来可以方便与合作方(移动终端、内容集成商等)的数据交换。传统出版机构进行数字化时有这样的困惑,以前排版生成的电子文件不能直接发布出来,也不能直接应用在移动终端浏览,要应用的话必须投入资金进行数据化加工,不同的应用需要加工成不同的格式(pdf、html、epub、txt),所以传统出版机构希望能够通过数字化的加工,实现多渠道应用。
数字出版标准的困惑
“一次加工、多渠道应用”是数字化的一个目标,但是,很多出版机构都很困惑,要把经过排版的电子文档加工成什么样子,才既能在电脑上用又能在手机上用还能在电子书阅读器等移动终端上用;描述资源的基础元数据是什么结构,需要哪些元素,这些元素要怎样定义等。在国内,数字出版属于刚兴起的业务,并没有成熟的标准,有Ceb、Caj、Cebx、Epub等几十种格式。传统出版机构文件资源有:方正书版(7.0、9.0、9.1、10.0、2008)、方正飞腾(4.0、4.1、5.0)、Indesign、Pagemaker、Latex、Quark等排版软件生成的文件。如此众多的文件类型怎样进行标准化,困惑自是当然的。
数字出版标准的现状
数字出版相关业务的标准,一般分为基础的技术格式标准及数据结构标准两个层面。
XML是英文eXtensible Markup Language的简称,翻译过来叫可扩展标记语言,是设计用来传送及携带数据信息的。XML作为W3C的推广标准,已经成为计算机领域数据描述、数据交换的基本应用格式。在数字出版领域应用也非常广泛,像国际上的出版商联合会(欧洲、美国)推广的ONIX(在线信息交换)的技术格式标准就应用的是XML格式。
围绕XML还有一系列的XSL、XBRL和XPath等在XML基础上进行应用的“工具集”,XML作为基础的文件格式,除了数据存储、规范、交换方便外,更重要的是在应用端能转换成网页、PDF、Epub等格式应用到不同的终端上。
虽然,XML作为基础的数据格式已经广泛应用于数字出版领域,但是应用的范围主要集中在传统出版机构内容产品的元数据上。对于产品(图书、期刊等)内容部分,要根据内容本身的特点、应用情况来定,如数据结构程度比较高的内容如词典、年鉴、部分期刊文章等,需按照词条检索,这种情况就可以应用XML描述全文。由于XML及相关技术在展示内容样式上有一定的局限性(无法表达比较复杂的样式),大部分的正文内容还是通过专业的排版软件生成专有的格式,推出纸质产品,或者生成PDF进行数字化的应用,不过XML已经成为事实上的元数据描述、存储、交换的技术格式标准了。
在各种内容产品应用的专业场景下,数据结构标准不论在国内还是国外都处于一个初级阶段,为广大传统出版机构的发展带来了机会。
应用层面上的数据结构标准包含行业内产品元数据的标准,比如电子书发行数据标准ONIX,在图书馆馆配图书时的MARK数据标准等。当然,除了为了存储、交换方便的特定应用的标准外,在各个应用领域的标准也在不断地发展形成中,比如某个学科的专项内容面向用户应用标准(包括分类、数据结构)。这些标准如果建立起来并得到市场认可,就可以成为基础技术知识产权,为相关产品应用到市场中提供必要的基础准备。比如一门教育资格考试的试题资源,它的知识点体系、学习水平体系、难度体系等,都是以专家建立为基础,用户在实际应用中交互、动态构建起来的。一旦这门考试的平台成为大部分人使用的平台,那么平台后面依托的标准(需要通过时间的积累),就成为真正的准入门槛、核心价值,内容就能依托这些体系标准活起来,满足不同的应用需求。
数字出版标准需要付诸行动
目前,基础的技术格式标准主要包括XML、PDF、Epub。数据结构标准在内容的元数据上可以参考ONIX,至于在内容应用方面的标准,一定是在市场中不断与用户的交互应用中产生出来的,所以真正有价值的应用标准是做出来的,不是说出来的,更不是提前就预备好的。
在数字出版领域的标准问题上,标准不应该成为众多传统出版机构进行数字化转型的拦路虎,或者不付诸行动的借口,而应该成为传统出版机构拥抱数字化时代的巨大动力。
对于数字出版行业而言,数字出版标准化,有利于数字出版链条上的参与各方实现利益均衡,分工合作,整体降低成本,用有限的资源实现效益的最大化,实现技术兼容、数字内容的互联互通和共享。
对于一个市场中的竞争主体而言,构建市场中的标准是体现其地位的标志,也是进一步巩固其垄断市场地位的一种重要策略。
对于一个传统出版机构而言,标准的确立意味着未来可以方便与合作方(移动终端、内容集成商等)的数据交换。传统出版机构进行数字化时有这样的困惑,以前排版生成的电子文件不能直接发布出来,也不能直接应用在移动终端浏览,要应用的话必须投入资金进行数据化加工,不同的应用需要加工成不同的格式(pdf、html、epub、txt),所以传统出版机构希望能够通过数字化的加工,实现多渠道应用。
数字出版标准的困惑
“一次加工、多渠道应用”是数字化的一个目标,但是,很多出版机构都很困惑,要把经过排版的电子文档加工成什么样子,才既能在电脑上用又能在手机上用还能在电子书阅读器等移动终端上用;描述资源的基础元数据是什么结构,需要哪些元素,这些元素要怎样定义等。在国内,数字出版属于刚兴起的业务,并没有成熟的标准,有Ceb、Caj、Cebx、Epub等几十种格式。传统出版机构文件资源有:方正书版(7.0、9.0、9.1、10.0、2008)、方正飞腾(4.0、4.1、5.0)、Indesign、Pagemaker、Latex、Quark等排版软件生成的文件。如此众多的文件类型怎样进行标准化,困惑自是当然的。
数字出版标准的现状
数字出版相关业务的标准,一般分为基础的技术格式标准及数据结构标准两个层面。
XML是英文eXtensible Markup Language的简称,翻译过来叫可扩展标记语言,是设计用来传送及携带数据信息的。XML作为W3C的推广标准,已经成为计算机领域数据描述、数据交换的基本应用格式。在数字出版领域应用也非常广泛,像国际上的出版商联合会(欧洲、美国)推广的ONIX(在线信息交换)的技术格式标准就应用的是XML格式。
围绕XML还有一系列的XSL、XBRL和XPath等在XML基础上进行应用的“工具集”,XML作为基础的文件格式,除了数据存储、规范、交换方便外,更重要的是在应用端能转换成网页、PDF、Epub等格式应用到不同的终端上。
虽然,XML作为基础的数据格式已经广泛应用于数字出版领域,但是应用的范围主要集中在传统出版机构内容产品的元数据上。对于产品(图书、期刊等)内容部分,要根据内容本身的特点、应用情况来定,如数据结构程度比较高的内容如词典、年鉴、部分期刊文章等,需按照词条检索,这种情况就可以应用XML描述全文。由于XML及相关技术在展示内容样式上有一定的局限性(无法表达比较复杂的样式),大部分的正文内容还是通过专业的排版软件生成专有的格式,推出纸质产品,或者生成PDF进行数字化的应用,不过XML已经成为事实上的元数据描述、存储、交换的技术格式标准了。
在各种内容产品应用的专业场景下,数据结构标准不论在国内还是国外都处于一个初级阶段,为广大传统出版机构的发展带来了机会。
应用层面上的数据结构标准包含行业内产品元数据的标准,比如电子书发行数据标准ONIX,在图书馆馆配图书时的MARK数据标准等。当然,除了为了存储、交换方便的特定应用的标准外,在各个应用领域的标准也在不断地发展形成中,比如某个学科的专项内容面向用户应用标准(包括分类、数据结构)。这些标准如果建立起来并得到市场认可,就可以成为基础技术知识产权,为相关产品应用到市场中提供必要的基础准备。比如一门教育资格考试的试题资源,它的知识点体系、学习水平体系、难度体系等,都是以专家建立为基础,用户在实际应用中交互、动态构建起来的。一旦这门考试的平台成为大部分人使用的平台,那么平台后面依托的标准(需要通过时间的积累),就成为真正的准入门槛、核心价值,内容就能依托这些体系标准活起来,满足不同的应用需求。
数字出版标准需要付诸行动
目前,基础的技术格式标准主要包括XML、PDF、Epub。数据结构标准在内容的元数据上可以参考ONIX,至于在内容应用方面的标准,一定是在市场中不断与用户的交互应用中产生出来的,所以真正有价值的应用标准是做出来的,不是说出来的,更不是提前就预备好的。
在数字出版领域的标准问题上,标准不应该成为众多传统出版机构进行数字化转型的拦路虎,或者不付诸行动的借口,而应该成为传统出版机构拥抱数字化时代的巨大动力。