论文部分内容阅读
【摘 要】本文从计算机字符编码的发展历程、藏文字符编码国际标准的确立、藏文输入法、藏文字体等方面进行论述,从专业角度说明只有顺应科学发展的方向,才能使藏文的信息化更快走向世界。
【关键词】网络时代 藏文 输入法
【中图分类号】TP391.1【文献标识码】A【文章编号】1006-9682(2011)08-0175-02
有人把藏文称为“写在世界屋脊上的文字”,作为世界上最古老的文字之一,为传承藏族文化做出了重要贡献,更是今天广大藏族同胞用于阅读、交流的重要工具。如今,伴随网络时代的到来,藏文这一古老的文字也焕发出新的生命力。
目前的藏文网络信息技术,存在着藏文编码混乱的问题。这种混乱的编码局面是由于之前国际藏文编码标准不统一,各成一家造成的。现在虽然国际藏文编码标准已经出台,但混乱的编码仍然在使用,很多机构十几年都是在使用非国际标准的代码进行藏文的输入。不符合国际标准的输入软件和藏文字体的继续使用,对藏文网络化和国际化是一个很大的绊脚石,严重阻碍藏文更近一步地走向网络世界。因此,有必要认真分析和研究藏文国际编码的使用情况,以便统一标准,推进藏文网络化和国际化。
一、计算机字符编码的发展历程
在计算机内部广泛采用的是二进制码,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码)。而大家如果要想互相通信而不造成混乱,就必须使用相同的编码规则。于是美国有关的标准化组织就出台了ASCII编码,统一规定了常用符号用哪些二进制数来表示,每个ASCII字符占用1个字节,可以表示的最大字符数是256。这种字符编码规范显然用来处理英文没有什么问题,但是面对中文之类复杂的文字,256个字符显然不够。于是,各个国家纷纷制定了自己的文字编码规范。
世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。这时候,我们就知道,要真正解决问题,也不能仅靠一个国家来解决,而必须有一个全新的编码系统,这个系统要将世界上所有的符号都纳入其中,将所有的文字统一起来考虑,为每种文字都分配不同编码,每个符号对应一个唯一的编码,大家都使用这个编码表,就不会出现编码不匹配现象,乱码问题也就不存在了。于是,Unicode编码诞生了。
Unicode的学名是“Universal Multiple-Octet Coded Character Set”,简称为UCS。Unicode有两套标准,目前常用的UCS-2,就是16位二进制来统一表示所有的字符。Unicode固然统一了编码方式,但是它的效率不高,为了提高Unicode的编码效率,出现了一些中间格式的字符集,被称为“通用转换格式”,即UTF,可以根据不同的符号自动选择编码的长短。
二、藏文字符编码
我国于1984年开始运用计算机处理藏文信息,早期的藏文软件主要针对文字处理,由于缺乏统一的编码而互不兼容。我国对藏文软件的开发和应用高度重视,编制的《通用多八位编码字符集》藏文编码国际标准提案,在与美、英、印度、爱尔兰等国提出的藏文编码提案的激烈竞争中,于1997年7月《信息交换用藏文编码字符集》国际标准通过了严格的国际标准化组织(ISO)审核程序。使藏文成为我国少数民族文字中第一个具有国际标准、获得全球信息高速公路通行证的文字,成为国际统一使用的藏文编码标准,有效地维护了中国作为藏文故乡的权威地位和中国语言文字的主权地位。为进一步开发藏文软件,2004年通过了《藏文编码字符集扩充集A》的国家标准、在2008年通过了《藏文编码字符集扩充集B》的国家标准。藏文字符扩充了7205个,包括现代藏文、古藏文和梵音转写的藏文字符,藏文覆盖率达到99.99%。正因为有了这个标准,一系列藏文应用软件开发了出来,普遍使用的Windows系统、Linux系统等在2007年以后都自带了藏语配置。
三、藏文输入法
输入法的需求是来源于键盘的限制,键盘只有一百多个键,在没有软件的帮助下它是无法输入中文或其他大型形意文字的语言。所以在不同语言、国家或地区,有多种不同的输入法。
随着多媒体网络和软件技术不断普及和发展,一些研究单位、软件公司及编程爱好者先后开发了基于目前流行操作系统平台下的藏文输入法软件。如:同元藏文输入法、央金藏文输入法、班智达藏文输入法、琼迈藏文输入法、宗卡藏文输入法、加央藏文输入法、Monlam藏文输入法、珠穆朗玛藏文转写输入法和Windows Vista/7系统中自带的Unicode编码的Himalaya藏文输入法等等。
现在藏文软件有很多,键盘录入布局也有很多种,不同地区习惯使用的是不同输入法。那么怎样选择符合标准的、规范的输入法呢?究竟哪种输入法好呢?
其实无论用户使用哪种输入法,都需要达到:易学、使用简单、输入速度快、兼容性好的要求。许多人都有不愿放弃已学会的东西,不愿意接受新的东西的习惯,所以只要自己以前习惯使用的输入法软件或它的升级版本能够支持藏文编码国际标准Unicode,那么就可继续使用该软件。若不支持Unicode编码,就应重新选择一种键盘布局符合自己的习惯的、输入快(比如有词组输入功能)、支持Unicode编码的输入法。选择输入法的原则是“会两种或三种输入法,熟练其中一种输入法”。只有经过长期的应用和实践,输入法的优劣才能体现出来。那么不论现在或将来开发出多少种键盘布局,都不会影响藏文软件的应用,并且能够促进藏文输入法及藏文软件的发展。
四、藏文字体
字体,是指书法派别、书写风格不同的字,即文字的风格式样。目前,已出现了多种Unicode编码的藏文字体,比如:中国藏学研究中心主持开发的“珠穆朗玛”系列藏文字体、Monlam藏文软件中有12种藏文字体、Windows系统自带的Microsoft Himalaya(喜马拉雅)字体,让藏文字体开始步入国际标准编码的道路。
在全球数字化的背景下,微软在Windows Vista/7系统中集成了藏文,藏文终于在计算机系统的核心位置占有了一席之地。依靠微软强大的技术实力和服务能力,将帮助我们结束计算机世界中藏文编码混乱不堪的局面。也有利于在全国乃至全世界范围内统一和规范藏文编码、丰富藏文字体、开发藏文软件、畅通藏文网络信息传播。随着我国藏文的信息化建设的不断深入,藏文的信息化将更快走向世界。
【关键词】网络时代 藏文 输入法
【中图分类号】TP391.1【文献标识码】A【文章编号】1006-9682(2011)08-0175-02
有人把藏文称为“写在世界屋脊上的文字”,作为世界上最古老的文字之一,为传承藏族文化做出了重要贡献,更是今天广大藏族同胞用于阅读、交流的重要工具。如今,伴随网络时代的到来,藏文这一古老的文字也焕发出新的生命力。
目前的藏文网络信息技术,存在着藏文编码混乱的问题。这种混乱的编码局面是由于之前国际藏文编码标准不统一,各成一家造成的。现在虽然国际藏文编码标准已经出台,但混乱的编码仍然在使用,很多机构十几年都是在使用非国际标准的代码进行藏文的输入。不符合国际标准的输入软件和藏文字体的继续使用,对藏文网络化和国际化是一个很大的绊脚石,严重阻碍藏文更近一步地走向网络世界。因此,有必要认真分析和研究藏文国际编码的使用情况,以便统一标准,推进藏文网络化和国际化。
一、计算机字符编码的发展历程
在计算机内部广泛采用的是二进制码,而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码)。而大家如果要想互相通信而不造成混乱,就必须使用相同的编码规则。于是美国有关的标准化组织就出台了ASCII编码,统一规定了常用符号用哪些二进制数来表示,每个ASCII字符占用1个字节,可以表示的最大字符数是256。这种字符编码规范显然用来处理英文没有什么问题,但是面对中文之类复杂的文字,256个字符显然不够。于是,各个国家纷纷制定了自己的文字编码规范。
世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。这时候,我们就知道,要真正解决问题,也不能仅靠一个国家来解决,而必须有一个全新的编码系统,这个系统要将世界上所有的符号都纳入其中,将所有的文字统一起来考虑,为每种文字都分配不同编码,每个符号对应一个唯一的编码,大家都使用这个编码表,就不会出现编码不匹配现象,乱码问题也就不存在了。于是,Unicode编码诞生了。
Unicode的学名是“Universal Multiple-Octet Coded Character Set”,简称为UCS。Unicode有两套标准,目前常用的UCS-2,就是16位二进制来统一表示所有的字符。Unicode固然统一了编码方式,但是它的效率不高,为了提高Unicode的编码效率,出现了一些中间格式的字符集,被称为“通用转换格式”,即UTF,可以根据不同的符号自动选择编码的长短。
二、藏文字符编码
我国于1984年开始运用计算机处理藏文信息,早期的藏文软件主要针对文字处理,由于缺乏统一的编码而互不兼容。我国对藏文软件的开发和应用高度重视,编制的《通用多八位编码字符集》藏文编码国际标准提案,在与美、英、印度、爱尔兰等国提出的藏文编码提案的激烈竞争中,于1997年7月《信息交换用藏文编码字符集》国际标准通过了严格的国际标准化组织(ISO)审核程序。使藏文成为我国少数民族文字中第一个具有国际标准、获得全球信息高速公路通行证的文字,成为国际统一使用的藏文编码标准,有效地维护了中国作为藏文故乡的权威地位和中国语言文字的主权地位。为进一步开发藏文软件,2004年通过了《藏文编码字符集扩充集A》的国家标准、在2008年通过了《藏文编码字符集扩充集B》的国家标准。藏文字符扩充了7205个,包括现代藏文、古藏文和梵音转写的藏文字符,藏文覆盖率达到99.99%。正因为有了这个标准,一系列藏文应用软件开发了出来,普遍使用的Windows系统、Linux系统等在2007年以后都自带了藏语配置。
三、藏文输入法
输入法的需求是来源于键盘的限制,键盘只有一百多个键,在没有软件的帮助下它是无法输入中文或其他大型形意文字的语言。所以在不同语言、国家或地区,有多种不同的输入法。
随着多媒体网络和软件技术不断普及和发展,一些研究单位、软件公司及编程爱好者先后开发了基于目前流行操作系统平台下的藏文输入法软件。如:同元藏文输入法、央金藏文输入法、班智达藏文输入法、琼迈藏文输入法、宗卡藏文输入法、加央藏文输入法、Monlam藏文输入法、珠穆朗玛藏文转写输入法和Windows Vista/7系统中自带的Unicode编码的Himalaya藏文输入法等等。
现在藏文软件有很多,键盘录入布局也有很多种,不同地区习惯使用的是不同输入法。那么怎样选择符合标准的、规范的输入法呢?究竟哪种输入法好呢?
其实无论用户使用哪种输入法,都需要达到:易学、使用简单、输入速度快、兼容性好的要求。许多人都有不愿放弃已学会的东西,不愿意接受新的东西的习惯,所以只要自己以前习惯使用的输入法软件或它的升级版本能够支持藏文编码国际标准Unicode,那么就可继续使用该软件。若不支持Unicode编码,就应重新选择一种键盘布局符合自己的习惯的、输入快(比如有词组输入功能)、支持Unicode编码的输入法。选择输入法的原则是“会两种或三种输入法,熟练其中一种输入法”。只有经过长期的应用和实践,输入法的优劣才能体现出来。那么不论现在或将来开发出多少种键盘布局,都不会影响藏文软件的应用,并且能够促进藏文输入法及藏文软件的发展。
四、藏文字体
字体,是指书法派别、书写风格不同的字,即文字的风格式样。目前,已出现了多种Unicode编码的藏文字体,比如:中国藏学研究中心主持开发的“珠穆朗玛”系列藏文字体、Monlam藏文软件中有12种藏文字体、Windows系统自带的Microsoft Himalaya(喜马拉雅)字体,让藏文字体开始步入国际标准编码的道路。
在全球数字化的背景下,微软在Windows Vista/7系统中集成了藏文,藏文终于在计算机系统的核心位置占有了一席之地。依靠微软强大的技术实力和服务能力,将帮助我们结束计算机世界中藏文编码混乱不堪的局面。也有利于在全国乃至全世界范围内统一和规范藏文编码、丰富藏文字体、开发藏文软件、畅通藏文网络信息传播。随着我国藏文的信息化建设的不断深入,藏文的信息化将更快走向世界。