论文部分内容阅读
我们生活在一个“信息时代”,而且“信息”正在“爆炸”。谈到信息爆炸的程度,美国人多爱引用西奥多·罗斯扎克(Theodore Roszak)《信息崇拜》(TheCult of Information)一书里的例子。罗斯扎克说,现在,一份《纽约时报》所含的信息量比17世纪一个普通英国人一生当中所接触的信息还要多。
2009年12月9日,加州大学圣地亚哥分校的“全球信息产业研究中心”(Global Information Industry Center)发布了一份研究报告《信息2009》(HowMuch Information2009),统计2008年美国家庭的信息消费。这份研究报告所说的信息,是指“传送给个人、供个人使用的信息”,不包括人们上班时消费的信息。研究的数据取自20种不同的渠道,从传统的书籍报刊到新兴的手机游戏到卫星广播和网络视频。研究人员用三个标准来衡量大众的信息消费:小时、字数和字节。
2008年,按消费时间算,美国家庭消费信息的时间总数为1.3兆小时,平均每人每天消费信息12个小时(这里说的信息消费包括读书、上网、玩手机游戏、听收音机、看网络视频等)。若按字节和字数算,2008年美国家庭总共消费了3.6个皆字节(Zettabyte)的信息,10845万亿个字,平均下来。每人每天消费34个吉字节,10万个字(列夫·托尔斯泰的《战争与和平》英文版有46万字)。
在二进制里,数字信息的传输和存储的基本单位是比特(bit)和字节(byte)。一个比特的信息是0或1,一个英文字母大约是5个比特,一个字节是8个比特。衡量数字信息的其他单位还有: 千字节(Kilobyte,KB),一个千字节=1024个字节。一页打印纸的内容相当于2个千字节,一幅低清晰度照片有100个千字节。
兆字节(Megabyte,MB),一个兆字节=106字节。通常,一本书数字化以后,容量是一个兆字节,一幅高清晰度照片有2个兆字节,一部英文版莎士比亚全集有5个兆字节,一张光盘有500个兆字节。
吉字节(Gigabyte,GB),一个吉字节109字节。一个吉字节的图书可以装满一部小型卡车,100个吉字节的学术期刊可以装满一层图书馆。
太字节(Terabyte,TB),一个太字节:1012字节。5万棵树制成纸,印上字,是一个太字节。一个学术图书馆的全部馆藏相当于2个太字节。世界最大的图书馆是美国国会图书馆,那儿所有的印刷品达10个太字节。
拍字节(Petabyte,PB),一个拍字节=1015字节。美国所有学术图书馆馆藏的总和是2个拍字节。
艾字节(Exabyte,EB),一个艾字节=1018字节。人类有史以来说出的全部口头语言为5个艾字节。世界所有人的基因是6个艾字节。
皆字节(Zettabyte,ZB),一个皆字节=1021字节。
2002年,全球一共生产了5个艾字节的信息,比1999年增加了一倍。如果通过电视来播放5个艾字节的信息,一个人要坐在屏幕前观看40700年。
那么3.6个皆字节有多大呢?根据《信息2009》,如果将3.6个皆字节的文字印成图书,像砖一样垒起来,它们将覆盖全美国(包括阿拉斯加),书堆的高度达7英尺。
全球有多少信息呢?2005年10月8日,在美国全国广告商协会年会上,谷歌总裁埃里克·施密特(Eric Schmidt)说,根据一项研究报告,世界上的信息总量是500万个太字节(Terabyte),但是,其中已经被编好索引、可供网络搜索的信息仅有170个太字节。有人问,谷歌以提供信息搜索为己任,那么要多长时间,谷歌才能为全球500万太字节的信息编完索引,供人搜索?施密特回答,根据谷歌内部的估计,大约要花300年的时间。
2007年2月7日,在凯洛格技术大会(KeUogg Technology Conference)上,有人问谷歌负责产品搜索的副总裁玛丽莎·梅耶(Marissa Mayer),谷歌已经为多少信息编制了索引?梅耶说大约已经完成了500个太字节。也就是说,谷歌已经为全球0.01%的信息编制了索引。这个数字与16个月前施密特所说的170个太字节相比,多了330个太字节,增幅为194%。有人计算,如果谷歌能一直保持这个增速,那么只需28年,谷歌即可为全球500万太字节的信息编制索引。
说到信息,离不开图书。世上图书又有多少?谷歌“图书原数据小组”(Google Books metadata team)负责人乔恩·沃万特(Jon Orwant)透露,根据谷歌的统计,截至2009年8月28日,世界上的图书一共有1.68亿种(精确地说,有168178719种)。
中文信息有多少呢?笔者还未看到有关的统计,但是,2009年10月21日,在高德纳咨询公司(Gartner)主办的一次电子技术研讨会上,谷歌总裁施密特预计,5年后,中文的内容将在互联网上占统治地位。
(本文作者系纽约佩斯大学出版系兼职教授,本刊特约撰稿人)
2009年12月9日,加州大学圣地亚哥分校的“全球信息产业研究中心”(Global Information Industry Center)发布了一份研究报告《信息2009》(HowMuch Information2009),统计2008年美国家庭的信息消费。这份研究报告所说的信息,是指“传送给个人、供个人使用的信息”,不包括人们上班时消费的信息。研究的数据取自20种不同的渠道,从传统的书籍报刊到新兴的手机游戏到卫星广播和网络视频。研究人员用三个标准来衡量大众的信息消费:小时、字数和字节。
2008年,按消费时间算,美国家庭消费信息的时间总数为1.3兆小时,平均每人每天消费信息12个小时(这里说的信息消费包括读书、上网、玩手机游戏、听收音机、看网络视频等)。若按字节和字数算,2008年美国家庭总共消费了3.6个皆字节(Zettabyte)的信息,10845万亿个字,平均下来。每人每天消费34个吉字节,10万个字(列夫·托尔斯泰的《战争与和平》英文版有46万字)。
在二进制里,数字信息的传输和存储的基本单位是比特(bit)和字节(byte)。一个比特的信息是0或1,一个英文字母大约是5个比特,一个字节是8个比特。衡量数字信息的其他单位还有: 千字节(Kilobyte,KB),一个千字节=1024个字节。一页打印纸的内容相当于2个千字节,一幅低清晰度照片有100个千字节。
兆字节(Megabyte,MB),一个兆字节=106字节。通常,一本书数字化以后,容量是一个兆字节,一幅高清晰度照片有2个兆字节,一部英文版莎士比亚全集有5个兆字节,一张光盘有500个兆字节。
吉字节(Gigabyte,GB),一个吉字节109字节。一个吉字节的图书可以装满一部小型卡车,100个吉字节的学术期刊可以装满一层图书馆。
太字节(Terabyte,TB),一个太字节:1012字节。5万棵树制成纸,印上字,是一个太字节。一个学术图书馆的全部馆藏相当于2个太字节。世界最大的图书馆是美国国会图书馆,那儿所有的印刷品达10个太字节。
拍字节(Petabyte,PB),一个拍字节=1015字节。美国所有学术图书馆馆藏的总和是2个拍字节。
艾字节(Exabyte,EB),一个艾字节=1018字节。人类有史以来说出的全部口头语言为5个艾字节。世界所有人的基因是6个艾字节。
皆字节(Zettabyte,ZB),一个皆字节=1021字节。
2002年,全球一共生产了5个艾字节的信息,比1999年增加了一倍。如果通过电视来播放5个艾字节的信息,一个人要坐在屏幕前观看40700年。
那么3.6个皆字节有多大呢?根据《信息2009》,如果将3.6个皆字节的文字印成图书,像砖一样垒起来,它们将覆盖全美国(包括阿拉斯加),书堆的高度达7英尺。
全球有多少信息呢?2005年10月8日,在美国全国广告商协会年会上,谷歌总裁埃里克·施密特(Eric Schmidt)说,根据一项研究报告,世界上的信息总量是500万个太字节(Terabyte),但是,其中已经被编好索引、可供网络搜索的信息仅有170个太字节。有人问,谷歌以提供信息搜索为己任,那么要多长时间,谷歌才能为全球500万太字节的信息编完索引,供人搜索?施密特回答,根据谷歌内部的估计,大约要花300年的时间。
2007年2月7日,在凯洛格技术大会(KeUogg Technology Conference)上,有人问谷歌负责产品搜索的副总裁玛丽莎·梅耶(Marissa Mayer),谷歌已经为多少信息编制了索引?梅耶说大约已经完成了500个太字节。也就是说,谷歌已经为全球0.01%的信息编制了索引。这个数字与16个月前施密特所说的170个太字节相比,多了330个太字节,增幅为194%。有人计算,如果谷歌能一直保持这个增速,那么只需28年,谷歌即可为全球500万太字节的信息编制索引。
说到信息,离不开图书。世上图书又有多少?谷歌“图书原数据小组”(Google Books metadata team)负责人乔恩·沃万特(Jon Orwant)透露,根据谷歌的统计,截至2009年8月28日,世界上的图书一共有1.68亿种(精确地说,有168178719种)。
中文信息有多少呢?笔者还未看到有关的统计,但是,2009年10月21日,在高德纳咨询公司(Gartner)主办的一次电子技术研讨会上,谷歌总裁施密特预计,5年后,中文的内容将在互联网上占统治地位。
(本文作者系纽约佩斯大学出版系兼职教授,本刊特约撰稿人)