【科学技术(3)】
信息爆炸的度量
伍加,2010年3月9日
我们处于一个信息爆炸的时代。“信息爆炸”具体有什么含意?如何数量化地表示信息爆炸?这就需要知道如何表示信息的大小。比如说,欧洲粒子物理实验室每秒钟产生 40 terabytes 的信息,在 2007 年全世界共创造出了 281 exabytes 的新信息,而在 2008 年全世界共产生出了 1200 exabytes 的新信息。到 2011 年,预计新产生的信息将十倍于 2007 年的信息量。信息增加的速度非常惊人,有人预测说,每五年全世界的信息总量就会增至 10 倍。这里使用的信息量单位 “terabytes”和“ exabytes”是什么意思呢?
首先让我们来看看在十进制计数方法中如何表示大数字的。通常,人们用 K 来代表“一千”,因为英语中表示“一千”的单词以“kilo-”打头。 同理,人们用 M 表示“百万”,用 G 表示“十亿”,等等,如下表所示:
1000 K Kilo-
1000^2 M Mega-
1000^3 G Giga-
1000^4 T Tera-
1000^5 P Peta-
1000^6 E Exa-
1000^7 Z Zetta-
1000^8 Y Yotta-
在计算机中,通常使用二进制表示数字,它的表示方法类似于十进制,但有差别。无论是文字、声音、图像或其它形式的信息,在计算机中统统表示为二进制数,也就是一串由 0 和 1 组成的字符串。因此,信息在计算机中存在的最小单元称为比特(Bit),代表 0 或者 1。
把 8 个比特放在一起成为一个字节(Byte)简称为 B。一个字节可以表示一个英文字母或者一个十进制数字。字节是计算的基本单位。每 1024 个字节放在一起称为一个 Kilobyte,简称为 KB。通常一页纸的英文文章有 2 KB。每 1024^2 个字节大约是一百万个字节,称为一个 Megabyte,简称为 MB。一首流行音乐大约有 4 MB 大小,而莎士比亚全集也不过就是 5 MB。由此可见音乐比文字所占电脑空间要大得多。每 1024^3 个字节大约是十亿个字节,称为一个 Gigabyte,简称为 GB。一部两小时的电影会有 1-2 GB 的信息量。以此类推,我们可以得到如下的信息计量单位:
1 b bit
8 B Byte
1024 KB Kilobyte
1024^2 MB Megabyte
1024^3 GB Gigabyte
1024^4 TB Terabyte
1024^5 PB Petabyte
1024^6 EB Exabyte
1024^7 ZB Zettabyte
1024^8 YB Yottabyte
为了 有一个直观印象,让我们来看看使用较大信息量单位的实际例子,以此来理解“信息爆炸”的数量意义。美国国会图书馆号称是世界上最大的图书馆,它的全部藏书也就是 15 TB 的信息。Google 搜索引擎每小时要搜索1 PB 的网络信息;一百亿份《经济学人》杂志所包含的信息也就是 1 EB。今年全世界会产生 1.2 ZB 的信息,至于说 1 YB 有多大,简直无法想象。
在这信息爆炸的年代,谁也无法阅读、消费所有的信息。据加州大学圣地亚哥分校的研究,一个典型的美国家庭在2008 年平均收到 3.6 ZB 的信息,每人每天平均收到 34 GB 的信息。这么大的信息量,很难做到面面俱到,完全吸收。因此,对信息的分类、选择、和快速吸收,是对当代人的挑战。
伍加,2010年3月9日
http://blog.creaders.net/invictus/
|