图灵机,二战结束后,不长的时间里,假想出来的机器,它需要使用纸带作为输入输出,纸带是无限长的,并且机器每次只能读取并处理纸带上的一个符号,然后基于一定的规则,这个机器就能表达一切事物并能处理所有计算!
为了简单起见,图灵使用的符号也是二进制的0和1。图灵机的构想,奠定了电子计算机的理论基础,也证明了二进制正好也是最适合计算机系统的。
并且,二进制也是最简单有效的机器语言,可以用电路的通断,高电平和低电平等状态非常方便地表示0和1,因此二进制成为了整个行业的标准,也造就了整个21世纪,信息的世纪的来临。
2019年7月15日,英国央行英格兰银行宣布,图灵将成为英国50英镑新钞人物,以表彰其对今天人们生活方式产生的巨大影响。这一殊荣堪比英国女王。
在多位科学巨人的努力下,这些由0101组成的二进制符号串也就理所当然地成为了信息传输,处理以及存储的最小计量单位,其中每一位就是一个比特(bit),简写为小写的b。
实际使用中比特这个单位还是太小了,因此,以2的10次方(也就是1024)为步长,又定义了以下的一些单位:
Kbit—千比特,也就是1024bit
Mbit—兆比特,也就是1024Kbit
Gbit—吉比特,也就是1024Mbit
……
后面还有更大的单位,每一级乘以1024就可以了。
虽然不太理解,但乌利亚所处的时代:1个金龙=1024个银狼,1个银狼=1024个铜鹿。
可见,这个世界,也许创造者,就是一个地道的穿越者,一个比乌利亚他们更古老的穿越者,而形成了某种闭环,发明了帝国货币上的进制。
不然,乌利亚很难相信,不用二进制的人,会在这用上这样的单位进制!所以,乌利亚由此得出一个结论,一定有更早的穿越者来到了这里,并塑造了这里,制定了规则。
这一点而言,炼金术士常用的“衔尾蛇”符号,乌利亚就有点理解了,那是生生不息的循环往复的标识!就代表着不断地穿越和轮回。
有了这些假设基础,乌利亚冒着流鼻血薅头发想破脑袋的风险,开始进一步作死:那黑盒中的它们,如果假设就是一串不能解读的信息,而这串信息又可以从意识状态改变物质世界,比如通过黑盒输出了整个世界最终毁灭的命运,他该如何自处?
这个假设不可谓不大胆,但他很清楚,越是伟大的假设,越需要他伟大的求证,甚至可能需要用上他一辈子的时间!
这些信息源头又来自于哪里?如果有一个更古老的穿越者,也许光用上未来的知识还不够,而是要开始整个异世界帝国的考古?
当然,眼下,他这婴儿般的身体,还具备考古的条件。他目前唯一具备的,只有一副近万年的头脑。
他现在很像看看:一些人们常见的事物,到底含有多少信息,占用多少数据量。
文字
众所周知,英文字母有26个,理论上5比特就可以全部表示。且慢,刚才说的是小写字母,那算上大写字母,阿拉伯数字,标点符号怎么办?
正好,一个字节有8个比特,含有256种组合,也就可以表示所有的英文大小写,数字,标点和控制字符了!这就是著名的ASCII码表的由来。
乌利亚最热爱的中文情况,又要比上面的英文复杂上一些。因为中文并不是基于字母的拼音文字,而是由大量各不相同的字组成。康熙字典共收录汉字47035个,实际汉字总体数量达到了惊人的近10万个!这种情况下,用8个比特来编码汉字显然是远远不够的。
实际使用中,常用汉字,在UTF-8编码下,一个汉字占用3个字节(Byte),也就是用24比特来表示,不常用汉字甚至占到了4个字节。
《红楼梦》共有731,017个汉字,算下来就有2193051个Byte,在不考虑存储压缩算法的情况下,大约有2MB大小。
这个数据在21世纪看来的确很小,在曾经一块软盘只有1.4MB大小的时代,那也是庞然大物了。
图片
那么图片呢?最主流的图片格式是位图。什么叫位图呢?只需要把图片放大即可看出端倪,比如一张图片上,美女细腻的脸庞不再光滑,而是呈现为一个一个不同颜色的小方格。
位图是由像素组成的
所谓位图,也叫bitmap,实际上是由很多“带有颜色的点”组成的。
这些点是图像显示的基本单位,也就是放大图像之后看到的小方格,称为“像素”。
人们通常说一幅图片的大小,例如是1920×1080,就是长度为1920个像素,宽度为1080个像素点。乘积是2,073,600,也就是说,这个图片是两百万像素的。
每个像素必须要有颜色,才能组成缤纷绚丽的图片。
那么,这个颜色,又该如何表示呢?
三原色视觉理论告诉人们,任何颜色,都可以通过红色(Red)、绿色(Green)、蓝色(Blue)按照一定比例调制出来。这三种颜色,被称为“三原色”,就是RGB。
光学三原色:红绿蓝
在计算机里,红、绿、蓝也被称为“基色分量”,分别计作R,G,B,每种颜色都用8个比特来表示。
那一共能表达多少种颜色呢?每种颜色都有2的8次方,也就是256个等级,三种颜色混合起来,就有256×256×256=16,777,216种组合,因此也简称为1600万色。
RGB24位色
而一个像素的3个颜色共用24个比特来表示,因此,这种方式表达出来的颜色,也被称为24位色。
当前,主流手机的后置摄像头是1200万像素,现在我们来算一算,在没有进行压缩的情况下,一张1200万像素,原始图片是有多大:12000000x24=275Mbit=34MB!
这也就是大家直观感受到的:在3G时代浏览网页时,经常是文字早都看到了,图片还在转圈圈,因为图片的大小远大于文本的大小。当然,随着技术迭代,这种记忆已经远去了。
视频
那视频呢?所谓视频,其实也叫动画,都知道视频是怎么来的吧?
没错,大量的图片连续起来播放,因为人的眼睛有视觉暂留现象,只要连续播放的图片速度够快,人就感觉里面的画面是连续运动的,这就是视频。
衡量视频,又是用的什么指标参数呢?
最主要的一个,就是帧率。一个帧就是指视频中一幅静止的画面。帧率,就是指视频每秒钟包括的画面数量。
显而易见,帧率越高,画面也就越自然流畅。一般来说30帧每秒就是可以接受的,但是将性能提升至60帧每秒则可以明显提升交互感和逼真感。
帧率越高,视频画面越流畅
那视频到底能有多少数据量呢?我们就以一个分辨率1920×1280,帧率30的视频为例来算一算。
1920×1280=2,073,600(Pixels像素),每个像素点是24bit(前面算过的哦),也就是每幅图片2073600×24=49766400bit。
8bit(位)=1byte(字节),所以,49766400bit=6220800Byte≈6.22MB。
注意,这只是一幅1920×1280图片的原始大小,再乘以帧率30才是视频的大小,也就是说,每秒视频的大小是186.6MB,每分钟大约是11GB,一部90分钟的电影,约是1000GB。。。
吓尿了吧?就算你现在电脑硬盘是4TB的(实际也就3600GB),也放不下几部电影啊!
这可怎么办?别说硬盘放不下,要从网上下载的话,网速更是吃不消啊!
祖师爷香农的话犹在耳:所有的数据都是有冗余的,去掉所有冗余之后剩下的,才是我所说的信息!办法只有一个,那就是:寻找并压缩冗余数据!
那到底要怎样进行压缩呢?视频里同样的背景只需存一份,其余的都是冗余!一样的颜色也只需存一份,其余的也都是冗余!这些都是可压缩的。
经过专家们的不懈研究,一代又一代的编码方式出炉,对冗余数据的压缩能力也不断增强。目前主流的H.264编码算法,压缩率最高可达400:1,也就是说,视频可以被压缩到其原始大小的400分之一!
各种视频编码技术的压缩率
21世纪的人们,再来看看上面那个90分钟1000GB大小的视频,经过H.264编码之后,大小骤降为2.5GB,这下符合大多数人对视频大小的直觉了。
经过前面对文本,图片和视频的分析,我们再来看看下面的这组对比:
一本《红楼梦》:纯文本(未压缩),约2MB
一张1200万像素的照片(未压缩):约34MB
一部90分钟的电影(H.264编码):约2.5GB(也就是2500MB)
这张照片的大小是纯文本泱泱巨著《红楼梦》的17倍,然而一本书可能要十天半个月功夫才能啃完,看一张图片只需要几秒钟。
这部90分钟的电影,其大小达到了图片的近74倍,是《红楼梦》大小的1250倍!
由此可见,不同类型的数据,大小的差别简直是天壤之别!
难怪移动营业厅的小姑娘要友善地告诉人们说:上网干不同的事情,消耗的流量的多少是完全不同的。
从0维的信息,变成1维的传输线,2维的图片、位图,再到3维的视频,最后到4维的元宇宙,这个过程里,它们,站起来了,变成立体生动的了,它们并不一定是非生命。
因为,它们在变得有序,而不是无序。
记得,生命的逆行,逆熵么?
现在,知道它们的威力了~
当然,这都只是乌利亚的胡思乱想罢了。毕竟它们的改变,暂时,还是要倚靠人族这个肉体,或肉体创造出的工具来控制的。但如果多一问:除了人族这样的肉体以外,也有意识可以共同的使用它们呢?或者掌握它们呢?
人们从利用它们,很可能默默被它们包围了,被它们利用了,或者就只是相互利用罢了。
规则,只在人们认识的世界之内。而我们认知世界之外的,恐怕就是它们对我们的规则。