第一百九十一章狼人（4）

　　图灵机，二战结束后，不长的时间里，假想出来的机器，它需要使用纸带作为输入输出，纸带是无限长的，并且机器每次只能读取并处理纸带上的一个符号，然后基于一定的规则，这个机器就能表达一切事物并能处理所有计算！

　　为了简单起见，图灵使用的符号也是二进制的0和1。图灵机的构想，奠定了电子计算机的理论基础，也证明了二进制正好也是最适合计算机系统的。

　　并且，二进制也是最简单有效的机器语言，可以用电路的通断，高电平和低电平等状态非常方便地表示0和1，因此二进制成为了整个行业的标准，也造就了整个21世纪，信息的世纪的来临。

　　2019年7月15日，英国央行英格兰银行宣布，图灵将成为英国50英镑新钞人物，以表彰其对今天人们生活方式产生的巨大影响。这一殊荣堪比英国女王。

　　在多位科学巨人的努力下，这些由0101组成的二进制符号串也就理所当然地成为了信息传输，处理以及存储的最小计量单位，其中每一位就是一个比特（bit），简写为小写的b。

　　实际使用中比特这个单位还是太小了，因此，以2的10次方(也就是1024)为步长，又定义了以下的一些单位：

　　Kbit—千比特，也就是1024bit

　　Mbit—兆比特，也就是1024Kbit

　　Gbit—吉比特，也就是1024Mbit

　　……

　　后面还有更大的单位，每一级乘以1024就可以了。

　　虽然不太理解，但乌利亚所处的时代：1个金龙=1024个银狼，1个银狼=1024个铜鹿。

　　可见，这个世界，也许创造者，就是一个地道的穿越者，一个比乌利亚他们更古老的穿越者，而形成了某种闭环，发明了帝国货币上的进制。

　　不然，乌利亚很难相信，不用二进制的人，会在这用上这样的单位进制！所以，乌利亚由此得出一个结论，一定有更早的穿越者来到了这里，并塑造了这里，制定了规则。

　　这一点而言，炼金术士常用的“衔尾蛇”符号，乌利亚就有点理解了，那是生生不息的循环往复的标识！就代表着不断地穿越和轮回。

　　有了这些假设基础，乌利亚冒着流鼻血薅头发想破脑袋的风险，开始进一步作死：那黑盒中的它们，如果假设就是一串不能解读的信息，而这串信息又可以从意识状态改变物质世界，比如通过黑盒输出了整个世界最终毁灭的命运，他该如何自处？

　　这个假设不可谓不大胆，但他很清楚，越是伟大的假设，越需要他伟大的求证，甚至可能需要用上他一辈子的时间！

　　这些信息源头又来自于哪里？如果有一个更古老的穿越者，也许光用上未来的知识还不够，而是要开始整个异世界帝国的考古？

　　当然，眼下，他这婴儿般的身体，还具备考古的条件。他目前唯一具备的，只有一副近万年的头脑。

　　他现在很像看看：一些人们常见的事物，到底含有多少信息，占用多少数据量。

　　文字

　　众所周知，英文字母有26个，理论上5比特就可以全部表示。且慢，刚才说的是小写字母，那算上大写字母，阿拉伯数字，标点符号怎么办？

　　正好，一个字节有8个比特，含有256种组合，也就可以表示所有的英文大小写，数字，标点和控制字符了！这就是著名的ASCII码表的由来。

　　乌利亚最热爱的中文情况，又要比上面的英文复杂上一些。因为中文并不是基于字母的拼音文字，而是由大量各不相同的字组成。康熙字典共收录汉字47035个，实际汉字总体数量达到了惊人的近10万个！这种情况下，用8个比特来编码汉字显然是远远不够的。

　　实际使用中，常用汉字，在UTF-8编码下，一个汉字占用3个字节（Byte），也就是用24比特来表示，不常用汉字甚至占到了4个字节。

　　《红楼梦》共有731，017个汉字，算下来就有2193051个Byte，在不考虑存储压缩算法的情况下，大约有2MB大小。

　　这个数据在21世纪看来的确很小，在曾经一块软盘只有1.4MB大小的时代，那也是庞然大物了。

　　图片

　　那么图片呢？最主流的图片格式是位图。什么叫位图呢？只需要把图片放大即可看出端倪，比如一张图片上，美女细腻的脸庞不再光滑，而是呈现为一个一个不同颜色的小方格。

　　位图是由像素组成的

　　所谓位图，也叫bitmap，实际上是由很多“带有颜色的点”组成的。

　　这些点是图像显示的基本单位，也就是放大图像之后看到的小方格，称为“像素”。

　　人们通常说一幅图片的大小，例如是1920×1080，就是长度为1920个像素，宽度为1080个像素点。乘积是2，073，600，也就是说，这个图片是两百万像素的。

　　每个像素必须要有颜色，才能组成缤纷绚丽的图片。

　　那么，这个颜色，又该如何表示呢？

　　三原色视觉理论告诉人们，任何颜色，都可以通过红色（Red）、绿色（Green）、蓝色（Blue）按照一定比例调制出来。这三种颜色，被称为“三原色”，就是RGB。

　　光学三原色：红绿蓝

　　在计算机里，红、绿、蓝也被称为“基色分量”，分别计作R，G，B，每种颜色都用8个比特来表示。

　　那一共能表达多少种颜色呢？每种颜色都有2的8次方，也就是256个等级，三种颜色混合起来，就有256×256×256=16，777，216种组合，因此也简称为1600万色。

　　RGB24位色

　　而一个像素的3个颜色共用24个比特来表示，因此，这种方式表达出来的颜色，也被称为24位色。

　　当前，主流手机的后置摄像头是1200万像素，现在我们来算一算，在没有进行压缩的情况下，一张1200万像素，原始图片是有多大：12000000x24=275Mbit=34MB！

　　这也就是大家直观感受到的：在3G时代浏览网页时，经常是文字早都看到了，图片还在转圈圈，因为图片的大小远大于文本的大小。当然，随着技术迭代，这种记忆已经远去了。

　　视频

　　那视频呢？所谓视频，其实也叫动画，都知道视频是怎么来的吧？

　　没错，大量的图片连续起来播放，因为人的眼睛有视觉暂留现象，只要连续播放的图片速度够快，人就感觉里面的画面是连续运动的，这就是视频。

　　衡量视频，又是用的什么指标参数呢？

　　最主要的一个，就是帧率。一个帧就是指视频中一幅静止的画面。帧率，就是指视频每秒钟包括的画面数量。

　　显而易见，帧率越高，画面也就越自然流畅。一般来说30帧每秒就是可以接受的，但是将性能提升至60帧每秒则可以明显提升交互感和逼真感。

　　帧率越高，视频画面越流畅

　　那视频到底能有多少数据量呢？我们就以一个分辨率1920×1280，帧率30的视频为例来算一算。

　　1920×1280=2，073，600（Pixels像素），每个像素点是24bit（前面算过的哦），也就是每幅图片2073600×24=49766400bit。

　　8bit（位）=1byte（字节），所以，49766400bit=6220800Byte≈6.22MB。

　　注意，这只是一幅1920×1280图片的原始大小，再乘以帧率30才是视频的大小，也就是说，每秒视频的大小是186.6MB，每分钟大约是11GB，一部90分钟的电影，约是1000GB。。。

　　吓尿了吧？就算你现在电脑硬盘是4TB的（实际也就3600GB），也放不下几部电影啊！

　　这可怎么办？别说硬盘放不下，要从网上下载的话，网速更是吃不消啊！

　　祖师爷香农的话犹在耳：所有的数据都是有冗余的，去掉所有冗余之后剩下的，才是我所说的信息！办法只有一个，那就是：寻找并压缩冗余数据！

　　那到底要怎样进行压缩呢？视频里同样的背景只需存一份，其余的都是冗余！一样的颜色也只需存一份，其余的也都是冗余！这些都是可压缩的。

　　经过专家们的不懈研究，一代又一代的编码方式出炉，对冗余数据的压缩能力也不断增强。目前主流的H.264编码算法，压缩率最高可达400:1，也就是说，视频可以被压缩到其原始大小的400分之一！

　　各种视频编码技术的压缩率

　　21世纪的人们，再来看看上面那个90分钟1000GB大小的视频，经过H.264编码之后，大小骤降为2.5GB，这下符合大多数人对视频大小的直觉了。

　　经过前面对文本，图片和视频的分析，我们再来看看下面的这组对比：

　　一本《红楼梦》：纯文本（未压缩），约2MB

　　一张1200万像素的照片（未压缩）：约34MB

　　一部90分钟的电影（H.264编码）：约2.5GB（也就是2500MB）

　　这张照片的大小是纯文本泱泱巨著《红楼梦》的17倍，然而一本书可能要十天半个月功夫才能啃完，看一张图片只需要几秒钟。

　　这部90分钟的电影，其大小达到了图片的近74倍，是《红楼梦》大小的1250倍！

　　由此可见，不同类型的数据，大小的差别简直是天壤之别！

　　难怪移动营业厅的小姑娘要友善地告诉人们说：上网干不同的事情，消耗的流量的多少是完全不同的。

　　从0维的信息，变成1维的传输线，2维的图片、位图，再到3维的视频，最后到4维的元宇宙，这个过程里，它们，站起来了，变成立体生动的了，它们并不一定是非生命。

　　因为，它们在变得有序，而不是无序。

　　记得，生命的逆行，逆熵么？

　　现在，知道它们的威力了~

　　当然，这都只是乌利亚的胡思乱想罢了。毕竟它们的改变，暂时，还是要倚靠人族这个肉体，或肉体创造出的工具来控制的。但如果多一问：除了人族这样的肉体以外，也有意识可以共同的使用它们呢？或者掌握它们呢？

　　人们从利用它们，很可能默默被它们包围了，被它们利用了，或者就只是相互利用罢了。

　　规则，只在人们认识的世界之内。而我们认知世界之外的，恐怕就是它们对我们的规则。

第一百九十一章 狼人（4）

第一百九十一章狼人（4）