科学也许就是数据压缩

本文首发于集智俱乐部: http://swarmagents.cn.13442.m8849.cn/swarma/detail.php?id=18608

小小脑洞下。最近越来越感觉到科学,学习科学和理解科学的本质其实是数据压缩。

站在计算主义视角,万物都是0101的二进制数据流,整个层次应该是这样的:

可能性一:

客观世界:有规律的二进制数据流。

科学:找到数据流的规律,进行压缩。世界和科学的关系是数据与程序代码的关系。比如123456。。。100000这串数据的规律就是+1,那么与之对应的科学就是一段for/if/while(+1)的程序代码,这段程序代码远远短于原来的数据,所以说是进行了压缩,但虽然压缩了,还是可以基本上无损耗地解压回去得到和原来一模一样的数据。一段科学代码质量的好坏是由保真率判断的。猜测:也许最核心的自然科学定理,比如未来可能的超弦理论,就对应着最短的程序代码。

学习科学:对科学这段代码再度压缩。我们都有这样的学习体验,就是学过一门课后不需要记住里面的每一句话每一个公式,而是要把握核心思想和主干知识,这个说法本质其实就是数据压缩。学的好本质上就是用头脑里更少的代码就能解压还原出所学的那段科学程序代码。(关于学习科学的更多讨论,比如为什么人学习的时候能够把物理终极理论的最短代码压缩到更短,见注2)

还能进一步压缩么?:进一步压缩就是哲学/宗教哲学了。但哲学与科学的不同就在于哲学虽然是极度的数据压缩(比如哲学宗教的“道生一,一生二,二生三,三生万物”“上帝造万物”“矛盾/阴阳生万物” vs 科学的“麦克斯韦方程组解压得到光电磁的各种性质”),却无法还原到客观世界的数据流。所以哲学有各种各样的流派,不像科学能取得共识。

可能性二:

客观世界:真随机的数据流。

科学:人(观察者)对真随机的数据流进行了主观的处理,产生了规律性。一个著名的例子就是热力学第二定律的波尔兹曼诠释:熵增是观察者的粗粒化操作引起的。如果不引入观察者,站在一个个微粒的立场,世界是没有熵增的。

学习科学,哲学:和可能性一一样。

那么,这种可能性下,我们还能说科学是客观的么?

答案是:当然还是“客观”的。不过这里的“客观”指的是能取得共识,我认为能取得共识的原因是不同的观察都是属于“大观察”的一部分,或者大观察的显现。这可能和通用图灵机能够模拟任何一台图灵机有关,所谓大观察就是通用图灵机。当然,具体的细节还不清楚,只是YY着玩而已。

可能性三:可能性一与二的组合。

遗留问题:以上只讨论了客观数据的数据流,主观世界有类似的‘数据流’么?如果有的话,比如心理现象,感知现象等,道德感之类,那么这些数据流能够有效压缩么?

我认为是有的,但只是比较‘软’而已,公认度不高。比如,参禅悟道本身没有太大信息量(最短程序代码),也许就是一个棒喝,或者看见了一朵花一棵树,或者一个‘万物皆有佛性/齐万物一死生’的基本点,但悟道这个过程却能帮助人‘悟’出一些其他人文领域的问题,比如为什么要遵守道德律,怎么调和道德律和身心舒适的关系,什么是美,人生的意义等(相信有参禅体验的人会知道这里我的意思。我认为这才是宗教哲学的意义所在,而不是像一些民科硬要把道德经去解释宇宙大爆炸这种客观世界数据流,这是用错了地方)。再比如,进化心理学对道德和情感等的解释,是一种不太软更“科学”的压缩。

从这个角度看,其实人文的学习也是一个数据压缩的过程, 和科学学习类似,只是压缩对象不同 (可能压缩方式也不同,这就是文理科学习的区别)。

接下来一个更深的问题:客观数据流和主观数据流能够合流么?

如果说数据的本质是信息的话,那么信息本身是不分主观客观的,信息是超出主客观外的第三维。

所以我猜测未来可以通过技术的进步使得客观数据流和主观数据流合流,心物界限彻底打破。

其实在这个大合流到来之前,已经有不少“合流”了。比如古代佛家说的如实‘观照’,道家说的‘照物而不取’,就是一种朴素的合流。而科学的如实研究宇宙,主观世界正确认识和反应客观世界,则是更高阶的合流。

但我觉得这些‘合流’都不是真正的合流,而只是形而上的合流。我们心理想象的一块石头和一个真实的石头还是有本质差异的,更别说像情感,道德感这类主观性很强很抽象的东西根本无法在物质宇宙里找到了(当然,找到情感脑区,道德基因这类‘对应’是可以的,但对应毕竟是只是对应,很难继续‘压缩’这些对应关系得到更短的程序代码)

那怎么实现这个最后的形而下的大合流呢?

之前写了一个想法,后来觉得不对就删了。所以现在也不知道。就留stop在这里等网友的点子吧 😉

注一:我对脑科学的看法。 脑科学是连接物理世界(物理化学生物)与心智世界(心理学)的桥梁。比如心理世界的情感可以通过脑科学研究找到脑区对应,大脑模拟/想象客观世界的时候,也能找到相应脑区的活跃。 长远来看,脑科学原则上可以找到心智世界和物理(大脑物理)世界的一一对应表。 但我认为,这个对应表无法进一步约简/压缩,比如像物理中对电学磁学光学压缩成麦克斯韦方程组那样的压缩,或者压缩成大统一理论那样的更极度的压缩,或者人文领域把一些人文知识和感悟压缩成禅学或进化心理学那样的压缩。 就目前来看,脑科学找的任何两个对应之间基本没有逻辑关系。 举个例子,脑科学对通感的研究,发现有的类型的感觉所在脑区很接近,有的还有通路相连,这能解释通感。 但注意这里的解释也是先回到脑物理层次,用脑区的相连来解释感觉的相通。感觉1对应着脑区1,感觉2对应着脑区2,这两句话/两个对应之间没有任何逻辑关系,无法压缩。

注二:确实,一段数据有最小压缩,压缩为最短程序。我在正文中猜测物理的终极理论就对应着客观数据流的最短程序。但是,即使是这个最短的终极理论,似乎人来学习的时候能够在大脑里压缩到更短(不然就不是真正理解了)。这究竟是怎么回事呢?不是已经是最短程序了么。我认为这是因为人学习的时候动用了主观世界数据流,所以数据流性质变了,能够继续压缩了。

注三:现在已经有人神经操纵机器的技术了,估计未来像攻壳机动队里人和电脑网络相连也不是难事。 从神经和电脑的角度看,意识也许就栖息在电流里。

更深一步,计算机的本质其实并不是电流,而是逻辑门。而逻辑门不是非得用电流控制的。现在已经有一些研究表明,即使是几个桌球的碰撞也能进行计算,进而构建计算机。进一步YY还能出现意识。所以未来的脑不一定真的就是一坨大脑肉球,或者一个计算机,或者一个网络,它可能以你想不到的方式存在。

发表评论

电子邮件地址不会被公开。 必填项已用*标注