大脑和连接主义
在看过「连接组:造就独一无二的你」后,我想写一些东西。由于我不是神经学专业人士,我所有关于大脑的知识均来自于这本科普读物,如有纰漏,还请不吝赐教。
基因组与连接组
大家都知道基因组,基因组是你携带的全套 DNA 序列,简单来说,基因组使你区别于其他动物,使你成为人类。然而光光把你和猴子区别开来还无法让科学家满足,我们还想把你和你的朋友、家人、同事区别开来。你的心智,你的思维,你的记忆,究竟是什么?虽然只是假说,但我相信答案就在连接组里。
连接组是你的神经系统结构图,但和基因组的「由 ATCG 组成的序列」不同,连接组更像一个「图」,它不仅包含了你的神经元,还包含了神经元互相之间的连接方式。你可以把它想象成是网络的拓扑图,事实上在人工智能领域,大家都期望生物学家能尽快解出人类的连接组,这样就可以参考这个拓扑图了。然而人类的大脑实在太复杂,有上千亿个神经元。科学家目前完成的进度仅是解出一个秀丽隐杆线虫的连接组,这是一个单细胞生物,它有 300 个神经元。
连接组是大脑里的神经元之间的连接方式,它随时都会改变。它随着你的生活经历改变,随着你的成长改变。作者做了一个十分生动的比喻——庞贝古城。如果我们能穿越回庞贝古城,你能看到古罗马的人们在街上走动,观察他们的生活方式,这就好比你在观测一个活着的大脑。虽然庞贝古城被火山掩埋,但是这座城市被完整地保存,你依然可以考察它的度假别墅,街道上的喷泉景观,公共浴室,酒吧,还有随处可见的阴茎崇拜,虽然你看不见街上的活人,但是你依然能研究许多罗马的生活细节。就像研究庞贝古城一样,科学家也通过研究死去的大脑的图像来研究连接组。
在你的母亲受孕的那一刻起,你的基因组就已经决定了。它会在很大程度上塑造你的人格,学过高中生物的我们知道,基因通过控制蛋白质来表达,在胚胎时期,大脑还在发育的早期,某种蛋白质就控制着最初几个神经元的排布和走向,也决定了原始的连接组。然而你的生活经历与学习行为会改变你的连接组,所以说连接组是由先天和后天共同作用的。你是谁?你就是你的连接组,连接组独一无二。
研究连接组对治疗精神疾病也十分重要,虽然人类还无法解出自己大脑的连接组,但是借助现代的技术工具,还是可以研究某一小部分大脑的连接情况。即使是这一小部分也十分有用。中风是因为大脑皮层出现了部分神经元的混乱缠结,我们能不能解开这些缠结?或者促使大脑生成新的连接来替代这些已经失去功能垂垂将死的神经元?阿尔茨海默病(又名老年痴呆症)、抑郁症、精神分裂症,我们能不能也根据神经病理来对症下药?对于先天的精神疾病,研究基因组能让我们找出是哪个蛋白质出了问题,但是真正的治疗还是得靠对于连接组的研究,毕竟破坏已经发生,生命亦已诞生。
因果性和相关性,颅相学的问题
本书对我观念影响比较深(你看我的连接组也因为这本书被改变了)的地方就是对于因果性和相关性的讨论。
在神经学发展史上,人们一直都依赖于「颅相学」。为啥爱因斯坦聪明?拿他大脑称个重吧。为啥司机认路厉害?看看他大脑的海马体有多大吧。甚至我们可以把大脑划分出几个「功能区」,这个地方是管说话的,那个地方是管语言的,那边又是管想象的。你的管说话的脑区大,你的语言能力就强;管想象的脑区大,你的想象力就丰富;你的左顶叶下方皮层够厚,说明你会说两门语言。
这当然是错误的。简单来说,脑区的大小,皮层的厚薄,无法用于评估大脑的某项能力的出众与否。如果两个变量存在统计学上的关联,我们就说这两个变量是「相关」的,我们还可以能算出一个数字,用来反映两个变量相关的程度,这个数字在 -1 到 1 之间,叫做皮尔逊相关系数。智商和大脑体积之间的系数是 r = 0.33,这是一个很弱的相关性。虽然平均来看,出租车司机的海马体更大,音乐家的小脑更大,双语人士的左顶叶下方皮层更厚。但这只是平均而言,对于个体来说,用尺寸来预测大脑的功能依然是无效的。
即使所有音乐家的小脑都更发达,我们依然无法通过小脑的尺寸来判断一个人音乐能力的高低,我们只能说这个人勤于练习音乐而导致小脑更发达。也就是说,在研究大脑功能这件事情上,我们最终要追求的是因果性而不是相关性。相关性在有些时候是很有用的,比如一个人的力量与肌肉尺寸之间的相关性是 r = 0.7。这是一个很高的相关性,为什么会这样?我们依然需要因果性:肌细胞收缩做功,而肌细胞越多则力量越大,你可以把肌肉想象成一个工厂,工人越多,产能越高。但是大脑则完全不是这样的结构体,它更像一家高科技公司,科技公司的效率更取决于员工之间的协作方式和协作效率,Facebook 在西雅图的员工人数只有 400 人,它花 10 亿美金收购的 Instagram 在被收购时只有 13 人。大脑的功能不取决于尺寸,而是取决于连接组。
「要挖掘因果性而不是相关性」对我来说是一句不错的话,我在创业做产品的过程中,常常需要统计大量的数据,诸如这个网页每天有多少人打开?这个按钮每天有多少人点击?点击后用户去了哪?这个步骤的完成率有多高?现在整个行业也在弥漫着一种氛围就是所谓的「Data-driven」。「Data-driven」是不错,可以让我们以前所未有的方式了解你的用户是如何使用你的产品的。但我们并不知道「用户点击了某个按钮」与「用户喜欢这个功能」之间的相关性有多高,更别提因果性了。比如说,从你的用户反馈来看,你的产品差评率很低,这很可能不是因为你的产品做得很好,而是因为你的产品已经差到了用户根本不愿意吐槽的地步。
科学的方法应该是挖掘相关性背后的因果性,即用户内心深处真实的声音。牛逼的产品经理往往能一眼看穿,但像你我这样的大多数人恐怕不能依靠这样神乎其神的技巧。如何通过实验数据来证明一个猜想呢?答案你在初中就学过,那就是「设置对照组」。只可惜我们无法控制多重平行宇宙,而用户在使用一个产品的过程中干扰变量实在太多,所以在产品的数据收集过程中,发现真正的问题是很困难的,因为数据本身不表达观点,表达观点的是人。「Data-driven」是很重要,但是「The fact behind the data」更重要。
真实世界是极其复杂的,变量太多了。实验室里构造出来的环境则简单的多,这就是为什么社会科学这么难,以至于我们到现在也没能得出多少像物理定律一样简洁又普适的社会定律。
记忆的猜想
按照作者的解释,记忆就是突触链,回忆则是在突触链之间的神经传导。科学家曾经发现了一个有趣的神经元,他们把它叫做珍妮弗·安妮斯顿神经元(群)。因为在给受试者观看珍妮弗的图像或影音片段时,大脑中某一片特定区域的神经元就会被激活,而其他任何没有出现珍妮弗的资料都无法让它激活。科学家认为这个神经元代表的就是珍妮弗·安妮斯顿。我们有如此多的神经元,以至于我们可以用神经元代表世界上任何一个概念与事物。但事实又不全然是这样,假设你的大脑里有这样一段记忆,那是你和你的初恋接吻的记忆,如此美好的记忆想必你应该不会忘记。假设这个回忆是在一个红房子旁边,头顶是蓝天,脚下是绿草地,你的初吻就此发生。当你回忆起来的时候,很可能是代表蓝天的神经元先发生神经冲动,接着是与之相连的代表绿草地的神经元再发生神经冲动,然后触发一系列的回忆。
当受试者看到珍妮弗·安妮斯顿时,很可能是他的视网膜神经元收到感光细胞的刺激,然后代表蓝眼睛,黄头发的神经元发生神经冲动,接着一系列后续相连着的神经元都发生冲动,此时他便可以识别出珍妮弗·安妮斯顿了。
记忆究竟是如何建立起来的?当两个神经元被反复地按照先后顺序激活,这两个神经元之间就产生一个强连接,这被称作「赫布规则」。能这么做的前提是两个神经元之间本来就有弱连接。但是在他们产生强连接之前,这两个神经元并不知道他们将来某一个时刻会被联系在一起。大脑的做法是参照「达尔文进化论」,动态地产生一些随机的连接,如果这两个神经元之间的连接不会被激活,那么这个弱连接就被淘汰,反之则被增强。这就像是河流,水流过的地方会产生沟渠,而沟渠又会反过来帮助水流更高效地流动。
我曾经读过一本书,叫做「如何高效学习」。这本书对「类比」这个的学习方法推崇备至,并且作者根据亲身经历(作者极其牛逼)也做了一些关于大脑的猜想。因为类比可以让你将两个具有相似性质(我认为本质上是有部分重合的神经元)的概念或技能联系起来,这就有点像是在神经元细胞群与神经元细胞群之间建立起强连接。这有助于你更好地记住一样东西,或者理解一个概念。
我们来看两个李笑来老师的精彩类比:
第一个,是「获得财务自由」就像「挣脱地心引力,达到第二宇宙速度」。我们必须提高自己挣钱的加速度,同时需要去掉多余的财政「重力」,比如房贷,车贷,甚至需要学习火箭升空的做法,在特定的时间将多余的火箭分离丢弃。
第二个,是「与登山相比,创业更像破冰」。登山意味着你非常清楚你的目标在哪儿,你只要一步一步按照计划往上攀登即可。但是创业却完全不是这样,要说像的话,我认为「高考」更像登山:会一道题的解法就意味着能多拿一分,多掌握一个知识点就意味着能多拿一分,大致的题型也会提前公布,目标也很明确,就是拿高分。破冰的情形是,你可能刚砸两下冰就破了,你也可能砸了半天也砸不开,在你真的把冰砸开之前,除非你有特殊工具,否则你无法知道这块冰到底有多厚。
大脑修改连接组的方式
对于大脑来说,「记住」重要,「忘记」也很重要。假设你的大脑有布拉德皮特和安吉丽娜朱莉两个神经元细胞群,在你得知他们结婚了之后,你需要将他们两个神经元联系起来。假设有一天,我是说假设,这两位公众人物离婚了,你不得不解除这个连接(你可能会创建新的连接,有关 divorced 的连接)。
大脑通过四个方式来修改连接组:重新赋权,重新连接,重新连线,重新建立。这四个「重新」究竟是如何工作的,在次不再赘述,有兴趣的朋友可以购买此书。
正是因为有这四个「重新」,我们的大脑才是可塑的,连接组才是可以变化的。变化的能力与年龄相关,小孩大脑的可塑性比大人更强。其实也有例外情况,在中风患者刚患上中风的三个月内,大脑会重新加强它的可塑性,使得康复变得可能。我们还需要更多的研究,来探寻大脑这方面的机制。
脑内民主
「群体决策」往往比「单独决策」更正确,而「正确」对于大脑来说很重要。神经元与神经元之间的传导并不是单一的,而是多样性的。通过控制对电信号和化学信号传递的受体,神经元能接受各种各样来自其他神经元的「意见」。有的神经元只接受正电位,有的只接受负电位(这相当于一个反对票),有的神经元阈值很低,只要一个神经元传递电位就会被激活(有的法案只要三分之一赞成票就能通过),有的阈值又很高,需要所有与之相连的神经元都传递电位才能被激活(有的法案需要全数赞成票才能通过)。非常有趣。青春期的孩子做事非常冲动,作者推测与此有关。
脑研究的困难之处
在曾经很长一段时间内,我们根本无法看见大脑的连接组。通过光学显微镜根本无法看清楚神经元的连接。后来有了电子显微镜,分辨率是够了,但是切片的质量又成了头疼的问题。切片是连续的电子显微镜成像,把许多切片叠在一起,就能得到三维的图像。因为切片很薄,难免会在制备切片的过程中出现损坏和污染。
经过一段时间的发展,几个实验室的科学家用几种不同的方案制作出了更好的切片制作工具,这才使得我们可以获得高清无码的大脑神经元切片图。
现在的问题是,我们获得了高清的连接组图,但是却无法分析它。仅仅是一立方毫米的大脑组织切片,其数据量就是 PB 级的,鼠脑的数据量,是它的一千倍,而人脑的数据量,又是鼠脑的一千倍。1 PB = 1024 TB。2015 年,淘宝网一整天的活跃数据量是 50 TB,处理它的是一家中国的互联网巨头。
通过人力来处理连接组图是不可能的。现在的进展是尝试通过机器学习的方法,训练计算机来帮助人类进行识别,但目前准确率不够高。对于人类来说很简单的事情,比如在图像上区分两个神经元,对计算机来说实在是太难了。即使我们能把机器学习模型的可靠程度训练到很高(比如 99%),在如此大量的数据面前,它犯的错误还是太多了。
与整个神经学领域不同,连接组研究的目标很明确,并且作者对达成目标的步骤也信心满满。可以说,制约连接组研究进展的关键就是「技术工具」。科技的发展往往依靠工具的发展,没有显微镜我们就无法发现细菌,无法看见精子。没有望远镜我们就无法看见木星有卫星绕着它转,也就无法推翻地心说。
不公平优势
讲个笑话,一个经济学家说:「快看,路上有 20 块钱!」另一个经济学家说:「别傻了,这是不可能的,否则它早就被别人捡走了。」这个笑话是用来讽刺有效市场假说(Efficient Markets Hypothesis, EMH)的。这是一个有争议的断言,意思是,不存在任何公平且可靠的投资方法,能确保其收益高于市场水平。
不可靠的击败市场的方法是有的,也许你随手买了个股票,这个股票就涨了。不公平的击败市场的方法也是有的,如果你在一家制药公司工作,你可能会提前知道某种新药临床试验成功。不过如果你依靠这种非公开信息而买入公司的股票,你可能会受到内幕交易指控。这两种击败市场的方法,都不满足 EMH 要求的「公平」而且「可靠」。这样的断言认为这样的方法是不存在的。投资人恨这个断言,他们认为自己是靠聪明才智成功的,但 EMH 却说他们的成功要么是靠运气,要么是靠作弊。
支持和反对 EMH 的实践证据是很复杂的,但其理论解释却很简单,如果一只股票有一个新的利好消息,那么第一个知道该消息的投资人就会抬高股价。因此,EMH 认为,好的投资机会是不存在的,就好像路边不会有 20 块钱。
为什么作者要介绍这些?作者又讲了个笑话。一个科学家说「我想到了一个绝妙实验!」另一个科学家说:「别傻了,这是不可能的,否则早就有人做过这个实验了。」这和 EMH 很类似,绝妙的实验就像路边的 20 块钱,整个科学界都是聪明又勤奋的人,他们不可能漏掉这个实验。作者提出了一个有效科学假说(Efficient Science Hypothesis,ESH):不存在任何公平且可靠的做科研的方法,能确保超越平均水平。
事实上,我也讲过一个笑话:「我有一个牛逼的创业 idea」。
回到作者的思路,科研也有不可靠的方法和不公平的方法。我们举一个不可靠方法的栗子:亚历山大发现并命名了青霉素,因为他的一个菌群偶然被产生抗体的青霉素给污染了。对于科学家来说,与其依赖不可靠的运气,不如去寻找「不公平」的优势,观测和测量的技术,就是实现这一点的路子。伽利略自己制作出了世界上第一台望远镜,「发明望远镜」使得他在天文发现领域占据了一个无人能出其右的位置。因为他有检验天体的设备,别人却没有。显微镜不是虎文列克发明的,而是配眼镜老师傅发明的,但是这些显微镜只能达到 20 - 50 倍的放大率。虎文列克把这个倍率提高了 10 倍,而且与普通显微镜许多镜片不同,他的显微镜只需要一块镜片。没人知道他是怎么做的,因为他对制作方法始终保密。他制作出了比所有竞争者更好用的显微镜,接着你懂得,他成为了微生物之父。
如果你是一个需要买设备的科学家,而且很擅长拉经费,那你有可能得到比竞争对手更好的设备。但是如果你能自己制造用钱买不到的设备,那你就拥有更具决定性的优势。
假设你想到了一个绝妙的实验。有没有人做过?去查文献,搞清楚。如果没有人做过,你就得好好想想为什么没有。也许是因为这根本不是个好想法,但还有可能是因为缺乏必要的技术手段。如果这时你有机会得到合适的设备,就有可能抢在所有人之前做这个实验。
科研竞争的背后往往是技术的竞争,人们往往能记住做出重大发现的人,背后的实验仪器却鲜有人关注。一场战争中,人们能记住立下功勋的名将,却很少关注背后的技术发明:枪炮、战斗机、原子弹。这些杀人机器的发明者,不断地改变着战争的面貌,而这不是任何一位将军能做到的。
其实在上一节中,制备切片的仪器也经历了一场类似的「军备竞赛」。大家都希望建立起自己的不公平优势,这让我想起了许多互联网创业中许多投资人都喜欢的「技术壁垒」。当我读到「比所有竞争者更好用」、「抢在所有人之前」的时候,我觉得这和创业太他妈的像了。创业者创业和投资人投资其实没什么区别,都是投资。投资人投入资金,创业者投入人力成本和知识成本,当然还有时间成本。毕竟当你投身于一个行业的时候,你就暂时放弃了其他所有行业的机会。
「你」是谁
作者基于连接组学,在书的最后一个部分介绍了「人体冷冻」和「思维上传」,并认真地探讨了这两种实现永生方法的可行性。这里让我想起了一个名叫「SOMA」的游戏,游戏里人类的思维可以被扫描保存,并导入到一台机器人中。也让我想起了「刀剑神域 UnderWorld」,这部作品中有「思维复制」的情节,也有对「人造思维」的描述。
许多文艺青年到现在都相信人类除了肉体之外还有着灵魂。而许多理工科知识分子则对这一观点不以为然。读了这本书后,你应该更加相信他们口中那 21 克的灵魂是不存在的。你现在的所思所想是神经冲动,你的人格和记忆是连接组。
几个世纪以来,科学家一直动摇着我们关于灵魂的信仰。物理学家说「你是一堆原子,与宇宙中其他所有原子一样,自宇宙诞生之初就按照同样的物理规律运动和碰撞」,生物学家说「你是一台机器,由细胞和一些特殊分子比如 DNA 组成,与人类制造的机器没有什么本质的不同,只是更加复杂而已」。
然而,计算机科学又迫使我们重新审视这一观点。我们已经可以接受「信息和信息的载体」这样的概念,如果你把一台电脑毁了,但里面的硬盘尚存,接在新的电脑上,里面的信息依然完好。我们可以反驳说「我不是我的原子,我是我原子的排布模式」、「我不是我的神经元,我是这些神经元的连接模式」。
有人会说,当你把旧数据导入到新计算机里时,旧计算机的灵魂就转世到了新的计算机上了。他们甚至说「信息就是新灵魂」。我们绕了一圈,又回到了原点,自我终究还是非物质的存在。