正文
鉴于上述内容,主动推理似乎能够解释模拟一个
实用现实模型的能力(即,提供一个适应性行动的知识领域的现实模型)。实际上,生成这样的模型是主动推理的核心,因为没有它,生物体就无法预测其偏好状态,因此无法维持其边界——以及身体
(Barrett,2020)。越来越多的证据表明,主动推理是,或者至少可能是,大脑和身体正在做的事情(Walsh 等人,2020;Hohwy,2013)。因此,主动推理满足了我们对意识的第一个条件,即生成一个
世界或现实模型
。这表明主动推理至少可以解释被知晓或体验的内容。然而,它尚未解释意识的为什么或如何。
任何关于意识的理论都必须解释为什么我们对某些现象有意识,而对其他现象则没有。主动推理和预测编码为意识内容是如何构建的提供了令人印象深刻的解释(尤其是在视觉流中,Peelen等人,2024)。然而,到目前为止,还没有一个被普遍接受的理论来解释决定意识所需选择性阈值的因素(Seth和Bayne,2022;Baars,2005;Kouider和Dehaene,2007)。在这一方向上确实有一些有益的尝试(Saffron,
2020;2022
;Friston,2018;Hohwy,2012;Dołęga和Dewhurst,2021)。
考虑熟悉的双眼竞争现象(Breese,1909;Tong等人,2006)。在这种情况下,每只眼睛在相同的时间、相同的视网膜位置呈现不同的图像(例如,左眼呈现一张脸,右眼呈现一座房子)。这导致了一个奇怪的情况,大脑似乎无法接受这两种对立的视觉现实。结果是,我们会在房子和脸之间逐渐切换,或者看到两者的混合。这些实验突显了某种
选择过程的存在,它使得某些感官的配置或解释进入意识,而其他则没有
(Hohwy等人,2008;Hohwy,2012)。还有无数类似的例子,包括无意注意盲(Mack,2003;Kouider和Dehaene,2007)、视觉和感官幻觉(Eagleman,2008;Laukkonen和Tangen,2017),以及内省、认知和行为上的虚构(Nisbett和Schachter,1966;Nisbett和Wilson,1977;Maier,1931;Wegner,2002;Weiskrantz,1986)。
尽管有些事物会进入意识,有些则不会,但这与意识的“难问题”关系并不像人们想象的那么大(Chalmers,1995)。考虑一下,在双眼竞争期间,无论哪种感知进入意识,我们总是(元)意识到进入我们视野的内容。换句话说,意识的存在并没有改变,只是内容变了。我们还可以意识到我们的体验从脸切换到房子,甚至可能意识到为什么会发生这种变化。
因此,关键在于似乎存在一个“空间”,在这个空间里,我们能够感受到、感知到,并且重要的是,能够知道心智的内容(Metzinger,2020)。Cleeremans等人(2020)用另一种方式表达了相同的观点:“……当一个人意识到某种情况时,她
不仅对这种状态敏感,而是知道自己对这种状态敏感。”
(我们的强调)。当我们遇到视觉幻觉、竞争或模糊刺激时,我们似乎能够
知道自己正在经历这种体验。用现象学的语言来说,我们体验到了“看见”,而现象学的透明性让位于不透明性
(Limanowski和Friston,2018;Metzinger,2003)。这种体验空间似乎是统一、连贯且结合在一起的:一个意识的整体,正如其他人所指出的(Baars等人,2013;Tononi等人,2005,2008)。因此,意识具有一种确定性的本质,就好像大脑和身体找到了一个
全球统一的可供性,在其中可以拥有自我、行动、关注事物、感受情绪,最重要的是,保持身体的存活
(Barrett,2020;Seth,2013)。
在这里,我们认为意识的门槛——即哪些内容进入这个认知领域或现实模型——是
通过对其感觉原因的各种可能解释之间的竞争过程来决定的
。此外,我们建议所谓的
绑定“问题”实际上可能是关于什么突破意识门槛的“解决方案”的一部分
。也就是说,
连贯性和界限性是赢得推理竞争的核心标准
。比喻来说,争夺意识的竞争目标是以连贯性和统一性为形状的球门柱。
如果一个推断与系统中其他并行和层级相邻的推断不连贯,那么它被选中的可能性就较小。
这种连贯性标准也自然地从旨在
减少不确定性或预测误差的系统中得
出。推断之间的不和谐等同于混乱——
一个无法简洁解释数据的生成模型
。这种令人困惑的解释导致不可减少的错误传播。连贯性的压力因现实模型的任务是为适应性行动减少不确定性(Nave 等,2020)而显得尤为重要。如果认知领域内部不连贯,随着我们评估政策或未来的路径,不确定性会累积,使得行动选择不精确且其结果不确定(即平均而言令人惊讶)。
具体来说,我们假设
连贯性和绑定自然是从进行分层贝叶斯推理的系统中产生的
(Knill & Pouget, 2004)。驱动选择的内容是什么被绑定到经验领域的
是对感官数据原因的各种可能解释之间的精度加权竞争
(即一种在大脑中争取“名声”的竞争,Dennett, 1995; 2001)。关键在于,赢得精度加权竞争的部分原因是那些与现有现实模型(即先验)最一致的内容,这为可以被吸收到认知领域中的内容提供了必要的约束或诱导偏差(技术上来说,经验先验)。用贝叶斯术语来说,不连贯或不一致的数据要么是不精确的——在这种情况下,相关的预测误差会被赋予较低的精度——要么是无法解释的——在这种情况下,精度加权会选择那些可以被解释的数据。我们通过面部感知中的微观绑定示例来说明这一贝叶斯绑定过程(图2)。我们认为同样的想法可以扩展到现实模型下的宏观绑定。
贝叶斯绑定还提供了一种对GNWT
(Dehaene & Changeux, 2011; Dehaene等, 2014; Friston等, 2012)
中定义的点燃现象的新描述
。点燃指的是神经元联盟突然而广泛的激活,将信息“点燃”进入意识觉知。在GNWT中,这一过程的特点是从局部、专门处理到大脑内信息的全局可用性的非线性过渡。根据贝叶斯绑定理论,
点燃阈值是由整个层次结构中的精度竞争驱动的,其中精度也受到与现实模型(即预测精度3如果具有局部和全局一致性则更高)的一致性(自上而下)的约束。因此,点燃、绑定和竞争都被包含在主动推理之中(Whyte & Smith, 2021)。它们各自是一个通过足够复杂性和深度来减少不确定性的系统的自然结果。
一种补充的观点(参见Whyte & Smith, 2021;Whyte等, 2024)
提出,意识具体出现在连续感官感知与离散的、反事实的策略选择过程之间的界面上
。在这里,
有意识的内容对应于关于世界、身体或大脑隐藏状态的精确后验信念,这些信念从即时的感官波动中抽象出来,并且足够精确以驱动行动选择,包括主观报告
。因此,
有意识的状态与无意识状态的区别在于它们能够为离散的策略决策提供信息,反映了目标导向(利用已知信息)和探索性(解决模糊性和新颖性)需求之间的计算平衡
。一个
综合的观点可能是,贝叶斯绑定是连续感官感知与离散的、有意识的和用于反事实策略选择的精确后验之间的一个关键机制阈值。也就是说,贝叶斯绑定强调离散和精确的后验(Whyte & Smith等, 2021)也需要局部和全局的一致性,这自然推动了有意识体验的有限性和整体性。
这里的
关键要点是,贝叶斯绑定(理论上)是一切体验的核心
,从单模态过程、
多感官绑定到全局整合。也就是说,生成体验需要嵌套层次的绑定,即将先验和感官证据通过分层生成模型组合成一个近似的后验,其中这种感知合成或组合敏感地依赖于每个处理层次所提供的精度或置信度
(Friston, 2008; Hohwy, 2012; Hohwy, 2013)。这个见解是,同样的基本机制在微观和宏观层面都起作用。例如,正如我们推断茶壶是一个单一的“事物”(由把手、空心体和喷口组成),我们也把整个体验领域看作是一个单一的事物,它将地面、天空、我们的身体、其他人以及所有其他东西结合在一起。我们
假设,这个全球统一模型,无论多么最小化,对于有意识体验来说是必要但不充分的条件
。只有当这个全局后验通过底层层次结构反射回来时,才会满足意识的条件。正如我们将看到的,解释意识内容不足以捕捉即将到来的内容感知或对其的知晓感。
4. 认知深度与意识
“认知”一词意味着“与知识相关”,而“深度”一词指的是强度以及超越表面的能力(牛津英语,1989)。因此,我们所说的
“认知深度”是指一种知识或意识的能力或连续体(即深化),这种能力或连续体可以或多或少是活跃的
(即强烈或清晰的)。低认知深度的状态是指那些涉及模糊认知的状态,例如睡眠、做梦或走神;而高认知深度的状态则是指那些包含清晰或强烈认知的状态,例如专注或高度觉知的状态(Schooler, 2002; Schooler等, 2011)。正如我们将看到的,认知的强度或清晰度也可以指向认知能力本身,即反思性地知道我们知道(Dunne等, 2019; Josipovic, 2019)。
本节的目标是传达我们对“认知深度”这一概念的理解。
然后我们将在第5节中集中于对该思想进行形式化。
为了给我们的构建增加一些现象学上的细微差别,我们借用了“光明性”一词,该词在冥想传统的古老论述中经常出现(Anālayo 2017),尤其是在大乘和密宗佛教(Williams, 2013)及印度哲学中(Skorupski, 2012; Berger, 2015)。就我们的目的而言,我们将“光明性”定义为在
意识体验中认知或意识的清晰度或强度
。将认知深度与光明性联系起来的一个特别好处是避免了无限回归:“正如光源永远不会被另一个光源照亮……”(Bhartṛhari, 1963)。正如灯发出的光不仅照亮了物体,也照亮了灯本身一样,光明性和自我反省意识的概念往往息息相关(Williams, 2013)。光明性和递归表明,这只是“一种”不同程度的认知,正如光的亮度可能有所不同,但仍是同一束光。对我们来说,“光明性”提供了一个有用的隐喻——具有现象学上的共鸣——来描述意识系统的意识等级或清晰度的可能性。
现在,回到我们关于现实模型的构造。在此背景下,“光明性”是指现实模型(非局部地)认识自身程度。在一个分层主动推理系统中,必要的共享意味着现实模型包含了它存在的推断、信念或期望。用比喻来说,就好像系统的输出变成了另一种感官模态,并通过所有层次递归分布回系统中。举个比喻:当我们大声说话时,我们产生声音,并同时听到这些声音及其含义(即,我们听到自己的声音和所说的话)。因此,我们的输出(声音)也是我们的输入(声音)。我们依次生成形式(输出),然后监控该形式的全局上下文(输入),以确保我们的言语传达出连贯的意义流。我们在行动中创造的内容和通过感官感知到的内容之间存在持续的“循环”。类似地,大脑推理过程的关键输出是构建一个让我们得以生存的现实模型(类似于声音)。但这个全球性的现实模型也是系统的一种输入,并成为推理过程的一部分本身(类似于声音,参见图3)。
请注意,尽管现实模型的特定内容可以被新证据证实或否定(例如,双眼竞争中的转换),但现实模型的存在却仍在持续不断地得到验证,无论其内容如何(例如,所有变化都证实了现实模型的存在)。因此,认知领域不断在证明自身的存在(即,场域自证)。有机体采取的任何行动——小到一次眼跳、一个念头或一次呼吸——都在向自身确认它(模型)的存在。事实上,所有的模型(即贝叶斯信念)更新都在确认它的存在。因此,现实模型存在的事实成为了一个极为精确的推断,几乎不会在推理竞争中落败。
5. 超模型与微小生物
以
严谨的方式建模认知深度需要一个系统
,该系统不仅对外部状态做出预测,而且——
至关重要的是——在全球范围内递归地建模其自身的建模过程
。实现这一目标的一种方法是通过我们称之为
超生成模型或简称超模型的方法
(Friston, 2010;Parr & Friston, 2018;Ramstead等, 2022)。在
分层主动推理中,每一层都推断出更高抽象层次的隐藏原因。然而,为了捕捉认知深度,架构需要一个真正的高阶(即超)模型,该模型能够追踪每一层的推理和精度加权在整个系统中的部署情况
。形式上,我们可以假设一组
超参数Φ,它编码了在不同情境下信任哪些层更多(或更少)、如何加强或减弱预测误差的权重以及如何在整个网络中协调反馈回路(Friston等, 2017)。这种深层次的全局参数允许系统递归地“重新处理”和“重新发现”它们自己的建模过程,从而成为一个真正具有能动性的自我构建和解构系统,这让人联想到人类在适当的动机和情境下可以有意并彻底地改变自己。
至关重要的是,通过向较低层传递精度的下降预测来更新的超参数——更新上升的精度加权预测误差,这些误差又更新下降的精度预测的超参数。依此类推,无穷无尽。正是这种
递归特性赋予了信念更新以认知深度。在现象透明性和不透明性方面,我们可以将每个层级想象成一种玻璃,它可以改变其光学性质
(参见图4)。在认知深度的设定中,
精度的下降预测使透明的玻璃变得不透明,为层级提供了将信息从一层广播到下一层的情境化和选择能力
。就
灯照亮自身而言,认知深度提供了一幅非常不同的画面:一幅更类似于一系列全息屏幕
(Fields等, 2021;Fields等, 2024)在其
反射光中互相照亮的画面。这幅画面突出了认知深度的递归、非局部和(自我)反思性质。
阐明超参数集Φ如何协调整个系统是一个挑战。一种可能性是在包含“超节点”的因子图架构中定义Φ,这些超节点编码有关每个子模型精度或可靠性的条件信念(Parr & Friston, 2018)。这些超节点会向低层节点传播自上而下的信号——精度更新、门控指令或结构重组——确保每一层的推理都受到全局元信念的影响。这种机制将允许模拟反思广播何时以及如何发生,从而能够与神经生理学数据进行比较,并完善我们对生物和人工系统中认知深度的更广泛理解。
实际上,这种架构在使用一种称为
分层高斯滤波器的预测编码变体
建模
脑反应
时被证明是有用的(Iglesias等, 2013)。在计算神经科学中,
认知深度的最小形式已被用于说明注意力选择和图形与背景的分离
(Kanai等, 2015)。从技术上讲,认知深度的非局部方面继承自这样一个
事实:规定层级每个级别的精度的超参数使每个级别成为超参数马尔可夫毯的一部分(因为它们都是超参数的子项)。
这要求在
超参数上的贝叶斯信念和所有层级之间进行递归消息传递,其中精度的下降预测以精度预测误差的形式被反射回来。
有关这些二阶预测误差在预测编码架构中的功能形式,请参见Kanai等(2015)。
与参数深度不同,超模型正在对其层次结构的形状进行建模,并实时更新它。参数深度通常被实现为局部循环——在一层与另一层之间(Sandved-Smith, 2021; 2024),实现关于注意力或偏好精度的二阶推断。可以将这一概念扩展到多层,但通常通过单层或少数几层来演示。
认知深度超越了局部的二阶推断,暗示了一种全局一致的感觉:“我(系统)拥有一个多层级的生成模型,并且我知道如何在每个层级部署适当的精度——因此我知道我知道什么。” 这种认知深度是全系统的:它不仅仅是“我在关注什么?” 而是“所有这些推断层是如何以深层次(分层)的方式相互上下文化的?
” 相比之下,参数深度可以通过一些精心选择的参数来实例化,例如“似然精度”或“策略精度”(Allen等, 2019;Hesp等, 2019;Parr和Friston, 2017, 2019;Schwartenbeck等, 2015;Smith等, 2019)。而
认知深度则涉及整个深层生成模型对如何协调先验、转换、偏好、时间尺度等的“意识”。尽管如此,参数深度和认知深度显然是兼容的——认知深度勾勒出全球意识的“大局观”,而参数深度是一种在分层生成模型中实现元推断的机制,与元认知和高阶思维理论密切相关
(Fleming, 2020;Fleming等, 2012)。
在系统发育的连续过程中,真正的认知深度从何处开始出现仍然是一个悬而未决的问题。从生物学上看,所有生物系统都参与某种形式的稳态调节,而许多生物(如细菌)表现出简单的反馈回路。然而,
认知深度最简单的形式化演示可能是一个双(+)层的主动推理系统,该系统具备以下特点:
1. 推断外部状态(一个最小的世界模型——意识的“内容”部分)
2. 维持一个元层级,推断“对这些推断的信心”(对感觉原因的可能解释之间的最小竞争)
3. 从元层级的角度反思性地修改低层级的推断,形成一个自我建模的闭环(最小的认知深度)。
即使这样一个简化的系统,原则上也可以编码一种基本的“知道自己知道”的能力。这个简单的设置构成了
认知深度的最小演示:全局循环不仅包含一个世界模型,还包含一个实时的关于它如何建模世界的模型
(参见Parr & Friston, 2018;Sandved-Smith等, 2021)。然而,与我们在此所做的反思自身思维运作方式不同,
认知深度的初级形式极为基础:它们涉及对系统自身预测过程的最小元推理,没有任何更丰富的概念或内省维度
。在这个意义上,
我们的模型似乎表明
,
意识显然先于内省或复杂的元认知,至少是我们通常与这些术语相关联的那种。即使是微小的个体,也可以将其自身推理机制中的持续反馈整合进来,将“世界的感知”与一种微妙的、自我修正的“作为世界的自我的感知”联系起来。真正的自我建模(即了解自己是什么样的存在),从这个观点来看,是更晚的发展。
在自然界中,许多
单细胞生物已经显示出对细胞内状态的“自我测量”的原初形式
,但这种测量是否等同于反思性的意识仍值得商榷(Fields & Levin, 2022; 2023)。有人可能会认为,非常小的多细胞生物或微小昆虫——例如寄生蜂(Megaphragma mymaripenne)、果蝇幼虫(Drosophila melanogaster)或像
秀丽隐杆线虫(C. elegans)这样的线虫——开始接近实现最小超模型所需的复杂性。这些小型但高度整合的神经系统能够调节感官信号、调控行动策略,并通过神经调节剂重新配置局部回路,暗示了自上而下重加权的部分类比
(Marder, 2012)。这些是否足以形成一种全球一致的“知道自己知道”的能力尚不清楚,但它们是研究活体系统中反思性、多层次组织边界情况的主要目标。实际上,
可能只有当生物体投入足够的神经元(或计算)资源进行分层建模和元推理时,我们才能看到在这种意义下的认知深度的清晰近似(Friston, 2018)。尽管如此,追踪日益复杂的神经系统——甚至从小型节肢动物开始——如何处理全局精度控制,或许可以揭示最小系统至少在原则上如何展现出认知深度的核心特性。
6. 注意与元认知
在现阶段,根据我们的观点
明确几个意识层次是有用的
:
首先
,那些精度较低并失去绑定到现实模型竞争的推断,这些推断保持透明,在那一刻无法被内省。
其次,有些推断具有足够高的精度,并且与认知领域有足够的连贯性,从而赢得绑定的推断竞争
(参见图2)。这些内容至少是隐约或勉强知道的,但我们可能并没有明确地“
知道自己知道
”(例如,我们注意力的边缘,或者我们穿着的衬衫)。内容是否“明亮地”意识到取决于认知深度,即超建模(参见图3)。例如,
当输入具有足够的精度来引导分层处理,但不足以赢得绑定到现实模型的竞争时,就会发生阈下启动(Ansorge等, 2014;Elgendi等, 2018)
。真正的
阈下信息(例如,双眼竞争或视觉错觉背后的处理阶段)无法通过内省获取。在我们发现我们已经开车(或步行)到达目的地,却没有明确意识到旅程的情况下,因为我们正忙于走神或听播客,这时就出现了微妙的知觉
(即
相对盲视
,Lau & Passingham, 2006)。在这里,与
行走和驾驶相关的感官和运动数据显然是现实模型的一部分,但它们缺乏认知深度。它们足以进行适应性行动,但缺乏意识的成分。
一个
关键点是要理解现实模型中的任何内容都可以成为明确且明亮地知道的对象(参见图5):超建模可以明确跟踪任何推理层的结构和精度,这包括元认知、注意过程(即模型简化或精度更新),甚至自我(Dahl等, 2015
)。我们可以意识到我们在思考思考,或者注意状态的正念(Lutz等, 2015)。因此,