欢迎您来到半岛在线登录官网

服务电话：13714267950 QQ:1364937012

联系我们 | 网站地图

工业领域

首页 > 案例展示 > 工业领域

工业领域医疗领域家用领域

逆向设计智能物质：可微分逻辑元胞自动机破解数十年难题

发布时间：2025-04-30 17:56:39 | 作者: 半岛在线登录官网

这个康威生命游戏的规则优雅而简单，专注于每个元胞如何与其周围的八个邻居元胞互动：

存活：一个死亡元胞（当前值为0）若恰好有三个活的邻居，会在下一代中复活，类似于繁殖。

存活：一个活的元胞（当前值为1）若有两个或三个活的邻居，会存活到下一代，这代表一个平衡的环境。

生命数量过剩：一个活的元胞若有超过三个活的邻居，会在下一代因过度拥挤而死亡。

这四条规则在每一步同时应用于网格中的每个元胞，创造出一场模式之舞。从这些基本交互中涌现出复杂行为：永不改变的稳定结构、按规律模式脉动的振荡器，甚至看似在网格上移动的滑翔机。正是这种从简单性中涌现的复杂性，使生命游戏成为自然系统中自组织的有力隐喻，从生物进化到星系形成，皆是如此。

鉴于其二值性和动态特性，所以生命游戏是检验可微分逻辑元胞自动机(DiffLogic CA)有效性的良好基准。

规则不受历史状态影响，元胞状态仅需占用1比特空间，系统本身无记忆。模型架构包含16个感知电路核，每个核的节点结构均为[8,4,2,1]。更新网络共23层：前16层每层包含128个节点，后续七层的节点数依次为[64,32,16,8,4,2,1]。

损失函数通过逐点计算获得。将预测网格与真实网格的平方差求和，即可得到最终数值。数学表达式如下：

模型训练采用3x3周期性网格，时间步长设置为单步。在生命游戏中，每个元胞会与周围的八个邻近元胞进行互动。元胞的下一个状态不仅取决于其当前状态，同时也会受到邻居状态的影响。由于3x3网格存在512种唯一的构型，因此在训练过程中，我们构建了覆盖全部512种构型的网格。正确预测网格的下一状态，意味着掌握了完整的生命游戏规则。训练得到的参数随后被用于模拟更大规模网格的表现。

左侧的损失曲线显示了两种逻辑门表示方式的比较结果。软损失使用前一节所述的连续近似方法计算门的输出，而硬损失则仅选择概率最高的门，并使用离散输出。两种损失完全收敛，表明生成的电路能够完美模拟生命游戏。

通过硬推理（选择概率最高的门），右侧的模拟展示了学习电路的表现。该模拟基于更大规模的网格。涌现的图案捕捉了康威生命游戏的特征：在网格间移动的滑翔机、保持固定位置的稳定方块，以及保持其独特形态的经典结构，如面包型和船型结构。对生命游戏特征模式的成功复现证明了我们的电路已有效掌握了底层局部规则。

使用的有效逻辑门总数（不包括直通逻辑门A和B）为336个。通过对逻辑门分布的统计分析，我们得知在两个网络中使用频率最高的逻辑门类型是OR门和AND门。

鉴于我们的最终电路仅由一系列二进制逻辑门组成，我们大家可以进一步深入分析并可视化整个电路的逻辑结构，下图展示了这336个逻辑门中的大部分（部分逻辑门因被确定对输出没有贡献而被剪除）。

左侧排列成3×3网格的方块是输入门，它们的排列方式模拟了生命游戏中单个中心元胞的视角。导线)时显示为绿色，低电平(0)时显示为红色。各个逻辑门绝大多数都是非常清晰的，包括AND（与）门、OR（或）门或XOR（异或）门，其中输入端或输出端的小圆圈表示在该连接处有NOT（非）操作。为简化可视化效果，我们还将二元的NotB和NotA门替换为单输入的非门，并剪除了未使用的输入端，简化视觉呈现。此外，部分门仅表示True（真）或False（假），它们与输入端外观几乎相同，呈现为嵌套方块：实心的代表True，空心的代表False。

在最右侧，我们正真看到电路的单一输出通道——这恰好表示生命游戏中元胞的新状态。在图中的这一特定配置下，我们大家可以看到电路正确计算了任何死亡元胞，如果恰好有三个活的邻居，就会变成活元胞，仿佛通过繁殖一样这一规则。

神经元胞自动机（NCA）在斑图生成任务[3]中展现出了卓越的能力，这启发我们探索可微分逻辑元胞自动机（diffLogic CA）的类似潜能。在此任务中，系统从随机初始状态出发，逐步演化至目标图像。允许多步计算过程，仅在最终时刻评估损失函数。这一设计促使模型自主发现离散转换规则。这些规则需引导系统经历连贯的状态序列，无需逐步监督。

成功学习重构图像将验证两个关键方面：1.模型能否通过习得规则形成长效动力学；2.能否有效学习具有状态记忆、时间递归和空间递归特性的电路结构。据我们所知，本研究特别的重要，因为它代表了首次在递归环境中对可微分逻辑门网络[4][5]进行的探索。

我们考虑元胞状态（通道）为8位，并将DiffLogic CA迭代20步。模型架构包含16个感知电路核，每个核在各层分别有8、4和2个逻辑门。更新网络包含16层：前10层每层各有256个门，随后各层门数分别为[128、64、32、16、8、8]。

我们将损失函数定义为：预测网格中第一通道与目标网格在最后时间步的平方差之和。

模型训练目标是在20个时间步内，重建16x16棋盘图案。在每个训练步骤中，初始状态均采用随机采样方式生成。目标棋盘格图案如下图所示。

DiffLogic CA完全收敛至目标图案。训练曲线图（左图）显示软损失函数和硬损失函数均呈现一致的收敛趋势。用于计算损失函数的第一通道的演化过程（右图）展示了清晰的斑图形成。一个引人深思的涌现特性是，尽管模型没有内置方向偏好，图案仍呈现从左下至右上的定向传播趋势。

所使用的有效逻辑门总数（不包括直通门A和B）为22个。对学习得到的逻辑门分析显示，感知核与更新网络之间有不同的门分布。TRUE门似乎在感知过程中扮演关键角色，但在更新网络中则不然。

在下方，咱们提供了剪枝后电路的交互式可视化。有必要注意一下的是，我们最终只剩下六个逻辑门——其中一个是冗余的，即对同一输入执行的AND操作。换言之，电路学习到的整个程序化棋盘格生成功能仅需五个逻辑门就可以实现。同样，大部分输入和输出保持未使用状态。更关键的是，更新步骤完全不考虑单元自身视觉输出。我们鼓励读者与下方电路进行交互[11]，通过点击左侧输入的开关来观察对输出的影响。

从表面上看，我们的解决方案似乎是在迭代构建网格——可以说是在逐块搭建。然而，在训练过程中，我们仅使用了一种固定大小的网格。自然地，我们应当研究改变网格大小后会发生啥：我们学习到的规则究竟是一种真正的迭代式程序化解决方案，还是仅过拟合于特定网格尺寸？让我们将空间和时间维度都扩大四倍——使用四倍大小的网格并运行四倍的时间步长。

成功了！电路在新场景中依旧运行如初。这不禁引发了一个有趣的疑问：模型的归纳偏好究竟如何？在NCA框架下，我们大家可以促使模型的行为不受网格尺寸的影响，也不随时间而改变。然而，这需要用一种特殊的空间不变损失函数[12]。以生长蜥蜴为例，必须建立存活/死亡机制[3]，以避免边界条件的过拟合。在本例中，边界条件同样固定，但模型却学会了边界尺寸不变的斑图生成方式。这种离散化处理与最小电路规模，是否正在揭示某种极简的程序描述，用于生成目标斑图？

基于我们的设置，我们通过两组实验测试了系统的损伤恢复能力和自我修复特性。在第一组测试（左图）中，我们评估了当大部分元胞被永久禁用，模拟故障组件的情况。在第二组测试（右图）中，被禁用的元胞在特定步数后重新激活。系统在两种情况下都表现出了鲁棒的行为：在第一种情况下，尽管存在永久性元胞损伤，仍能维持斑图完整性；在第二种情况下，一旦受损元胞恢复在线，系统能够成功自我修复并产生正确的斑图。

鲁棒计算[13]标志着系统模块设计的根本转变，其第一个任务是确保系统在真实环境中可靠运行。与传统计算依赖精密无错的元件不同，鲁棒系统的设计有着显著差异。鲁棒系统的设计目标是即便遭遇硬件故障、环境干扰、意外输入或制造差异，这类系统仍能持续运作。当代计算系统（尤其是分布式系统）虽已有一定容错设计，但与自然界中同等复杂系统相比仍显脆弱。现有容错机制大多针对特定故障设计，例如无法通过其他手段控制的宇宙射线引发内存位翻转。

在上述实验中，DiffLogic元胞自动机通过自主学习，展现出容错与自愈行为。这些规则并非人为预设。当某些元胞失效时，损害被限制在局部，系统继续运行，性能逐渐下降而非发生灾难性故障。这体现了生物系统的可靠性实现方式：通过不完美元件构成的网络，实现一定的鲁棒性。这为未来计算系统指明方向：即使在非理想条件下，仍能维持功能运作。

受传统神经元胞自动机训练方法的启发[14]，我们探索了异步更新机制。相较于同时更新所有元胞（这可类比于全局时钟），改为我们在每一步随机选择一部分元胞进行局部更新。这模拟了每个元胞都有自己内部时钟的场景。在此框架下，每个元胞可被概念化为一个独立的微型计算单元，它们自主决策，互不影响。

我们直接将异步性引入训练过程，预期这会比传统神经元胞自动机训练困难得多。首先，每一步的更新必须输出完整的新状态，而非仅仅是增量更新。其次，元胞必须应对周围元胞的任意异步组合。任何给定的邻居元胞可能落后或领先一步、两步、三步或更多步。这种复杂性迫使元胞必须有效学习更多转移规则。

令我们惊讶的是，在最简单的图案——棋盘格上，成功实现异步训练相对容易。下面，我们展示了三种不同且独特的斑图重构过程，它们都从相同的初始状态开始，但使用不相同的随机种子来决定元胞更新顺序。尽管这些更新具有异步特性且产生了更复杂的更新规则，但元胞仍能在50步内精准重建目标图案。而在原同步模式下，仅需20步即可完成。

此外，学习型电路展现出泛化能力，在更大规模网格上实现了成功重建，并且能有效抵御外部错误的干扰，其运行模式恰似自修复的棋盘格，令人称奇。

最为惊人的是测试原有规则时的表现。该规则经由同步训练获得，然而改用异步推理后，竟然能够正常运行！这一结果实在出人意料，并进一步印证了最初发现的电路具有较强的鲁棒性。

异步推理的成功促使我们提出新的猜想：直接通过异步更新训练的模型可能会表现出更强的鲁棒性。为了验证这一猜想，我们在每个推理步骤中，都有意地在图像区域随机遮蔽一个10x10像素的方块。下方的模拟清晰地展示了这一过程。

这些图像初步揭示了抗噪声能力上的差异——异步元胞从损伤中恢复的速度略快，而同步训练得到的规则受影响程度似乎更大。通过将误差测量为目标图像与重建图像间绝对差值的总和，我们得知在面对此类扰动时，异步训练提高了系统的鲁棒性。

在新实验中，我们通过在蜥蜴轮廓上训练DiffLogic元胞自动机（CA），测试其学习任意形状的能力，以此向原始神经元胞自动机研究致敬。与再现高度可压缩的规则图案（如棋盘）相比，这项任务需要更加多的记忆能力。个人会使用128位的元胞状态，并使DiffLogic元胞自动机迭代12步。架构包含四个感知电路内核：各层门数分别为8、4、2、1。更新网络共十层：前八层每层512门，后两层节点数分别为256与128。

我们训练模型在12个时间步内生成20×20的蜥蜴斑图。与NCA一样，初始条件由一个中心种子构成，用于打破对称性，同时在网格边缘应用周期性边界条件。我们采用了与棋盘实验中相同的损失函数。

为评估模型的泛化能力，我们在更大的40×40网格上测试了其表现。根据结果得出，模型成功学习了生长模式，且未依赖边界条件。左图展示了软损失和硬损失都收敛至零。右图可视化呈现了蜥蜴在更大网格中的成功生长过程。

下方展示的前32个隐藏状态可视化结果，让我们得以窥见模型在生长过程中的内部动态机制。

训练DiffLogic元胞自动机生成复杂图案，面临着重大优化挑战。这一过程有必要进行大量的超参数调优。未来，通过改进模型架构，优化电路拓扑结构，这些改进有望加速模型收敛，增强稳定性。同时，或许能降低密集调参的需求。

共使用了577个有效逻辑门电路，其中不包含A、B直通门。感知核电路主要是采用TRUE门，而更新电路则几乎使用了所有可用的门类型。

先前实验主要集中于单色图像生成，仅将最后一个通道用于可视化目的。为进一步探索复杂目标态，我们训练模型通过15步生成16x16彩色图像。每个元胞状态包含64个通道。模型配置了四个感知电路核，每个核具有三层结构：分别设置8门、4门、2门。更新网络架构由11层组成：前8层每层各有512个节点，最后是3层序列，节点数分别为[256、128、64]。

经过15步训练，模型成功生成16x16彩色字母（可能唤起某些形态联想）。初始状态设定为全零，不采用周期性边界条件。遵循标准NCA规范[3]，前三通道对应RGB色彩。在本模型中，这些值被限定为二进制0或1，最终呈现出八种基础颜色。

损失函数定义为预测网格与目标网格在最终时间步的平方差之和，仅考虑前三个通道（0、1、2）。

结果显示，模型成功学会生成彩色字母G。左图损失曲线显示，软损失与硬损失均趋于收敛。右图展示了通过15步重建彩色G字母的过程。

实验共使用927个有效逻辑门（不含直通门A和B）。分析发现，感知网络与更新网络的逻辑门分布明显不同。有必要注意一下的是，TRUE（恒真）和FALSE（恒假）门在两个网络中都被普遍的使用，而OR（或）门在更新网络中最为普遍。我们注意到，与先前实验相比，该电路比先前实验更复杂：既难找到合适超参数，整体规模也更大。

本研究提出DiffLogic CA，一种新型NCA架构。它采用完全离散的元胞状态，通过可学习的循环二进制电路进行更新。我们用深度可微分逻辑网络替代传统神经网络组件，使离散逻辑门可以有效的进行可微分训练。通过两项关键成果验证其应用价值：成功复现康威生命游戏规则，以及通过学习离散动态生成多样图案。这些发现表明，在元胞自动机框架中整合离散逻辑具有非常明显潜力。同时，实验证明可微分逻辑门网络能够在循环架构中被有效学习。当前模型虽能学习简单模式，但生成复杂结构仍面临挑战。未来改进方向包括探索分层NCA架构，以及引入专用门以辅助状态遗忘。例如，在状态更新过程中加入类似LSTM的机制，能轻松实现对过去状态和新计算的候选状态更丰富多样的组合，从而有可能增强模型的动态性和表达能力。

在霓虹灯的闪烁、蚁群的精密协作、人类意识的诞生中，隐藏着微观与宏观之间深刻的因果关联——这些看似简单的个体行为，如何跨越尺度，涌现出令人惊叹的复杂现象？因果涌现理论为我们揭示了答案：复杂系统的宏观特征无法通过微观元素的简单叠加解释，而是源于多尺度动态交互中涌现的因果结构。从奇异值分解（SVD）驱动的动态可逆性分析，到因果抽象与信息分解的量化工具，研究者们正逐步构建起一套跨越数学、物理与信息科学的理论框架，试图解码复杂系统的涌现密码。

为了系统梳理因果涌现最新进展，北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔发起「因果涌现第六季」读书会，组织对本话题感兴趣的朋友，深入研读相关文献，激发科研灵感。

读书会将从2025年3月16日开始，每周日早9:00-11:00，维持的时间预计10周左右。每周会进行线上会议，与主讲人等社区成员当面交流，之后能够得到视频回放持续学习。诚挚邀请领域内研究者、寻求跨领域融合的研究者加入，一同探讨。

工业领域

逆向设计智能物质：可微分逻辑元胞自动机破解数十年难题

推荐新闻