当 ANN “长出树突”：少参数、强抗噪，复杂任务表现更优

Jack小新 · 发表于 1758094112

《 Dendritic properties enhance the robustness and parameter efficiency of artificial neural networks 》发表于 Nature Communications 。文章提出树突型 ANN（dANN），引入生物树突结构化连接与受限采样特性。实验显示，dANN-LRF 以少一个数量级参数达传统 ANN 同等甚至更高准确率，在 CIFAR10 等难任务优势显著；加高斯噪声后准确率下降更慢，顺序学习中保持高准确率，且过拟合现象大幅减少，为高效稳健 AI 提供新路径。

人工神经网络（ANNs）是大多数深度学习（DL）算法的核心，这些算法能够成功解决复杂问题，如图像识别、自动驾驶和自然语言处理。然而，与能够以高效方式处理类似问题的生物大脑不同，深度学习算法需要大量可训练参数，这不仅能耗高，而且容易导致过拟合。在本文中，我们展示了一种新的ANN架构：该架构引入了生物树突的结构化连接与受限采样特性，从而克服了这些限制。研究发现，树突型ANNs在多项图像分类任务中比传统ANNs更能抵御过拟合，同时使用的可训练参数显著减少，并且在性能上与传统ANNs相当甚至更优。这些优势可能来源于不同的学习策略：树突型ANNs中的大多数节点能够对多个类别做出响应，而传统ANNs则倾向于形成类别特异性。我们的发现表明，将树突特性引入人工神经网络可以让学习更加精确、稳健且具备参数效率，同时也揭示了生物特征如何影响人工网络的学习策略。

一、研究背景：人工与生物智能的差距

问题：深度学习虽然在视觉、语言等任务中达到超人水平，但依赖庞大参数量，能耗高，且在噪声环境或持续学习任务中表现不佳。

对比：生物大脑的高效性主要得益于树突的复杂计算能力。现有ANN缺少这一机制。

（ Fig. 1a，小鼠视觉皮层的锥体细胞作为模型灵感来源）

二、树突神经元模型与新架构

树突型ANN（dANN）由“树突层”和“胞体层”组成。输入先经过树突层的非线性计算，再传递至胞体层。

输入采样方式分为三类：

随机采样（dANN-R）；

局部感受野（dANN-LRF）；

全局感受野（dANN-GRF）。

另设“部分树突ANN”（pdANN），其输入为全连接，不具备生物学合理性。

（Fig. 1b–e，比较了dANN与传统vANN的结构差异）

三、实验结果与对比分析

1. 在Fashion-MNIST上的表现

dANN在相同参数量下的测试损失更低，过拟合现象明显减少。

dANN-LRF在效率上最优：以少一个数量级的参数即可达到与vANN相同甚至更高的准确率。

pdANN虽减轻过拟合，但在效率上没有显著优势。

（见 Fig. 2a–e）

2. 多数据集验证

在MNIST、KMNIST、EMNIST、CIFAR10等五个基准数据集上，dANN始终比vANN需要更少的参数即可达到同等或更高准确率。

在难度较大的CIFAR10任务上，dANN的优势尤为明显。

（Fig. 3a–d，效率分数对比；Table 1 各模型的准确率和损失）

3. 结构化连接与采样的作用

与全连接网络或随机稀疏网络对比发现：

· 受限输入采样能提升效率；

· 结构化连接进一步放大优势。

dANN在效率上普遍超过相同采样方式的稀疏ANN（sANN）。

（Fig. 4，对比不同采样方式下的效率分数）

四、学习策略差异与可解释性分析

1. 权重利用情况

dANN的权重分布更宽，尤其是“电缆权重”（树突-胞体连接），几乎所有参数都被有效利用。

vANN的权重分布集中在零附近，说明存在大量未充分利用的参数。

（ Fig. 5a，权重分布直方图）

2. 节点选择性

vANN主要形成类别特异性节点；

dANN形成混合选择性节点，即单个节点能对多个类别有响应。

这类策略与生物大脑皮层中的混合选择性神经元相似，有助于更灵活的信息处理。

（ Fig. 5b–c，熵与选择性分布）

3. 特征表示

t-SNE降维显示：dANN在树突层到胞体层的过程中，表示分离度明显提升。

dANN的表示保持了更高的“可信度”（trustworthiness），说明其在降维后依然保留了原始数据结构。

（见 Fig. 6a–g，t-SNE可视化与相关分数）

五、任务难度增加时的优势

1. 噪声鲁棒性

在Fashion-MNIST图像中加入高斯噪声后，dANN的准确率下降更慢，损失上升更缓，表现出更强的抗干扰性。

最优模型为dANN-LRF。

（见 Fig. 7a–b）

2. 顺序学习任务

在单类批次依次输入的条件下，dANN依然保持较高准确率，而vANN准确率急剧下降。

dANN-LRF在该场景下表现最佳。

（见 Fig. 7c–d；Table 2 顺序学习结果）

六、讨论与启示

· 树突特性（结构化连接 + 受限采样）是提升ANN效率与稳健性的关键。

· dANN减少了过拟合和参数依赖，尤其适合计算和能耗受限的场景。

· 相较于需要复杂搜索的稀疏网络，树突式架构为设计高效人工网络提供了“自然的范式”。

· 混合选择性机制的出现提示，ANN与生物神经系统在策略层面可能趋同。

· dANN框架不仅适用于简单的前馈ANN，还可推广至CNN、Transformer等深度学习架构。

结论

总体而言，我们展示了引入树突特性能够显著增强人工神经网络的学习能力，使其既准确又高效。这些发现具有重要潜力，表明整合生物学特征可能是优化机器学习算法可持续性与有效性的关键。这项研究为深度学习提供了一条新的思路：让人工网络“长出树突”。通过引入生物神经元的关键属性，研究人员不仅解决了能耗与过拟合问题，还展示了在复杂任务中超越传统模型的潜力。未来，随着该框架在CNN、Transformer等架构中的应用，或许能看到更多兼具高效与稳健的“仿生智能”模型出现。

DOI：10.1038/s41467-025-56297-9

代码与数据：https://github.com/Poirazi-Lab/dendritic_anns.

文章改编转载自微信公众号：AI前沿文献速递

原文链接：https://mp.weixin.qq.com/s/vmAORloLwVbSpRna9bTDZQ?scene=1