论文笔记 - Editable Neural Networks

1. Information

Title: Editable Neural Networks
Link: Editable Training Paper
Source: International Conference on Learning Representations (ICLR)
Date: 2020.04.01

2. Summary

这篇论文提出了一种新方法，称为 Editable Training，用于快速高效地修正神经网络在特定样本上的错误，而不会影响其他样本的行为。核心贡献包括：

提出并定义了神经网络编辑的问题。
开发了一种基于元学习 (meta-learning) 的通用训练技术，使得模型可以快速编辑。
在图像分类和机器翻译等任务上进行了大规模实验，证明了方法的有效性。

3. Background

深度神经网络在图像分类、机器翻译等任务中表现出色，但模型错误可能导致严重后果。因此，快速修正模型错误至关重要。然而，深度神经网络的预测通常依赖于所有模型参数，更新模型以改变单个输入的预测可能会降低其他输入的性能。目前，修正模型错误的方法包括重新训练模型或使用手动缓存，但这些方法要么计算成本高昂，要么对输入变化不够鲁棒。

4. Research Objective

本研究旨在设计一种训练方法，使得神经网络模型可以在检测到错误后快速修正特定输入的预测，而不显著影响其他输入的性能。

5. Method

5.1 神经网络编辑的定义

神经网络表示为 \(f(x, \theta)\)，其中 \(x\) 是输入，\(\theta\) 是参数集。为了修正错误，定义了一个编辑函数： \[ \theta' = \text{Edit}(\theta, l_e) \] 其中 \(l_e\) 是约束条件，用于强制模型对某些输入产生预期输出。

在分类任务中，定义 \(l_e\) 为： \[ l_e\left(\theta^{\prime}\right)=\max _{y_i} \log p\left(y_i \mid x, \theta^{\prime}\right)-\log p\left(y_{\text {ref }} \mid x, \theta^{\prime}\right) \] 其中 \(y_{\text{ref}}\) 是目标标签，约束条件 \(l_e(\theta') \leq 0\) 表示模型在目标样本上正确分类。

5.2 梯度下降编辑器

利用梯度下降实现参数更新： \[ \operatorname{Edit}_\alpha^k\left(\theta, l_e, k\right)= \begin{cases}\theta, & \text { if } l_e(\theta) \leq 0 \text { or } k=0, \\ \operatorname{Edit}_\alpha^{k-1}\left(\theta-\alpha \nabla_\theta l_e(\theta), l_e\right), & \text { else }\end{cases} \] 此编辑器可以通过引入如动量（Momentum）、自适应学习率（RMSProp、Adam）等优化技术提高效率和稳定性。

5.3 Editable Training 的目标函数

为了使模型适应编辑器，定义总目标函数： \[ \operatorname{Obj}\left(\theta, l_e\right)=L_{\text {base }}(\theta)+c_{\text {edit }} \cdot L_{\text {edit }}(\theta)+c_{\text {loc }} \cdot L_{\text {loc }}(\theta), \] 其中：

\(L_{\text{base}}(\theta)\)：主任务损失（如交叉熵）。
\(L_{\text{edit}}(\theta) = \max(0, l_e(\text{Edit}_\alpha^k(\theta, l_e)))\)：鼓励编辑效率和可靠性。
\(L_{\text{loc}}(\theta) = \mathbb{E}_{x \sim p(x)} D_{\text{KL}}(p(y|x, \theta) \| p(y|x, \text{Edit}_\alpha^k(\theta, l_e)))\)：通过最小化原始模型和编辑后模型的 KL 散度，确保局部性。

超参数 \(c_{\text{edit}}\) 和 \(c_{\text{loc}}\) 用于平衡编辑性能与主任务表现。

6. Evaluation

6.1 CIFAR-10 实验

使用 ResNet-18 模型，比较了不同编辑器（如 GD、RMSProp）的性能，指标包括 drawdown（编辑前后误差差异）、成功率、和平均编辑步数。
Editable Training 显著减少了 drawdown（例如，从 \(1.77\%\) 降到 \(0.65\%\)）。

6.2 ImageNet 实验

在预训练 ResNet-18 和 DenseNet-169 模型上进行微调，使用额外的可训练层进一步提高编辑性能。
与 Elastic Weight Consolidation 和 Deep k-Nearest Neighbors 等基线方法相比，Editable Training 在修正效果和效率上均占优。

7. Conclusion

本文提出的 Editable Training 方法有效地解决了神经网络的错误修复问题，通过元学习技术增强了模型的编辑能力，同时保持整体性能，具有广泛的实际应用前景。

论文阅读

#深度学习 #NLP #知识编辑

论文笔记 - Editable Neural Networks

http://hellochuanyang.github.io/2025/01/26/论文笔记-Editable-Neural-Networks/

作者

阿阳

发布于

2025年1月26日

许可协议

论文笔记 - Plug-and-Play Adaptation for Continuously-updated QA 上一篇

论文笔记 - Memory-assisted prompt editing to improve GPT-3 after deployment 下一篇