AI在线 AI在线

把指纹焊死在频率上:抗微调神经网络指纹的硬核方案来了

论文第一作者唐灵,张拳石老师课题组的博二学生。 今天要聊的是个硬核技术 —— 如何给神经网络刻上抹不掉的 "身份证"。 现在大模型抄袭纠纷不断,这事儿特别应景。

论文第一作者唐灵,张拳石老师课题组的博二学生。

今天要聊的是个硬核技术 —— 如何给神经网络刻上抹不掉的 "身份证"。现在大模型抄袭纠纷不断,这事儿特别应景。

所谓神经网络指纹技术,是指使用神经网络内部如同人类指纹一样的特异性信息作为身份标识,用于判断模型的所有权和来源。传统方法都在玩 "贴标签":往模型里塞各种人造指纹。但问题是,模型微调(fine-tuning)就像给整容 —— 参数一动,"整张脸" 就变了,指纹自然就糊了。

面对神经网络微调训练的威胁,现有方案都在修修补补,而我们上升到理论层面重新思考:神经网络是否先天存在某种对微调鲁棒的特征?如果存在,并将该固有特征作为网络指纹,那么无论对模型参数如何微调,该指纹就能始终保持不变。在这一视角下,前人的探索较为有限,没有从理论上证明出神经网络内部对微调天然鲁棒的特征。

图片

  • 论文地址:https://arxiv.org/pdf/2505.01007
  • 论文标题:Towards the Resistance of Neural Network Watermarking to Fine-tuning

方法介绍

这里我们发现了一个颠覆性事实:卷积核的某些频率成分根本不怕微调。就像给声波做 DNA 检测,我们把模型参数转换到频率域,找到了那些 "焊死" 在频谱上的特征点 —— 我们拓展了离散傅里叶变换,从而定义了神经网络一个卷积核所对应的频谱,并进一步证明:当输入特征仅包含低频成分时,卷积核的某些特定频率成分在微调过程中能够保持稳定。

图片

理论框架。我们证明,通过对卷积核 W 进行拓展后的离散傅里叶变换 图片(不是传统的傅里叶变换)所获得的特定频率成分图片 ,在训练过程中保持稳定。因此,我们使用这些特定的频率成分作为对于微调鲁棒的神经网络指纹。

首先,我们发现神经网络时域上的前向传播过程可以写为频域当中的向量乘法。具体而言,给定一个卷积核 W 和偏置项 b,以及对应的输入特征 X,我们通过对卷积核进行扩展的离散傅里叶变换得到频率成分 图片,同时对输入特征进行离散傅里叶变换得到频域成分图片 ,其中不同的 图片 代表不同的频率点。可以证明,空间域中的卷积操作 图片 严格等价于在频率域中各频率成分之间的向量点积图片 。

图片

在此基础上,我们进一步证明了当输入特征 X 仅包含基频成分时(除了基频成分 图片外,其他频率成分 图片 取值为 0),并且频率坐标取值连续的理想情况下,卷积核频谱中特定频率 图片上频率成分 图片 在微调过程中能够严格保持不变。其中,M 和 N 为特征图长和宽,K 为卷积核大小。

图片

然后,我们将上述理论推广到实际场景中,这时输入特征 X 通常包含低频成分,且频率坐标必须为整数。在这样的条件下,前述特定频率坐标图片取整后的频率位置处的卷积核频率成分 图片在微调过程中变化极小,近似为零,从而表现出较高的稳定性。

图片

图片(a) 图中展示了卷积核 W 单个通道的频谱特征,(b) 图展示了卷积核频谱中特定频率坐标上的频率成分 图片在微调过程中表现出良好的稳定性。

因此,我们使用这些特定频率成分 图片 作为具备理论保障的对于微调鲁棒的神经网络指纹。

实验

最后,我们开展了一系列实验,以评估所提出神经网络指纹方法对微调操作的鲁棒性。实验结果表明,相较于现有主流的模型指纹与模型溯源方法,在所有数据集和微调使用的学习率设置下,我们的方法在模型溯源任务中均取得了最优表现,尤其在高学习率条件下展现出显著优势。

图片

相关资讯

Sam Altman炸场东京,亲曝GPT-5研发路线图,多模态能力颠覆传统

昨天,OpenAI联合创始人兼首席执行官Sam Altman出席了日本东京大学活动,介绍了OpenAI的技术研发、产品规划以及GPT模型未来发展等重要信息。 在问答环节,有学生提到了大家比较关心的GPT-5问题,Altman表示,GPT-5将是一个超级混合模型,计划会把GPT和o系列模型整合在一起,并且支持视频、音频、图像的多模态交互。 Altman做了一个比喻,GPT-3到GPT-4是一次史诗级性能飞跃,而GPT-4再到GPT-5将会再一次重现这种惊喜。
2/5/2025 10:26:23 AM
AIGC开放社区

诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

就在今天,谷歌DeepMind的首席执行官Demis Hassabis对DeepSeek进行了一番「捧杀」——「它可能是中国最好的工作,但没有展示任何新的科学进展。 」Hassabis首先称DeepSeek的模型是「一项令人印象深刻的工作」,然后便一改口风说道:「从技术角度来看,这并不是一个重大变革」,同时还特别强调「炒作有点夸大了」。 「尽管炒作很多,但实际上并没有新的科学突破,它使用的都是已知的AI技术。
2/10/2025 12:30:00 PM
新智元

谷歌CEO:现在就是AI创新,黄金年代

今天凌晨3点,谷歌和Alphabet首席执行官Sundar Pichai,在正在法国巴黎举办的全球AI峰会上发表了重要演讲——现在就是AI创新的黄金年代。 Pichai认为,AI技术正在经历快速的进步,成本大幅下降尤为显著。 在过去18个月中,处理token的成本从每百万个4美元降至13美分,降幅高达97%。
2/11/2025 10:10:59 AM
AIGC开放社区
  • 1