AI在线 AI在线

越狱检测

多模态大模型存在「内心预警」,无需训练,就能识别越狱攻击

多模态大模型崛起,安全问题紧随其后近年来,大语言模型(LLMs)的突破式进展,催生了视觉语言大模型(LVLMs)的快速兴起,代表作如 GPT-4V、LLaVA 等。 通过将图像与文本深度融合,LVLMs 在图文问答、视觉推理等任务中大放异彩。 但与此同时,一个严峻的问题也悄然浮现 ——LVLMs 比起纯文本模型更容易被 “越狱”。
7/21/2025 5:05:00 PM
机器之心
  • 1