AI在线 AI在线

AI 也会 “脑损伤”?研究揭示低质量数据对大语言模型的影响

最近,一项引人关注的研究表明,大语言模型(LLM)在持续接触低质量数据后,会出现类似于人类的 “脑损伤” 现象,导致推理和记忆能力显著下降。 研究者发现,AI 模型在接受高流行但低价值的社交媒体数据(如 Twitter)训练后,推理能力下降了23%,长上下文记忆能力下降了30%。 而更令人担忧的是,这种损伤是不可逆的,即使在后续用高质量数据进行训练,模型也无法完全恢复到初始状态。

最近,一项引人关注的研究表明,大语言模型(LLM)在持续接触低质量数据后,会出现类似于人类的 “脑损伤” 现象,导致推理和记忆能力显著下降。研究者发现,AI 模型在接受高流行但低价值的社交媒体数据(如 Twitter)训练后,推理能力下降了23%,长上下文记忆能力下降了30%。而更令人担忧的是,这种损伤是不可逆的,即使在后续用高质量数据进行训练,模型也无法完全恢复到初始状态。

问卷调查,数据报告

图源备注:图片由AI生成,图片授权服务商Midjourney

这项研究由一组 AI 研究者进行,他们对低质量数据进行了详细定义,并与高质量数据进行对比。他们将低质量数据归类为 “短文本、高热度” 的内容,特别是那些包含标题党和流行语的社交媒体帖子。研究表明,AI 模型接触这些低质量数据后,除了认知能力下降外,其人格特征也受到影响,表现出更多的自恋和精神病态特质。

研究团队选择了四个不同的大语言模型进行训练,分别让它们接受这两类数据。研究过程中,模型的核心能力通过多种维度进行评估,包括推理能力、记忆能力和道德规范的遵循。结果显示,“垃圾进垃圾出” 的原则确实适用于大语言模型,这一发现对未来的 AI 数据训练提出了新的警示。

研究人员认为,行业在训练 AI 时,必须关注数据的质量,避免低质量数据带来的潜在风险。此外,他们还建议在部署大模型时,应进行认知能力的基准测试,以确保 AI 不因长期接触低质量数据而导致能力退化。

划重点:

🧠 AI 模型在接触低质量数据后,推理和记忆能力显著下降,且损伤不可逆。  

📉 接触低质量数据后,AI 模型表现出更多自恋和精神病态特质。  

🔍 研究提醒,训练 AI 时要重视数据质量,并进行认知能力测试。

相关资讯

终于坐不住了!Midjourney V7全新版本亮出王牌!

最近AI圈可太热闹了。 随着什么都会的GPT-4o横空出世,大家都忙着让它画画去了。 我前几天刷朋友圈,十条有八条都在晒GPT-4o画的吉卜力风,剩下两条还在求画教程….
4/3/2025 12:38:44 PM
彭彭

50组多风格提示词,全面测评Midjourney V7生图效果!

嗨大家好! 原本说好 2 月底就上的 Midjourney V7,今天终于来了! 那年杏花微雨,一张《太空歌剧院》冲破云霄,带来的震撼与欣喜至今仍让人记忆犹新。
4/9/2025 1:26:46 AM
阿真Irene

Midjourney又更新了!一个指令带你100%实现场景穿越!

大家好,还记得 Midjourney 之前说要 60 天高频更新吗? 他们还真没吹牛! 最近更新很频繁!
5/12/2025 12:21:28 AM
旭晨AI设计实验室