AI 也会 “脑损伤”？研究揭示低质量数据对大语言模型的影响

作者：AI在线 2025-11-17 09:46

最近，一项引人关注的研究表明，大语言模型（LLM）在持续接触低质量数据后，会出现类似于人类的 “脑损伤” 现象，导致推理和记忆能力显著下降。研究者发现，AI 模型在接受高流行但低价值的社交媒体数据(如 Twitter)训练后，推理能力下降了23%，长上下文记忆能力下降了30%。而更令人担忧的是，这种损伤是不可逆的，即使在后续用高质量数据进行训练，模型也无法完全恢复到初始状态。

问卷调查，数据报告

图源备注：图片由AI生成，图片授权服务商Midjourney

这项研究由一组 AI 研究者进行，他们对低质量数据进行了详细定义，并与高质量数据进行对比。他们将低质量数据归类为 “短文本、高热度” 的内容，特别是那些包含标题党和流行语的社交媒体帖子。研究表明，AI 模型接触这些低质量数据后，除了认知能力下降外，其人格特征也受到影响，表现出更多的自恋和精神病态特质。

研究团队选择了四个不同的大语言模型进行训练，分别让它们接受这两类数据。研究过程中，模型的核心能力通过多种维度进行评估，包括推理能力、记忆能力和道德规范的遵循。结果显示，“垃圾进垃圾出” 的原则确实适用于大语言模型，这一发现对未来的 AI 数据训练提出了新的警示。

研究人员认为，行业在训练 AI 时，必须关注数据的质量，避免低质量数据带来的潜在风险。此外，他们还建议在部署大模型时，应进行认知能力的基准测试，以确保 AI 不因长期接触低质量数据而导致能力退化。

划重点:
🧠 AI 模型在接触低质量数据后，推理和记忆能力显著下降，且损伤不可逆。
📉 接触低质量数据后，AI 模型表现出更多自恋和精神病态特质。
🔍 研究提醒，训练 AI 时要重视数据质量，并进行认知能力测试。

终于坐不住了！Midjourney V7全新版本亮出王牌！

最近AI圈可太热闹了。随着什么都会的GPT-4o横空出世，大家都忙着让它画画去了。我前几天刷朋友圈，十条有八条都在晒GPT-4o画的吉卜力风，剩下两条还在求画教程….

4/3/2025 12:38:44 PM 彭彭

50组多风格提示词，全面测评Midjourney V7生图效果！

嗨大家好！原本说好 2 月底就上的 Midjourney V7，今天终于来了！那年杏花微雨，一张《太空歌剧院》冲破云霄，带来的震撼与欣喜至今仍让人记忆犹新。

4/9/2025 1:26:46 AM 阿真Irene

AI 也会 “脑损伤”？研究揭示低质量数据对大语言模型的影响

相关资讯

终于坐不住了！Midjourney V7全新版本亮出王牌！

50组多风格提示词，全面测评Midjourney V7生图效果！

Midjourney又更新了！一个指令带你100%实现场景穿越！