AI在线 AI在线

AI幻觉

Anthropic CEO 阿莫代伊:AI 模型出现“幻觉”的频率可能比人类还低

阿莫代伊强调,AI出现幻觉并不会阻碍Anthropic迈向 AGI的目标。“这取决于你用什么标准衡量,但我怀疑AI模型的幻觉频率可能低于人类,只是它们出错的方式更出人意料。”
5/23/2025 11:31:48 PM
清源

AI幻觉引爆网络安全危机 专家揭示了三大防御策略

对现实世界的影响“如果一家公司的智能体利用了过时或不准确的数据,AI幻觉可能会虚构出并不存在的漏洞,或错误解读威胁情报,导致不必要的警报或忽视真正的风险。 此类错误可能会分散对真正威胁的注意力,创造新的漏洞,并浪费本已紧张的安全运营团队资源。 ”Tanium的AI副总裁HarmanKaur在接受采访时表示。
5/21/2025 1:00:00 AM
Mirko Zorz

研究发现:要求 AI 简洁作答可能致其出现更多“幻觉”

巴黎AI公司Giskard研究发现,要求AI聊天机器人简短回答问题时,其产生“幻觉”(输出虚假信息)的概率会显著增加。包括GPT-4o在内的主流模型均存在此现象,因简洁回答缺乏反驳错误的空间。#AI幻觉##ChatGPT#
5/8/2025 8:45:30 PM
远洋

模型越新幻觉越重!AI幻觉扣住产业发展命脉

自诞生以来,人工智能大模型始终被“幻觉”问题困扰。 这里的“幻觉”,指的是大语言模型会将虚构信息当作真实事实输出。 实际上,“幻觉”这一表述相当委婉,它实则暴露出AI的核心缺陷——当前的大语言模型尚未达到真正意义上的智能水平。
5/8/2025 6:00:00 AM
小刀

OpenAI新推AI模型o3幻觉现象加剧,精准性令人担忧

最近,OpenAI 推出了其最新的 o3和 o4-mini AI 模型,这些模型在许多方面都达到了尖端水平。 然而,新的模型在 “幻觉” 问题上却并没有改善,反而幻觉现象比 OpenAI 之前的多个模型更为严重。 所谓 “幻觉”,是指 AI 模型会错误地生成虚假信息,这是当今最棘手的 AI 问题之一。
4/22/2025 10:01:05 AM
AI在线

三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少

近日,智利大学 CIAE 教育研究所的研究员 Roberto Araya 进行了 4 组对照实验:提供相同的提示词,让 Gemini 2.0 Flash、ChatGPT o3-mini、DeepSeek R1 进行推理分析,研究三个模型在应对幻觉问题上的性能对比。 其研究发现:ChatGPT 03-mini 在应对大模型幻觉问题上占有绝对优势,能够灵活切换不同的策略进行思考推理。 相比之下,DeepSeek R1 和 Gemini 2.0 Flash 虽然能够尝试使用策略,但表现了出对这些策略的抗拒,且推理过程存在错误或混乱。
3/28/2025 3:37:00 PM
郑佳美

​西湖大学研发 AI 文本检测模型,助力辨别人工智能创作

近日,西湖大学的研究团队成功研发出一种能够检测人工智能生成文本的新模型。 该团队的负责人张岳教授在接受采访时表示,这一模型采用无监督算法,可以有效判断一篇文章是否由 AI 创作,尤其在人工智能迅速发展的当下显得尤为重要。 张岳教授提到,随着科技的不断进步,AI 在创作领域的应用日益普及。
3/13/2025 5:06:00 PM
AI在线

如何应对 AI“一本正经的胡说八道”?研究人员希望它会承认“我不知道”

当前 AI 的训练数据几乎不包含“我不知道”这样的表述,因此它们天生不会谦逊。Cohen 和 Dobler 通过调整 AI 训练过程,使其在可能出错时,至少一部分情况下会选择回答“我不知道”,从而提高整体准确性。
2/13/2025 7:16:56 AM
清源
  • 1