AI在线 AI在线

AI

Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅

Meta前脚刚发Llama 4,后脚就有大佬请辞了! 一亩三分地的爆料贴称,经过反复训练后,Llama 4未能取得SOTA,甚至与顶尖大模型实力悬殊。 为了蒙混过关,高层甚至建议:在后训练阶段中,将多个benchmark测试集混入训练数据。
4/7/2025 1:24:52 PM
新智元

Agent不会在2025爆发

作者 | 云昭大模型已经在聚光灯下狂奔了28个月,时至今日,Agent已经被成为了包括黄仁勋、奥特曼、李彦宏、周鸿祎、吴泳铭等一众科技大佬在内备受期待的2025爆发品。 可正如不久前“朱啸虎不太看好机器人赛道”一般,Agent赛道同样也存在着一场泡沫之下的非共识。 1.巨头争相较量,市场异常冷谈我们先从企业内部的Agent来看下。
4/7/2025 1:17:49 PM
云昭

联合国警告:AI 可能影响全球 40% 工作岗位,并拉大国家间差距

联合国报告指出,到2033年AI市场价值或达4.8万亿美元,但可能影响全球40%工作岗位,加剧国家间不平等。报告呼吁加强国际合作与包容性治理,确保AI惠及所有人。#人工智能##全球经济#
4/7/2025 12:59:51 PM
远洋

微软 AI 版《雷神之锤 2》遭喷:模糊、耗电,亵渎开发者工作

微软推出由AI模型Muse驱动的《雷神之锤2》技术演示版,引发玩家和开发者争议。尽管展示生成式AI在游戏领域的潜力,但技术局限和玩家不满情绪显著。#AI游戏争议# #微软Muse#
4/7/2025 12:42:18 PM
远洋

实测文小言升级:开始「卷体验」的百度都眉清目秀了

刚刚无缝接入文心 4.5、文心 X1 和 满血版 DeepSeek-R1 的文小言,转身又整出了新动作。 3 月 31 日,文小言迎来了一次全面升级,上新了多模型融合调度、全新语音大模型、图片问答、拍题讲解等多种新功能。 新功能听起来很厉害,但实际使用效果又如何?
4/7/2025 11:20:00 AM
郑佳美

非法获取学生信息并用 AI 技术发送骚扰短信,在校大学生被抓

近日,一名在校大学生非法获取两万余条学生信息,并利用AI技术向其中两千余名学生发送骚扰短信。目前案件正在进一步侦办中。#网络安全# #AI技术滥用#
4/7/2025 9:51:39 AM
远洋

AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断

你是否想过,LLM也有着自己的小心思? 最新研究揭示了一个有趣的现象:LLM在被研究人员测试时,会有意识地改变自己的行为。 在面对那些旨在评估人格特质的问题时,它们给出的答案会尽可能地讨人喜欢,符合社会期望。
4/7/2025 9:31:00 AM
新智元

超九成年轻人工作学习离不开AI,人均还有1.8个AI朋友丨Soul《2025 Z世代AI使用报告》

不是我说,年轻人群体到底怎么看AI、用AI啊? ? ?
4/7/2025 9:28:00 AM
量子位

Llama 4全网首测来袭,3台Mac狂飙2万亿!多模态惊艳代码却翻车

谁也没料到,大周末的,小扎竟然开源了Llama 4家族。 一共三款模型,首次采用MoE架构,开启了原生多模态的Llama时代! Llama 4 Scout,激活17B,16个专家,109B参数;Llama 4 Maverick,激活17B,128个专家,402B参数;Llama 4 Behemoth,激活288B,16个专家,2T参数。
4/7/2025 9:20:00 AM
新智元

AI爬虫肆虐,OpenAI等大厂不讲武德!开发者打造「神级武器」宣战

AI网络爬虫是互联网上的「蟑螂」,几乎所有软件开发者都会这样认为的。 「爬虫」是一种网络自动程序,用来浏览互联网、获取网页内容。 而在AI时代,爬虫的威胁到了让开发者不得不封锁掉某个地区所有人的访问。
4/7/2025 9:10:15 AM
新智元

谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!

3月31日,谷歌CEO Sundar Pichai(劈柴哥)发出灵魂一问:To MCP or not to MCP, that's the question.  (MCP还是不MCP,这是个问题。 )MCP的持续火爆,加上OpenAI在27日官宣对MCP的支持,终究还是让谷歌坐不住了。
4/7/2025 9:10:00 AM
新智元

LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯

AI不过周末,硅谷也是如此。 大周日的,Llama家族上新,一群LIama 4就这么突然发布了。 这是Meta首个基于MoE架构模型系列,目前共有三个款:Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。
4/7/2025 9:05:00 AM
量子位

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布! 新智元 新智元 2025年04月04日 17:33

DeepSeek R2,果然近了。 最近,DeepSeek和清华的研究者发表的这篇论文,探讨了奖励模型的推理时Scaling方法。 论文地址:,强化学习(RL)已广泛应用于LLM的大规模后训练阶段。
4/7/2025 8:42:00 AM
新智元

谷歌暗讽OpenAI:GPU在熔化,TPU火上浇油!Canvas免费开放,实测惊人

Gemini 2.5 Pro的Canvas,向所有人开放了! AI大战,再次升级。 奥特曼表示用户太热情,GPU在融化,在线求饶,团队要休息。
4/7/2025 8:39:00 AM
新智元

刚刚,特朗普扼杀全美GPU供应链?科技大厂核心AI算力告急,硅谷陷巨大恐慌

关税大棒一出,连全美的GPU供应链也危在旦夕了? 昨夜,美股经历了5年未遇的史诗级暴跌,更可怕的是,AI界已经被特朗普的关税政策,搞得乱成一锅粥了! 今天,纳斯达克综合指数直接跌超了近6%,与近一年来的新低仅一步之遥。
4/7/2025 8:38:00 AM
新智元

英伟达GPU命名背后:是情怀,也是致敬伟人的智慧! 新智元 新智元 2025年04月05日 12:17

在上周结束的GTC大会上,老黄用两个多小时向我们介绍了英伟达过去一年的进展。 其中,最让人们关注就是「每年一更」的用于未来AI工厂的GPU芯片架构路线图。 2024年,Blackwell GPU发布;2025年上半年,Blackwell GPU已经全面发货;2025年下半年,推出Blackwell Ultra;2026年下半年,将重磅发布Vera Rubin;2027年下半年,推出Rubin Ultra;再往后,就是2028年上市的Feynman。
4/7/2025 8:07:00 AM
新智元

DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI

Deepseek在2025年1月颠覆了全球人工智能模型,但谷歌和OpenAI很快发布了Gemini2 Pro和O3。 这就产生了一个问题,应该使用哪种人工智能模型来进行客户服务? 为了评估这些模型在客户服务任务上的表现,我们必须更深入地了解它们在各种AI基准上的表现。
4/7/2025 5:00:00 AM
晓晓

GPT-4.5创造力比GPT-4o弱!浙大上海AI Lab发布新基准,寻找多模态创造力天花板

近来风头正盛的GPT-4.5,不仅在日常问答中展现出惊人的上下文连贯性,在设计、咨询等需要高度创造力的任务中也大放异彩。 当GPT-4.5在创意写作、教育咨询、设计提案等任务中展现出惊人的连贯性与创造力时,一个关键问题浮出水面:多模态大模型(MLLMs)的“创造力天花板”究竟在哪里? 写一篇基于图片的短篇小说、分析一张复杂的教学课件、甚至设计一份用户界面……这些对于人类驾轻就熟的任务,对于现有的部分多模态大模型却往往是“高难动作”。
4/7/2025 2:33:00 AM