AI
Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅
Meta前脚刚发Llama 4,后脚就有大佬请辞了! 一亩三分地的爆料贴称,经过反复训练后,Llama 4未能取得SOTA,甚至与顶尖大模型实力悬殊。 为了蒙混过关,高层甚至建议:在后训练阶段中,将多个benchmark测试集混入训练数据。
4/7/2025 1:24:52 PM
新智元
Agent不会在2025爆发
作者 | 云昭大模型已经在聚光灯下狂奔了28个月,时至今日,Agent已经被成为了包括黄仁勋、奥特曼、李彦宏、周鸿祎、吴泳铭等一众科技大佬在内备受期待的2025爆发品。 可正如不久前“朱啸虎不太看好机器人赛道”一般,Agent赛道同样也存在着一场泡沫之下的非共识。 1.巨头争相较量,市场异常冷谈我们先从企业内部的Agent来看下。
4/7/2025 1:17:49 PM
云昭
联合国警告:AI 可能影响全球 40% 工作岗位,并拉大国家间差距
联合国报告指出,到2033年AI市场价值或达4.8万亿美元,但可能影响全球40%工作岗位,加剧国家间不平等。报告呼吁加强国际合作与包容性治理,确保AI惠及所有人。#人工智能##全球经济#
4/7/2025 12:59:51 PM
远洋
微软 AI 版《雷神之锤 2》遭喷:模糊、耗电,亵渎开发者工作
微软推出由AI模型Muse驱动的《雷神之锤2》技术演示版,引发玩家和开发者争议。尽管展示生成式AI在游戏领域的潜力,但技术局限和玩家不满情绪显著。#AI游戏争议# #微软Muse#
4/7/2025 12:42:18 PM
远洋
实测文小言升级:开始「卷体验」的百度都眉清目秀了
刚刚无缝接入文心 4.5、文心 X1 和 满血版 DeepSeek-R1 的文小言,转身又整出了新动作。 3 月 31 日,文小言迎来了一次全面升级,上新了多模型融合调度、全新语音大模型、图片问答、拍题讲解等多种新功能。 新功能听起来很厉害,但实际使用效果又如何?
4/7/2025 11:20:00 AM
郑佳美
非法获取学生信息并用 AI 技术发送骚扰短信,在校大学生被抓
近日,一名在校大学生非法获取两万余条学生信息,并利用AI技术向其中两千余名学生发送骚扰短信。目前案件正在进一步侦办中。#网络安全# #AI技术滥用#
4/7/2025 9:51:39 AM
远洋
AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断
你是否想过,LLM也有着自己的小心思? 最新研究揭示了一个有趣的现象:LLM在被研究人员测试时,会有意识地改变自己的行为。 在面对那些旨在评估人格特质的问题时,它们给出的答案会尽可能地讨人喜欢,符合社会期望。
4/7/2025 9:31:00 AM
新智元
超九成年轻人工作学习离不开AI,人均还有1.8个AI朋友丨Soul《2025 Z世代AI使用报告》
不是我说,年轻人群体到底怎么看AI、用AI啊? ? ?
4/7/2025 9:28:00 AM
量子位
Llama 4全网首测来袭,3台Mac狂飙2万亿!多模态惊艳代码却翻车
谁也没料到,大周末的,小扎竟然开源了Llama 4家族。 一共三款模型,首次采用MoE架构,开启了原生多模态的Llama时代! Llama 4 Scout,激活17B,16个专家,109B参数;Llama 4 Maverick,激活17B,128个专家,402B参数;Llama 4 Behemoth,激活288B,16个专家,2T参数。
4/7/2025 9:20:00 AM
新智元
AI爬虫肆虐,OpenAI等大厂不讲武德!开发者打造「神级武器」宣战
AI网络爬虫是互联网上的「蟑螂」,几乎所有软件开发者都会这样认为的。 「爬虫」是一种网络自动程序,用来浏览互联网、获取网页内容。 而在AI时代,爬虫的威胁到了让开发者不得不封锁掉某个地区所有人的访问。
4/7/2025 9:10:15 AM
新智元
谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!
3月31日,谷歌CEO Sundar Pichai(劈柴哥)发出灵魂一问:To MCP or not to MCP, that's the question. (MCP还是不MCP,这是个问题。 )MCP的持续火爆,加上OpenAI在27日官宣对MCP的支持,终究还是让谷歌坐不住了。
4/7/2025 9:10:00 AM
新智元
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
AI不过周末,硅谷也是如此。 大周日的,Llama家族上新,一群LIama 4就这么突然发布了。 这是Meta首个基于MoE架构模型系列,目前共有三个款:Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。
4/7/2025 9:05:00 AM
量子位
DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布! 新智元 新智元 2025年04月04日 17:33
DeepSeek R2,果然近了。 最近,DeepSeek和清华的研究者发表的这篇论文,探讨了奖励模型的推理时Scaling方法。 论文地址:,强化学习(RL)已广泛应用于LLM的大规模后训练阶段。
4/7/2025 8:42:00 AM
新智元
谷歌暗讽OpenAI:GPU在熔化,TPU火上浇油!Canvas免费开放,实测惊人
Gemini 2.5 Pro的Canvas,向所有人开放了! AI大战,再次升级。 奥特曼表示用户太热情,GPU在融化,在线求饶,团队要休息。
4/7/2025 8:39:00 AM
新智元
刚刚,特朗普扼杀全美GPU供应链?科技大厂核心AI算力告急,硅谷陷巨大恐慌
关税大棒一出,连全美的GPU供应链也危在旦夕了? 昨夜,美股经历了5年未遇的史诗级暴跌,更可怕的是,AI界已经被特朗普的关税政策,搞得乱成一锅粥了! 今天,纳斯达克综合指数直接跌超了近6%,与近一年来的新低仅一步之遥。
4/7/2025 8:38:00 AM
新智元
英伟达GPU命名背后:是情怀,也是致敬伟人的智慧! 新智元 新智元 2025年04月05日 12:17
在上周结束的GTC大会上,老黄用两个多小时向我们介绍了英伟达过去一年的进展。 其中,最让人们关注就是「每年一更」的用于未来AI工厂的GPU芯片架构路线图。 2024年,Blackwell GPU发布;2025年上半年,Blackwell GPU已经全面发货;2025年下半年,推出Blackwell Ultra;2026年下半年,将重磅发布Vera Rubin;2027年下半年,推出Rubin Ultra;再往后,就是2028年上市的Feynman。
4/7/2025 8:07:00 AM
新智元
DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI
Deepseek在2025年1月颠覆了全球人工智能模型,但谷歌和OpenAI很快发布了Gemini2 Pro和O3。 这就产生了一个问题,应该使用哪种人工智能模型来进行客户服务? 为了评估这些模型在客户服务任务上的表现,我们必须更深入地了解它们在各种AI基准上的表现。
4/7/2025 5:00:00 AM
晓晓
GPT-4.5创造力比GPT-4o弱!浙大上海AI Lab发布新基准,寻找多模态创造力天花板
近来风头正盛的GPT-4.5,不仅在日常问答中展现出惊人的上下文连贯性,在设计、咨询等需要高度创造力的任务中也大放异彩。 当GPT-4.5在创意写作、教育咨询、设计提案等任务中展现出惊人的连贯性与创造力时,一个关键问题浮出水面:多模态大模型(MLLMs)的“创造力天花板”究竟在哪里? 写一篇基于图片的短篇小说、分析一张复杂的教学课件、甚至设计一份用户界面……这些对于人类驾轻就熟的任务,对于现有的部分多模态大模型却往往是“高难动作”。
4/7/2025 2:33:00 AM
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind