AI在线 AI在线

理论

自我修复数据管道:数据工程的下一件大事?

译者 | 李睿审校 | 重楼梅西百货公司首席数据工程师Naresh Erukulla是一位勇于迎接挑战的数据工程师,他擅长用简洁明了的概念验证(POC)解决各种问题。 最近,Naresh关注到了数据工程师日常工作中普遍遭遇的一个难题,并为此采取行动,为所有批处理和流数据管道设置了警报系统。 当错误超过阈值或数据管道出现故障时,可以迅速通过电子邮件向数据工程师发送故障通知,确保问题能够得到及时处理。
4/7/2025 11:55:58 AM
李睿

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。 通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。 这些创新显著提升了模型在不同领域的鲁棒性和精度,为零样本立体深度估计设立了新标准。
4/7/2025 9:45:00 AM
机器之心

AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断

你是否想过,LLM也有着自己的小心思? 最新研究揭示了一个有趣的现象:LLM在被研究人员测试时,会有意识地改变自己的行为。 在面对那些旨在评估人格特质的问题时,它们给出的答案会尽可能地讨人喜欢,符合社会期望。
4/7/2025 9:31:00 AM
新智元

超九成年轻人工作学习离不开AI,人均还有1.8个AI朋友丨Soul《2025 Z世代AI使用报告》

不是我说,年轻人群体到底怎么看AI、用AI啊? ? ?
4/7/2025 9:28:00 AM
量子位

LLM「想太多」有救了!高效推理让大模型思考过程更精简

LLM的推理能力显著增强,然而,这个「超级大脑」也有自己的烦恼。 有时候回答会绕好大一个圈子,推理过程冗长又复杂,虽能得出正确答案,但耗费了不少时间和计算资源。 比如问它「2加3等于多少」,它可能会从数字的概念、加法原理开始,洋洋洒洒说上一大通,这在实际应用中可太影响效率啦。
4/7/2025 9:23:00 AM
新智元

Llama 4全网首测来袭,3台Mac狂飙2万亿!多模态惊艳代码却翻车

谁也没料到,大周末的,小扎竟然开源了Llama 4家族。 一共三款模型,首次采用MoE架构,开启了原生多模态的Llama时代! Llama 4 Scout,激活17B,16个专家,109B参数;Llama 4 Maverick,激活17B,128个专家,402B参数;Llama 4 Behemoth,激活288B,16个专家,2T参数。
4/7/2025 9:20:00 AM
新智元

AI爬虫肆虐,OpenAI等大厂不讲武德!开发者打造「神级武器」宣战

AI网络爬虫是互联网上的「蟑螂」,几乎所有软件开发者都会这样认为的。 「爬虫」是一种网络自动程序,用来浏览互联网、获取网页内容。 而在AI时代,爬虫的威胁到了让开发者不得不封锁掉某个地区所有人的访问。
4/7/2025 9:10:15 AM
新智元

谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!

3月31日,谷歌CEO Sundar Pichai(劈柴哥)发出灵魂一问:To MCP or not to MCP, that's the question.  (MCP还是不MCP,这是个问题。 )MCP的持续火爆,加上OpenAI在27日官宣对MCP的支持,终究还是让谷歌坐不住了。
4/7/2025 9:10:00 AM
新智元

LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯

AI不过周末,硅谷也是如此。 大周日的,Llama家族上新,一群LIama 4就这么突然发布了。 这是Meta首个基于MoE架构模型系列,目前共有三个款:Llama 4 Scout、Llama 4 Maverick、Llama 4 Behemoth。
4/7/2025 9:05:00 AM
量子位

2025必知AI趋势:智能体技术如何重塑人机协作

托尼·斯塔克与J.A.R.V.I.S的完美配合,曾是科幻电影中的经典场景。 智能助手接收指令,自主思考,调用资源,执行任务,甚至主动提醒风险。 这种高度智能的人机协作,正从银幕走入现实,这就是AI智能体(AI Agents)。
4/7/2025 9:00:00 AM
大数据AI智能圈

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布! 新智元 新智元 2025年04月04日 17:33

DeepSeek R2,果然近了。 最近,DeepSeek和清华的研究者发表的这篇论文,探讨了奖励模型的推理时Scaling方法。 论文地址:,强化学习(RL)已广泛应用于LLM的大规模后训练阶段。
4/7/2025 8:42:00 AM
新智元

一文读懂开源 Llama 4 模型

Hello folks,我是 Luga,今天我们来聊一下人工智能领域的最新大模型技术进展 - 构建高效、灵活、以及开源的的大模型 - Llama 4 。 在人工智能领域,随着技术的不断进步,越来越多的强大语言模型应运而生。 Llama 4 作为 Meta 推出的最新一代大规模语言模型,凭借其卓越的性能和创新的架构设计,成为了当前 AI 领域的焦点之一。
4/7/2025 8:40:00 AM
Luga Lee

谷歌暗讽OpenAI:GPU在熔化,TPU火上浇油!Canvas免费开放,实测惊人

Gemini 2.5 Pro的Canvas,向所有人开放了! AI大战,再次升级。 奥特曼表示用户太热情,GPU在融化,在线求饶,团队要休息。
4/7/2025 8:39:00 AM
新智元

刚刚,特朗普扼杀全美GPU供应链?科技大厂核心AI算力告急,硅谷陷巨大恐慌

关税大棒一出,连全美的GPU供应链也危在旦夕了? 昨夜,美股经历了5年未遇的史诗级暴跌,更可怕的是,AI界已经被特朗普的关税政策,搞得乱成一锅粥了! 今天,纳斯达克综合指数直接跌超了近6%,与近一年来的新低仅一步之遥。
4/7/2025 8:38:00 AM
新智元

GenAI红队:将LLM置于网络安全测试中的技巧和技术

译者 | 晶颜审校 | 重楼从头构建一个GenAI红队,或者让现有的红队适应新技术是一个复杂的过程,OWASP在其最新指南中帮助阐释了这一过程。 红队是测试和支持网络安全系统的一种有效方法,但它仍需适应技术的发展而不断完善。 近年来,生成式人工智能(GenAI)和大型语言模型(LLM)的爆炸式增长正迫使红队世界适应。
4/7/2025 8:33:49 AM
晶颜

DeepSeek前脚发新论文,奥特曼立马跟上:GPT-5就在几个月后啊

有点意思。 这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛,引得大家纷纷联想是不是R2马上要来了。 然鹅……奥特曼这边却发了一条“变卦”的消息:计划改变:我们可能在几周之后先发布o3和o4-mini。
4/7/2025 8:15:00 AM
量子位

大模型除了聊天还能做什么?关于大模型的分类和应用

大模型技术发展到今天,其功能可以说是日新月异;并且很多企业已经在探索大模型的应用场景和技术实现;但是很多人到现在对大模型的了解仅仅只限于能聊个天,问个问题。 但实际上,大模型能够做的事要远比我们想象中的要多的多;因此,今天我们就从用户和技术两个角度来介绍一下大模型的应用。 关于大模型的分类和应用问题如果想弄清楚大模型是怎么使用的,首先要知道大模型的分类;不同类型的模型适合不同的应用场景,其功能和实现也各不相同。
4/7/2025 8:15:00 AM
DFires

英伟达GPU命名背后:是情怀,也是致敬伟人的智慧! 新智元 新智元 2025年04月05日 12:17

在上周结束的GTC大会上,老黄用两个多小时向我们介绍了英伟达过去一年的进展。 其中,最让人们关注就是「每年一更」的用于未来AI工厂的GPU芯片架构路线图。 2024年,Blackwell GPU发布;2025年上半年,Blackwell GPU已经全面发货;2025年下半年,推出Blackwell Ultra;2026年下半年,将重磅发布Vera Rubin;2027年下半年,推出Rubin Ultra;再往后,就是2028年上市的Feynman。
4/7/2025 8:07:00 AM
新智元