AI在线 AI在线

理论

Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告

Meta最新基础模型Llama 4发布36小时后,评论区居然是这个画风:失望,非常失望不知道他们后训练怎么搞的,总之不太行在[各种测试]2中失败……还被做成表情包调侃,总结起来就是一个“差评如潮”。 具体来看,大家的抱怨主要集中在代码能力。 最直观的要数经典“氛围编程”小球反弹测试,小球直接穿过墙壁掉下去了。
4/8/2025 3:44:00 AM

大模型部署工具 Ollama 使用指南:技巧与问题解决全攻略

一、Ollama 是什么? Ollama 是一个开源的本地大模型部署工具,旨在简化大型语言模型(LLM)的运行和管理。 通过简单命令,用户可以在消费级设备上快速启动和运行开源模型(如 Llama、DeepSeek 等),无需复杂配置。
4/8/2025 3:22:00 AM
wayn

模态编码器 | 最强CLIP模型EVA-CLIP-18B

来自智源王鑫龙团队的工作,将EVA-CLIP模型参数扩展至18B,简单看下结果,EVA-CLIP-18B性能远超其他模型。 项目地址:。 首先,随着大型语言模型(LLMs)参数量的增长至千亿级别,与其配套的视觉基础模型却未能同步扩展,这种不对等限制了多模态应用的整体效能。
4/8/2025 3:00:00 AM
Goldma

Meta LLaMA 4:对抗 GPT-4o 与 Claude 的开源王牌

2025 年 4 月,Meta 正式发布了 LLaMA 4 系列的首批两款模型。 这两款模型模型分别是:LLaMA 4 Scout 与 LLaMA 4 Maverick,均采用了 专家混合架构(Mixture-of-Experts, MoE)。 据 Meta 表示,这是首次有 LLaMA 模型实现 文字与图像的统一处理能力,具备真正意义上的多模态理解。
4/8/2025 2:26:00 AM

LLM幻觉,竟因知识「以大欺小」!华人团队祭出对数线性定律与CoDA策略

大语言模型(LLMs)已经彻底改变了AI,但「幻觉」问题如影随从,堪称LLM癌症。 LLM会一本正经、义正辞严的捏造事实,「脸不红,心不跳」地说谎。 「幻觉」被普遍认为与训练数据相关。
4/8/2025 2:22:00 AM
新智元

比DeepSeek更惊艳,生成式决策如何让机器人拥有创造力?

当传统机器人遇见生成式AI,会擦出什么样的火花? 技术的演进从不停滞。 如今,我们正处在具身智能发展的关键节点,生成式决策技术正悄然改变着这个领域的游戏规则。
4/8/2025 2:00:00 AM
大数据AI智能圈

改变世界的十大算法

在当今这个数字化时代,算法已经成为推动世界运转的核心力量。 它们如同隐藏在幕后的魔术师,用精密的逻辑和数学原理塑造了现代生活的方方面面。 从我们每天使用的智能手机,到支撑全球金融体系的复杂网络,算法无处不在。
4/8/2025 1:11:00 AM
大道至简

五年复合增长率达35.2%!2028年中国AI总投资规模将超千亿美元

IDC发布的《全球人工智能和生成式人工智能支出指南》(IDC Worldwide AI and Generative AI Spending Guide)显示,2024年全球人工智能(AI) IT总投资规模为3158亿美元,预计2028年增至8159亿美元,五年复合增长率为32.9%。 其中,生成式AI市场五年复合增长率或达63.8%,到2028年其市场规模将达2842亿美元,占AI市场投资总规模的35%。 聚焦中国,IDC数据显示,中国将继续引领亚太地区人工智能市场发展,占亚太地区人工智能总支出超五成。
4/8/2025 1:00:00 AM

谷歌研究:合成数据使大模型数学推理能力提升八倍

最近,来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。 据专注于人工智能发展的研究机构 Epoch AI 报告显示,目前全球约有 300 万亿个公开可用的高质量文本训练标记。 然而,随着类似 ChatGPT 这样的大模型的迅猛发展,对训练数据的需求呈指数级增长,预计到 2026 年之前,这些数据将被耗尽。
4/8/2025 12:40:00 AM
远洋

OpenAI宣布GPT-5推迟数月发布 技术整合难度成倍上升

OpenAI 首席执行官萨姆·奥特曼(Sam Altman)近日通过社交媒体宣布,GPT-5 的发布计划将推迟,预计在未来几个月内正式推出。 此前,OpenAI 计划在 2025 年初发布 GPT-5,但最终决定延后,以便将该模型做得比预期更好。 奥特曼表示,推迟发布的原因是 GPT-5 的能力远超预期,整合所需资源和生态准备超出了当前可控范围。
4/8/2025 12:20:00 AM

三年内拿下10%的赛道份额,用AI撬动技术人才招聘的百亿缺口,万码优才做对了什么

“我想我们是在红海里找到了蓝海”。 在众多涌入AI赛道逐梦的创客中,周媛绝对是非常特别的一位——创业之前,她在HRBP架构中担任COE,创业后,作为CEO的她,在一片红海的招聘领域中闯出了另一番洞天。 三年前,ChatGPT引爆的AI变革山雨欲来,周媛想要做一款AI驱动的招聘产品的念头愈发强烈:“我意识到再不转型可能要被AI替代掉了”。
4/7/2025 1:30:34 PM
李美涵

Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅

Meta前脚刚发Llama 4,后脚就有大佬请辞了! 一亩三分地的爆料贴称,经过反复训练后,Llama 4未能取得SOTA,甚至与顶尖大模型实力悬殊。 为了蒙混过关,高层甚至建议:在后训练阶段中,将多个benchmark测试集混入训练数据。
4/7/2025 1:24:52 PM
新智元

反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗?

「我们应该抛弃反向传播并重新开始。 」早在几年前,使反向传播成为深度学习核心技术之一的 Geoffrey Hinton 就发表过这样一个观点。 而一直对反向传播持怀疑态度的也是 Hinton。
4/7/2025 1:22:00 PM
机器之心

Agent不会在2025爆发

作者 | 云昭大模型已经在聚光灯下狂奔了28个月,时至今日,Agent已经被成为了包括黄仁勋、奥特曼、李彦宏、周鸿祎、吴泳铭等一众科技大佬在内备受期待的2025爆发品。 可正如不久前“朱啸虎不太看好机器人赛道”一般,Agent赛道同样也存在着一场泡沫之下的非共识。 1.巨头争相较量,市场异常冷谈我们先从企业内部的Agent来看下。
4/7/2025 1:17:49 PM
云昭

自我修复数据管道:数据工程的下一件大事?

译者 | 李睿审校 | 重楼梅西百货公司首席数据工程师Naresh Erukulla是一位勇于迎接挑战的数据工程师,他擅长用简洁明了的概念验证(POC)解决各种问题。 最近,Naresh关注到了数据工程师日常工作中普遍遭遇的一个难题,并为此采取行动,为所有批处理和流数据管道设置了警报系统。 当错误超过阈值或数据管道出现故障时,可以迅速通过电子邮件向数据工程师发送故障通知,确保问题能够得到及时处理。
4/7/2025 11:55:58 AM
李睿

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。 通过构建大规模(100 万立体图像对)合成训练数据集,结合自动自筛选流程去除模糊样本,并设计了网络架构组件(如侧调谐特征主干和远程上下文推理)来增强可扩展性和准确性。 这些创新显著提升了模型在不同领域的鲁棒性和精度,为零样本立体深度估计设立了新标准。
4/7/2025 9:45:00 AM
机器之心

AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断

你是否想过,LLM也有着自己的小心思? 最新研究揭示了一个有趣的现象:LLM在被研究人员测试时,会有意识地改变自己的行为。 在面对那些旨在评估人格特质的问题时,它们给出的答案会尽可能地讨人喜欢,符合社会期望。
4/7/2025 9:31:00 AM
新智元

超九成年轻人工作学习离不开AI,人均还有1.8个AI朋友丨Soul《2025 Z世代AI使用报告》

不是我说,年轻人群体到底怎么看AI、用AI啊? ? ?
4/7/2025 9:28:00 AM
量子位