AI在线 AI在线

资讯列表

OpenAI宣布GPT-5推迟数月发布 技术整合难度成倍上升

OpenAI 首席执行官萨姆·奥特曼(Sam Altman)近日通过社交媒体宣布,GPT-5 的发布计划将推迟,预计在未来几个月内正式推出。 此前,OpenAI 计划在 2025 年初发布 GPT-5,但最终决定延后,以便将该模型做得比预期更好。 奥特曼表示,推迟发布的原因是 GPT-5 的能力远超预期,整合所需资源和生态准备超出了当前可控范围。
4/8/2025 12:20:00 AM

中国科学院青藏高原研究所、阿里云联合发布水能粮多模态推理大模型“洛书”

据介绍,“洛书”大模型集成了科学模型“思源”(Hydro Trace)和千问推理模型 QwQ-32B 以及多模态模型 Qwen2.5-VL,可对特定区域在不同时间尺度的来水量和来源进行精准分析和预测,进而助力调节水资源管理中供水、发电与粮食生产需求的动态平衡。
4/7/2025 5:05:22 PM
归泷

Kimi 开放平台模型推理服务降价

Kimi 开放平台今日官宣,基于 Moonshot AI 一年来的技术积累和性能优化,已经在北京时间 2025 年 04 月 07 日 0 点对 Kimi 开放平台提供的模型推理服务进行价格调整。
4/7/2025 3:38:29 PM
汪淼

三年内拿下10%的赛道份额,用AI撬动技术人才招聘的百亿缺口,万码优才做对了什么

“我想我们是在红海里找到了蓝海”。 在众多涌入AI赛道逐梦的创客中,周媛绝对是非常特别的一位——创业之前,她在HRBP架构中担任COE,创业后,作为CEO的她,在一片红海的招聘领域中闯出了另一番洞天。 三年前,ChatGPT引爆的AI变革山雨欲来,周媛想要做一款AI驱动的招聘产品的念头愈发强烈:“我意识到再不转型可能要被AI替代掉了”。
4/7/2025 1:30:34 PM
李美涵

论文读得慢,可能是工具的锅,一手实测科研专用版「DeepSeek」

「未来,99% 的 attention 将是大模型 attention,而不是人类 attention。 」这是 AI 大牛 Andrej Karpathy 前段时间的一个预言。 这里的「attention」可以理解为对内容的需求、处理和分析。
4/7/2025 1:30:00 PM
机器之心

Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅

Meta前脚刚发Llama 4,后脚就有大佬请辞了! 一亩三分地的爆料贴称,经过反复训练后,Llama 4未能取得SOTA,甚至与顶尖大模型实力悬殊。 为了蒙混过关,高层甚至建议:在后训练阶段中,将多个benchmark测试集混入训练数据。
4/7/2025 1:24:52 PM
新智元

反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗?

「我们应该抛弃反向传播并重新开始。 」早在几年前,使反向传播成为深度学习核心技术之一的 Geoffrey Hinton 就发表过这样一个观点。 而一直对反向传播持怀疑态度的也是 Hinton。
4/7/2025 1:22:00 PM
机器之心

Agent不会在2025爆发

作者 | 云昭大模型已经在聚光灯下狂奔了28个月,时至今日,Agent已经被成为了包括黄仁勋、奥特曼、李彦宏、周鸿祎、吴泳铭等一众科技大佬在内备受期待的2025爆发品。 可正如不久前“朱啸虎不太看好机器人赛道”一般,Agent赛道同样也存在着一场泡沫之下的非共识。 1.巨头争相较量,市场异常冷谈我们先从企业内部的Agent来看下。
4/7/2025 1:17:49 PM
云昭

MoCha:开启自动化多轮对话电影生成新时代

本文由加拿大滑铁卢大学魏聪、陈文虎教授团队与 Meta GenAI 共同完成。 第一作者魏聪为加拿大滑铁卢大学计算机科学系二年级博士生,导师为陈文虎教授,陈文虎教授为通讯作者。 近年来,视频生成技术在动作真实性方面取得了显著进展,但在角色驱动的叙事生成这一关键任务上仍存在不足,限制了其在自动化影视制作与动画创作中的应用潜力。
4/7/2025 1:17:00 PM
机器之心

铰链物体的通用世界模型,超越扩散方法,入选CVPR 2025

基于当前观察,预测铰链物体的的运动,尤其是 part-level 级别的运动,是实现世界模型的关键一步。 尽管现在基于 diffusion 的方法取得了很多进展,但是这些方法存在处理效率低,同时缺乏三维感知等问题,难以投入真实环境中使用。 清华大学联合北京大学提出了第一个基于重建模型的 part-level 运动的建模——PartRM。
4/7/2025 1:10:00 PM
机器之心

Meta Llama 4被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车

Meta 翻车来得猝不及防。 上周六,Meta 发布了最新 AI 模型系列 ——Llama 4,并一口气出了三个款,分别是 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。 据官方介绍,在大模型竞技场中,它们的排名相当不赖。
4/7/2025 1:03:00 PM
机器之心

联合国警告:AI 可能影响全球 40% 工作岗位,并拉大国家间差距

联合国报告指出,到2033年AI市场价值或达4.8万亿美元,但可能影响全球40%工作岗位,加剧国家间不平等。报告呼吁加强国际合作与包容性治理,确保AI惠及所有人。#人工智能##全球经济#
4/7/2025 12:59:51 PM
远洋

ILLUME+:华为诺亚探索新GPT-4o架构,理解生成一体模型,昇腾可训!

近年来,基于大语言模型(LLM)的多模态任务处理能力取得了显著进展,特别是在将视觉信息融入语言模型方面。 像 QwenVL 和 InternVL 这样的模型已经展示了在视觉理解方面的卓越表现,而以扩散模型为代表的文本到图像生成技术也不断突破,推动了统一多模态大语言模型(MLLM)的发展。 这些技术的进步使得视觉理解和生成能力的无缝集成成为可能,进一步推进了视觉和语义深度融合下的人工通用智能(AGI)的探索。
4/7/2025 12:59:00 PM
机器之心

中国科大新成果入选 ICLR 2025:特定领域仅用 5% 训练数据,知识准确率提升 14%

来自中国科学技术大学 MIRA 实验室的王杰教授团队提出了一个创新的框架 —— 知识图谱驱动的监督微调(KG-SFT),该框架通过引入知识图谱(KG)来提升大语言模型(LLMs)在特定领域的知识理解和处理能力。
4/7/2025 12:43:38 PM
汪淼

微软 AI 版《雷神之锤 2》遭喷:模糊、耗电,亵渎开发者工作

微软推出由AI模型Muse驱动的《雷神之锤2》技术演示版,引发玩家和开发者争议。尽管展示生成式AI在游戏领域的潜力,但技术局限和玩家不满情绪显著。#AI游戏争议# #微软Muse#
4/7/2025 12:42:18 PM
远洋

Meta Llama 4 发布 36 小时“差评如潮”,匿名员工爆料拒绝署名技术报告

发布时的官方测评(LiveCodeBench)分数和在大模型竞技场表现明明都很不错。但到了各种第三方基准测试中,情况大多直接逆转,排名末尾。
4/7/2025 12:37:30 PM
汪淼

2025 商汤技术交流日 4 月 10 日举行,日日新 6.0“强推理”模型首秀

商汤科技SenseTime官微今日宣布,“2025商汤技术交流日”将于4月10日14时举行,届时将推出主打“强推理”的全新日日新6.0 AI模型。
4/7/2025 12:12:27 PM
清源

自我修复数据管道:数据工程的下一件大事?

译者 | 李睿审校 | 重楼梅西百货公司首席数据工程师Naresh Erukulla是一位勇于迎接挑战的数据工程师,他擅长用简洁明了的概念验证(POC)解决各种问题。 最近,Naresh关注到了数据工程师日常工作中普遍遭遇的一个难题,并为此采取行动,为所有批处理和流数据管道设置了警报系统。 当错误超过阈值或数据管道出现故障时,可以迅速通过电子邮件向数据工程师发送故障通知,确保问题能够得到及时处理。
4/7/2025 11:55:58 AM
李睿