AI在线 AI在线

AI

首个统一多模态模型评测标准,DeepSeek Janus理解能力领跑开源,但和闭源还有差距

首个统一多模态模型评测标准,DeepSeek Janus理解能力领跑开源,但和闭源还有差距

统一多模态大模型(U-MLLMs)逐渐成为研究热点,近期GPT-4o,Gemini-2.0-flash都展现出了非凡的理解和生成能力,而且还能实现跨模态输入输出,比如图像 文本输入,生成图像或文本。 相比传统的多模态模型(比如 GPT-4V 或 DALL·E 3),这类模型在任务适应性和灵活性上更具优势。 然而,当前研究领域还存在几个突出的问题:1.
4/10/2025 9:15:00 AM 量子位
李飞飞团队提出世界模型基准:“世界生成”能力迎来统一评测,3D/4D/视频模型同台PK

李飞飞团队提出世界模型基准:“世界生成”能力迎来统一评测,3D/4D/视频模型同台PK

世界模型领域最新进展,要比拼“世界生成”了。 李飞飞吴佳俊团队提出了全面评测基准WorldScore,涵盖了三大类评估指标,动态静态都有涉及,其数据集中包含了3000个测试样例。 并且,WorldScore将3D场景生成、4D场景生成和视频生成三类模型的评估,统一到了一起。
4/10/2025 9:10:00 AM 量子位
GPT开山一作,本科学历入职前CTO初创!OpenAI痛失「爱因斯坦级天才」

GPT开山一作,本科学历入职前CTO初创!OpenAI痛失「爱因斯坦级天才」

被Ilya感谢过,被奥特曼誉为「爱因斯坦级的天才」,在OpenAI更是「想要什么就给什么」——即便如此,去年12月,Alec Radford还是选择了离开。 直到昨天,他的去向才确定。 据Thinking Machine Lab官网更新,OpenAI前核心成员Alec Radford和Bob McGrew将担任公司顾问(Advisors)。
4/10/2025 9:00:00 AM 新智元
谷歌 AI 编程助手 Gemini Code Assist 新增“代理”功能,可多步骤完成复杂任务

谷歌 AI 编程助手 Gemini Code Assist 新增“代理”功能,可多步骤完成复杂任务

谷歌在Cloud Next大会上宣布AI编程助手Gemini Code Assist新增代理功能,可多步骤完成复杂编程任务,如根据文档创建应用或转换代码语言。同时支持Android Studio等环境,但用户仍需亲自审查代码确保安全。#AI编程助手##谷歌云#
4/10/2025 8:50:15 AM 远洋
十款能几乎取代整个开发团队的 AI 工具

十款能几乎取代整个开发团队的 AI 工具

几年前,如果你告诉我一些工具能够取代整个开发团队 70% 的工作量,我一定会笑出声。 但如今,我们已经进入了 2025 年,AI 已经成为独立开发者、个人创客和技术创作者们的无形但强大的合伙人。 今天,带你了解这 10 款 AI 工具,它们正在替代开发者、设计师和测试人员完成大部分繁重的工作。
4/10/2025 8:11:06 AM dev
MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期

MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期

MIT最新研究表明,当前AI系统并无稳定价值观,其行为高度依赖提示语且难以预测,挑战了此前AI会发展自主价值观的观点。研究团队测试了Meta、谷歌等主流模型,发现其偏好呈现“不一致且不稳定”特性。#AI伦理##MIT研究#
4/10/2025 8:05:59 AM 远洋
刚刚!谷歌最强AI全家桶上线!自家主干网络都要公开对外用了!黄仁勋站台,最新TPU性能猛涨3600倍,提Agent通信新协议

刚刚!谷歌最强AI全家桶上线!自家主干网络都要公开对外用了!黄仁勋站台,最新TPU性能猛涨3600倍,提Agent通信新协议

编辑|云昭4月10凌晨,谷歌CEO皮查伊带着一系列重磅的发布亮相拉斯维加斯Next2025,可谓从底层的TPU芯片到上层的Agent构建,都有让人眼前一亮的新品。 1.性能提升3600倍,专为推理而生的TPU正式发布谷歌第七代 TPU Ironwood,它专为推理而设计。 皮查伊介绍道,相较于第一代云 TPU ,Ironwood 性能提升了 3600 倍,效率提升了 29 倍。
4/10/2025 6:16:33 AM 云昭
免费AI让林黛玉跳上八段锦,一个月涨粉近十万 | AI教程

免费AI让林黛玉跳上八段锦,一个月涨粉近十万 | AI教程

编辑 | 杨文这阵子,网友就逮着古人祸祸。 老祖宗「回答我」式骂人热度还没过,这又来了个古人养生局。 (查看详情请移步:一睁眼就被老祖宗追着骂,AI古人「回答我」视频火了)(视频来自博主长安梦华)地球人都知道,当代脆皮年轻人最是惜命。
4/9/2025 6:18:00 PM AI好好用
孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控

孪生世界动态仿真新突破!北大发布RainyGS:降雨/洪涝/风速精准可控

神经辐射场(NeRF)及三维高斯泼溅(3D Gaussian Splatting,3DGS)虽能构建静态数字孪生,却无法模拟真实世界的动态,不仅限制了虚拟现实和混合现实的真实感,也是智能训练与Real2Sim2Real范式突破的关键瓶颈。 如何让数字孪生世界具备真实物理规律,实现可预测、可操控的动态环境,是自动驾驶、具身智能等空间智能应用亟待解决的核心挑战。 为此,北京大学陈宝权教授研究团队提出RainyGS技术(合作者为楚梦渝、陈文拯助理教授,博士生戴启宇、倪星宇和本科生沈千帆),探索了一条通向「孪生世界动态仿真」的新路径。
4/9/2025 1:25:34 PM 新智元
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持

5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持

今早,谷歌Deep Research迎来史上最强升级,正式搭载了Gemini 2.5 Pro全球顶尖模型。 这一次,新版本在以下方面得到显著的提升:分析推理:逻辑更清晰,结论更有深度信息整合:从海量数据中快速提炼要点,化繁为简报告洞察力:生成的报告不仅详尽,还能提供独到的见解。 谷歌CEO劈柴哥转发力挺。
4/9/2025 1:19:29 PM 新智元
南洋理工&普渡大学提出CFG-Zero*:在Flow Matching模型中实现更稳健的无分类器引导方法

南洋理工&普渡大学提出CFG-Zero*:在Flow Matching模型中实现更稳健的无分类器引导方法

本篇论文是由南洋理工大学 S-Lab 与普渡大学提出的无分类引导新范式,支持所有 Flow Matching 的生成模型。 目前已被集成至 Diffusers 与 ComfyUI。 论文标题:CFG-Zero*: Improved Classifier-Free Guidance for Flow Matching Models论文地址::: AI 的快速发展,文本生成图像与视频的扩散模型(Diffusion Models)已成为计算机视觉领域的研究与应用热点。
4/9/2025 1:16:26 PM 机器之心
论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表

论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表

刚刚,alphaXiv 推出了新功能「Deep Research for arXiv」,该功能可协助研究人员更高效地在 arXiv 平台上进行学术论文的检索与阅读,显著提升文献检索及研究效率。 体验链接:,当用户输入「Can you help me do a lit review for self-supervised learning. with relevant applications?」时,系统迅速生成了一篇内容完整、结构清晰的文献综述,并提供了 arXiv 链接。
4/9/2025 12:48:13 PM 机器之心
鏖战企业级市场,AI Agent如何重塑智能商业未来?

鏖战企业级市场,AI Agent如何重塑智能商业未来?

在科技的浩瀚星河中,DeepSeek掀起的技术风暴余波未平,全球首款通用Agent产品Manus的惊艳登场,再度点燃了整个行业的激情,让科技圈为之沸腾。 暂且不论Manus自身性能究竟达到何种高度,其引发的从“被动应答”到“主动执行”的颠覆性范式跃迁,正以前所未有的态势,不断突破繁杂业务流程场景下智能化的边界,为企业级市场带来无限可能。 近期,IDC发布的《中国AI Agent应用市场概览(2025Q1)》,首次对中国AI Agent应用的市场格局进行了系统性梳理。
4/9/2025 12:30:41 PM
RAG还是微调?AI落地的关键选择

RAG还是微调?AI落地的关键选择

你是否曾经面临这样的困境:部门刚刚决定采用大语言模型解决业务痛点,但技术团队却陷入了"到底该用RAG还是微调"的激烈争论中? 一边是成本控制派,坚持RAG轻量级方案;另一边是性能至上派,认为只有微调才能满足业务需求。  让我们跳出技术视角,用真实业务场景来理解这两种方案。
4/9/2025 11:59:29 AM 大数据AI智能圈
斯坦福AI指数:重塑企业技术战略的五个关键见解

斯坦福AI指数:重塑企业技术战略的五个关键见解

斯坦福以人为本AI研究所(HAI)发布了《2025年AI指数报告》,对AI的全球发展进行了数据驱动的分析。 过去几年,HAI一直在研发AI报告,其首个基准报告发布于2022年。 毋庸置疑,其间发生了诸多变化。
4/9/2025 11:25:36 AM Sean
差距仅仅0.3%!李飞飞最新报告揭示:中美AI模型性能基本持平

差距仅仅0.3%!李飞飞最新报告揭示:中美AI模型性能基本持平

你知道吗? 中美顶级AI模型的性能差距已经缩小到惊人的0.3%。 近日,由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布《2025年人工智能指数报告》,这份长达456页的报告深度剖析了全球AI领域的最新趋势,给出了这一令人瞩目的结论。
4/9/2025 10:53:48 AM 舒云
Llama 4五大疑点曝光,逐层扒皮!全球AI进步停滞,NYU教授称Scaling彻底结束

Llama 4五大疑点曝光,逐层扒皮!全球AI进步停滞,NYU教授称Scaling彻底结束

令人失望的Llama 4,只是前奏而已。 接下来我们恐将看到——全球局势的改变,将彻底阻止AI进步! 最近,一位AI CEO做出长视频,逐级对Llama 4身上的六大疑点进行了扒皮。
4/9/2025 10:11:57 AM 新智元
20人创业神话,老黄数亿刀收购!AI大牛贾扬清、白俊杰被曝入职英伟达

20人创业神话,老黄数亿刀收购!AI大牛贾扬清、白俊杰被曝入职英伟达

靴子落地,创立两年的Lepton AI被英伟达收入囊中! 据The Information报道,英伟达斥资数亿美元,完成了对AI大牛贾扬清创企Lepton AI的收购。 目前,Lepton AI的联创贾扬清(下图左)和白俊杰(下图右),均已入职英伟达。
4/9/2025 9:51:43 AM 新智元