AI在线 AI在线

场景

谷歌Genie 3突破实时壁垒:24fps生成3D世界,AI游戏时代真正来临

你有没有想过,有一天AI能够像电影特效师一样,仅凭一句话就能实时生成一个完整的、可以游玩的3D世界? 根据最新报道,谷歌DeepMind刚刚发布的Genie 3做到了这一点,而且远远超出了我们的预期。 这不再是技术演示,而是真正可用的交互平台。
8/8/2025 9:15:54 AM
阿丸笔记

WAIC-Day3: 谈谈Agent场景及Agent OS基础设施

TL;DR看到今年Agent和具身智能爆火, 是否还记得去年云栖大会吴妈的一段话:“我们认为AI最大的想象力绝对不是在手机屏幕上,AI最大的想象力是在通过渗透数字世界,接管数字世界,并改变物理世界”那个时候还没有MCP也没有Manus/Flowith, 而如今我们看到了一条清晰的Agent渗透数字世界,接管数字世界的路径, 同时也看到了具身智能逐渐改变物理世界的趋势...别问我Day2干嘛去了, 干了一些不能说的秘密~ 然后下午本来在当观众看展, 结果在公司的展台站了一会儿, 就变成站台小哥讲了2小时...对于今年另一个热点, 那些各种各样所谓的“超节点”方案, 大概的背景和分析前些年其实都有了, 标准上的争议, 实现方案的差异很多. 国产方案 vs 国外UALink/SUE一堆... 实际上我想说的是ScaleUp本身的定义是不清晰的,所以超节点本身的技术设计上要么是欠缺考虑的, 要么是Over Engineering的.
7/31/2025 2:11:00 AM
zartbot

2025年ChatGPT编程神器指南:20个开发者必学提示!

我几乎每天都在写代码,ChatGPT现在已经是我工作流程的一部分,就像Git或VS Code一样。 但经过几个月的摸索,我发现了一个真相:ChatGPT的强大之处不在于你让它“修这段代码”或“写个Python函数”。 真正的秘诀在于你怎么问。
7/31/2025 2:11:00 AM
AI研究生

腾讯混元开源语音数字人模型HunyuanVideo-Avatar:图+音频,让图中的主角说话唱。

腾讯发布了一款创新技术 ——HunyuanVideo-Avatar 语音数字人模型,并将其开源。 这一技术能够仅凭一张图片和一段音频,生成自然、真实的数字人说话或唱歌视频,标志着短视频创作进入了全新阶段。 HunyuanVideo-Avatar 模型的核心功能在于其智能理解能力。
5/28/2025 2:00:50 PM
AI在线

一图生万物?AI“神笔马良”3DTown,单张照片变3D城市,这波操作太秀了!

最近,一项黑科技直接颠覆了我们对3D 世界构建的认知!普林斯顿大学、哥伦比亚大学和一家叫 Cyberever AI 的公司,联手推出了一套名叫3DTown 的框架。 听名字就知道,它就是来帮你搞3D 城镇的!最骚的是什么?它能仅仅凭借一张俯视图,就能帮你生成一个逼真、连贯的3D 城镇场景!  而且,它还是个免训练(training-free)的框架,这意味着你不用费劲巴拉地去收集海量3D 数据来训练它,直接就能用!
5/22/2025 6:00:45 PM
AI在线

大模型时代:AI 网关的智能连接与场景对接

1.背景随着 AI 技术快速发展,业务对 AI 能力的渴求日益增长。 当 AI 服务面对处理大规模请求和高并发流量时,AI 网关从中扮演着至关重要的角色。 AI 服务通常涉及大量的计算任务和设备资源占用,此时需要一个 AI 网关负责协调这些请求来确保系统的稳定性与高效性。
5/12/2025 2:20:00 AM
通用工程

还在玩普通VR?HoloTime让你一键穿越到4D全景世界!

最近,在 VR 和 AR 技术领域,一项新研究成果引发了广泛关注,它就是 HoloTime。 这一创新框架致力于解决当前4D 内容生成的难题,有望重塑我们在虚拟世界中的交互体验。 今天,AIbase就来深入探究一下,HoloTime 究竟有什么神奇之处。
5/8/2025 11:00:54 AM
AI在线

优艾智合-西安交大具身智能机器人研究院公布人形机器人矩阵

3月29日,由优艾智合与西安交通大学联合创立的具身智能机器人研究院首次对外公布团队打造的人形机器人矩阵,并亮相其中一款轮式人形机器人——巡霄。 此次研究院公布的人形机器人系列包含7款产品,根据应用场景的差异形成不同的机器人定位,涵盖双足、轮式、四足、履带式等形态。 其中,“巡霄”针对大面积复杂室内场景,拥有长续航和高灵活性的特点,基于优艾智合在半导体和能源领域的场景积淀,已应用于半导体制造Sub-FAB运维及能源行业配电间操作等领域。
3/31/2025 3:23:00 PM
新闻助手

藏在国民APP里的黑科技:美图CVPR 2025五大新突破!

2025年,计算机视觉领域三大顶级会议之一的CVPR(国际计算机视觉与模式识别会议)投稿量再次刷新纪录,超过13000篇工作进入评审流程,录用比例仅为22.1%,相较去年再次下降1.5%。 美图旗下美图影像研究院(MT Lab)联合清华大学、新加坡国立大学、北京理工大学、北京交通大学等知名高校发布的5篇论文入选CVPR 2025,均聚焦于图像编辑领域,分布在生成式AI、交互式分割、3D重建三个方面。 在研发方面的突破代表美图在核心视觉领域竞争力的持续提升,AI助推下美图产品力持续提升,也带动了更高的用户粘性和付费意愿,深度结合前沿技术与探索可落地的实用价值,成为美图成功在影像与设计领域打造AI产品的重要驱动力。
3/27/2025 3:09:00 PM
新闻助手

来了!十个构建Agent的大模型应用框架

随着生成式人工智能(GenAI)的蓬勃发展,基于大型模型的应用已经悄然融入我们的日常工作和生活,它们在诸多领域中显著提升了生产力和工作效率。 为了更便捷地构建这些基于大模型的应用程序,开源社区和产品开发者们正以前所未有的速度进行创新。 在这些创新中,面向智能体(Agent)的应用,即所谓的Agentic AI,已经崭露头角,成为近年来生成式AI系统中最具潜力的明星。
3/24/2025 10:55:18 AM
曹洪伟

维他动力种子轮融资2亿元,今年底发布首款消费级机器人产品

明星机器人产品公司——维他动力(Vita Dynamics)近期完成了种子 轮融资,成立三个月内,累计完成2亿元种子轮融资,本轮融资由知名投资机构今日资本、凯辉基金领投,雅瑞资本参与投资,高瓴创投、元璟资本、初心资本、柏睿资本及BV百度风投等多家首轮投资方持续跟投,高鹄资本担任独家财务顾问。 此次融资将进一步加速维他动力为个人和家庭创造生活空间智能伙伴的产品研发与市场拓展。 在技术突破和应用场景的双重驱动下,机器人产业化进程已经迎来重大机遇。
3/21/2025 11:27:00 AM
新闻助手

钉钉发布“AI创新N次方计划”,为AI生态免除佣金、保证金和算力费用

3月20日,钉钉在北京举办了“AI创业N次方”生态创新大会。 会上,钉钉发布了一系列全新生态政策,为AI创业者、AI转型者提供助力:包括免除佣金、免除入驻保证金和免除算力费用,并在销售、品牌、技术和投资等方面提供支持,为生态伙伴提供AI应用创业创新的全方位助力。 钉钉发布AI创新扶持计划:“三免四助力”钉钉副总裁、开放平台总经理王铭在会上表示:“开放是钉钉一直以来的信仰。
3/20/2025 8:50:00 PM
新闻助手

大小脑结合,通用具身智能平台“慧思开物”正式发布

大小脑结合,快慢有度,让机器人更聪明。
3/14/2025 5:40:00 PM
机器之心

全球首发:5G-A人形机器人“夸父”亮相MWC,获国王点赞

在世界移动通信大会(MWC2025)上,乐聚机器人联合中国移动和华为,发布了全球首款搭载5G-A技术的人形机器人“夸父”,并获得西班牙国王费利佩六世的关注。 “夸父”机器人利用5G-A技术,实现了大场景下的高精度定位,增强了多机协作的可靠性,并拓宽了工业场景适用范围。 5G-A网络的高带宽能力,为机器人的深度学习模型提供丰富的训练数据,缩短了开发周期。
3/6/2025 11:41:00 AM
AI在线

MegaSynth:用70万合成数据突破3D场景重建瓶颈,PSNR提升1.8dB!

一眼概览MegaSynth 提出了一种基于非语义合成数据的大规模 3D 场景重建方法,生成 70 万个合成场景数据集,训练大型重建模型(LRMs),相比使用真实数据训练的模型,PSNR 提升 1.2~1.8 dB,显著增强 3D 场景重建的广覆盖能力。 核心问题当前 3D 场景重建方法受限于:数据规模受限:现有真实数据集 DL3DV 仅 10K 场景,远小于物体级数据集(如 Objaverse 80 万个实例)。 数据分布不理想:现有数据集多为人工采集,难以确保场景多样性,摄像机运动范围受限,且可能包含噪声和不精确标注。
3/6/2025 12:15:00 AM
萍哥学AI

快手可灵AI 1月全球访问用户环比增长113%

根据公开数据显示,今年1月,快手可灵AI全球月访问用户总数环比增长113%。 瑞银近期表示,在线娱乐与教育乃是 AI 落地的核心场景,快手作为应用层的标杆企业,其自主研发的可灵 AI 在全球视频生成模型领域占据领先地位。 前不久可灵AI正式上线多图参考参考功能,支持同时参考多个主体。
2/27/2025 2:52:00 PM
AI在线

亚马逊推出升级版Alexa+ 能读懂和总结长文档

在亚马逊年度设备与服务活动上,亚马逊正式推出了其增强版语音助手 Alexa 。 这一新版本不仅提升了语音交互体验,还融入了生成式人工智能技术,让用户与 Alexa 之间的互动更加智能和便捷。 在活动中,亚马逊演示了如何将文档分享给 Alexa ,使其能够提取关键信息并回答关于这些文档的问题。
2/27/2025 1:54:00 PM
AI在线

从某个角度看,Deepseek之于AI与当年Oracle之于信息化的意义是相同的

春节前这段时间里最热的莫过于DEEPSEEK,我因为家中老人住院,春节前后都泡在医院里。 无聊的时候只能看看头条消磨时光。 最近这段时间,我的头条推送几乎被DS占据了。
2/7/2025 8:32:56 AM
白鳝