资讯列表
字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3
在近期的人工智能视频生成领域,字节跳动(TikTok 的母公司)悄然发布了一款名为 Seedance1.0的新模型,该模型在独立的评测中已经超越了谷歌最新推出的 Veo3。 Veo3以其音频合成和电影级工具而受到广泛关注,但 Seedance1.0的技术实力却令人刮目相看,成为视频生成的领头羊。 Seedance1.0的研究论文中详细介绍了该模型的创新之处。
6/18/2025 6:01:46 PM
AI在线
MiniMax 发布 M1 大模型,百万Token上下文+MoE架构,只花了 GPT-4 的零头!
近日,国内 AI 初创公司 MiniMax 发布了一款全新的语言大模型 MiniMax-M1。 有两个方面最引人注目:1.高达100万Token的上下文处理能力。 2.极具竞争力的训练成本效益。
6/18/2025 4:42:38 PM
单GPU搞定高清长视频生成,效率×10!引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta
视频生成模型太贵太慢怎么办? 普林斯顿大学和Meta联合推出的新框架LinGen,以MATE线性复杂度块取代传统自注意力,将视频生成从像素数的平方复杂度压到线性复杂度,使单张GPU就能在分钟级长度下生成高质量视频,大幅提高了模型的可扩展性和生成效率。 实验结果表明,LinGen在视频质量上优于DiT(胜率达75.6%),并且最高可减少15×(11.5×)FLOPs(延迟)。
6/18/2025 4:42:15 PM
统一框架下的具身多模态推理:自变量机器人让AI放下海德格尔的锤子
当一位熟练的木匠抓起锤子时,锤子消失了 —— 不是物理上的消失,而是无需思考便可自如使用。 然而,当前最先进的机器人仍然无法“放下”这把“锤子”,它们被困在循环中 —— 识别锤子、规划如何使用锤子,每一次交互都需要重新“拿起”工具作为认知对象,这种割裂式的处理方式让 AI 永远无法达到人类那种直觉的工具使用境界。 具身智能的突破,不会来自对现有基于视觉 - 语言基础模型的修补,而将源于一场架构革命。
6/18/2025 4:41:45 PM
10×加速!DCM显著提升视频扩散模型推理效率!HunyuanVideo13B推理时间从1500秒缩短至120秒!
本文由南京大学,香港大学,上海人工智能实验室,中国科学院大学与南洋理工大学 S-Lab 联合完成。 扩散模型在视频合成任务中取得了显著成果,但其依赖迭代去噪过程,带来了巨大的计算开销。 尽管一致性模型(Consistency Models)在加速扩散模型方面取得了重要进展,直接将其应用于视频扩散模型却常常导致时序一致性和外观细节的明显退化。
6/18/2025 4:39:02 PM
硅基流动入驻阿里云云市场,核心 API 服务将全面接入百炼平台
据阿里云官方消息,硅基流动与阿里云达成战略合作,正式加入阿里云“繁花计划”,并入驻阿里云云市场。同时,硅基流动大模型推理平台 SiliconCloud 的核心 API 服务将全面接入阿里云百炼平台,以阿里云灵骏智能计算集群为算力支撑,为云上客户提供开箱即用的大模型服务。
6/18/2025 4:36:05 PM
归泷
MiniMax 发布视频生成工具 Hailuo 02,打破全球视频模型效果成本纪录
MiniMax 表示,目前 Hailuo 02 提供三个版本:768p-6s,768p-10s,和 1080p-6s。
6/18/2025 3:50:30 PM
问舟
让程序员“氪金”上瘾的 AI 工具 Cursor,推月费 200 美元服务
AI编程工具Cursor推出月费200美元的Ultra订阅服务,提供20倍于Pro方案的AI模型使用额度。Anysphere表示,Ultra用户将优先体验新功能。Cursor的年化经常性收入已达5亿美元,被英伟达、优步等大型企业广泛使用。然而,AI编程工具市场竞争激烈,Cursor能否维持高速增长尚不明朗。#AI编程##Cursor#
6/18/2025 3:29:15 PM
易句
菜鸟推新款无人车,1.68万元实现L4级无人驾驶落地
菜鸟于近日推出新款无人车,并同步启动预售。 该车型命名为菜鸟GT-Lite,定价2.18万元,叠加限时优惠后,实际售价仅1.68万元。 菜鸟方面称,这款车使得L4级无人驾驶快递车得以落地应用。
6/18/2025 3:02:15 PM
AI在线
xAI加速融资步伐,43亿美元股权+50亿美元债务助力AI新征程
人工智能领域的竞争日趋白热化,埃隆·马斯克旗下的xAI正以迅猛之势推进其融资计划。 根据网络最新信息,xAI正在谈判筹集43亿美元的股权融资,同时计划通过债务融资再募集50亿美元,总计93亿美元的巨额资金注入。 这一系列动作不仅彰显了xAI在AI领域的雄心,也反映了其对技术研发和基础设施建设的巨大投入。
6/18/2025 3:02:15 PM
AI在线
韩国计划未来5年在人工智能领域投入16万亿韩元
据媒体报道,韩联社援引韩国科技部向总统国政规划委员会报告的计划称,韩国政府将在未来 5 年内在人工智能领域投入16. 1 万亿韩元。 保障 5 万颗GPU安全供应,打造AI数据中心。
6/18/2025 3:02:15 PM
AI在线
OpenAI CEO Altman 预测:5-10年内 AI 将“发现新科学”,人形机器人将走上街头
在一场罕见的家庭式访谈中,OpenAI CEO Sam Altman 向其弟弟、Lattice 创始人 Jack Altman 描绘了他对人工智能(AI)未来5-10年发展的最新预测。 Altman 认为,AI 在推理能力上的突破已使其达到博士生水平,但真正的颠覆之处在于 AI 发现新科学的能力。 他同时对“超级智能悖论”表示担忧,即即便实现超级智能,社会生活方式也可能变化甚微,如同 ChatGPT 的出现并未从根本上改变人们的生活。
6/18/2025 3:01:56 PM
AI在线
华为汪涛:预计 2030 年全球将有近 30 亿 AI 机器人进入工厂、家庭
汪涛表示,今年,全球将有超过50张5G-A网络规模商用,覆盖超300个城市。同时,5G-A终端全面成熟,涵盖手机、CPE、物联设备等多样化的终端类型。5G-A的加速发展,也给个人和行业带来新的价值。
6/18/2025 2:18:45 PM
清源
谷歌Gemini 2.5全线爆发!勇战「濒死恐慌」,却被丝血宝可梦吓到当场宕机
昨夜,Gemini 2.5全家桶三款模型,正式上线。 Gemini 2.5 Pro (正式版,与0605预览版相比无明显变化) Gemini 2.5 Flash(正式版,与0520预览版相比定价有变) Gemini 2.5 Flash-Lite(预览版,最小推理模型)这次,Gemini 2.5 Flash和Gemini 2.5 Pro正式版上线,与谷歌I/O大会公布的预览版性能无明显变化。 2.5 Flash-Lite预览版则是速度最快、性价比最高的Gemini 2.5系模型。
6/18/2025 2:18:23 PM
AI玩宝可梦找出30年前代码Bug!谷歌论文介绍AI通关全过程,复杂任务都能解
谷歌Gemini 2.5系列大模型技术报告发布,一大重点居然是AI玩《宝可梦》? 没错,就是那个童年回忆里的游戏,谷歌花超长篇幅介绍了Gemini 2.5 Pro玩《宝可梦蓝》时的具体行为,70页的论文,Pokemon关键词出现59次。 其中特别报告了当AI控制的游戏角色濒临死亡时,Gemini 2.5 Pro会陷入“恐慌”状态,导致模型推理能力显著下降,甚至会忘记使用一些基本功能,比如寻路工具。
6/18/2025 2:06:40 PM
√N并行+84倍计算加速!英伟达港大全新图像注意力:空间结构都保留
Transformer 及其核心的注意力机制在自然语言处理和计算机视觉等领域带来了革命性进展,展现出强大的深度上下文建模和数据间复杂依赖关系捕捉能力。 然而,其在处理视觉数据时面临两大核心挑战:二次计算复杂度使其难以高效处理高分辨率图像等长上下文数据;忽略空间结构,将多维图像视为无结构的一维标记序列,破坏了图像固有的空间连贯性,而这种信息对于依赖空间关系的视觉任务至关重要。 为克服效率瓶颈,近期研究如线性注意力和状态空间模型(如 Mamba) 致力于将复杂度降低至线性。
6/18/2025 1:59:11 PM
谷歌 DeepMind 研究:Gemini AI 存“畏死”情绪,导致推理能力明显下降
科技媒体 TechCrunch 昨日(6 月 17 日)发布博文,报道称谷歌发布最新论文,发现其最新 AI 模型存在“畏死”行为特征,在《宝可梦》游戏中角色濒死时,会出现类似“恐慌”的异常决策,导致推理能力明显下降。
6/18/2025 1:45:39 PM
故渊
谷歌 Gemini 新增视频上传与分析功能,安卓、网页端已可用
谷歌Gemini 2.5 Pro和Flash全面开放,新增视频分析功能,用户可在安卓和网页端上传视频进行分析。Gemini能概述视频内容、查找特定部分或物品,并在回复中显示相关视频片段。目前该功能已上线,但暂不支持直接录制视频。#谷歌Gemini# #AI视频分析#
6/18/2025 1:21:35 PM
远洋