资讯列表
41倍实时交互:LongLive如何突破长视频生成的效率与质量困局
大家好,我是肆〇柒。 最近视频生成挺火,刚好看到一个研究——LongLive实时交互式长视频生成框架。 这项由NVIDIA、MIT、香港科技大学(广州)、香港大学和清华大学研究团队联合研发的创新技术,成功解决了困扰行业已久的"提示切换断层"难题,让创作者能够在生成过程中实时调整叙事方向,实现真正的"所想即所见"创作体验。
10/21/2025 1:00:00 AM
肆零柒
欧洲零售业大变革!Frasers集团率先集成ChatGPT直接交易
欧洲零售业也迎来革命! 英国零售巨头 Frasers Group 正式成为首家在其系统中集成 Commercetools 智能代理交易系统的大型零售商。 这一创新举措允许旗下品牌如 Sports Direct 的顾客,通过 ChatGPT 等人工智能系统进行购物,并在对话界面中直接完成支付。
10/20/2025 6:07:27 PM
AI在线
谷歌计划 12 月发布全新 AI 模型 Gemini 3.0,性能将大幅提升
根据最新报道,谷歌公司正在积极筹备其旗舰 AI 模型 Gemini 的最新版本 ——Gemini3.0,并计划于今年12月正式发布。 此版本的推出将延续谷歌过去两年在年底发布 Gemini 系列产品的传统。 Gemini3.0备受期待,业内人士预测该模型将实现显著的性能提升,进一步提升谷歌在 AI 领域的竞争力。
10/20/2025 6:06:56 PM
AI在线
美国女子利用 AI 选号喜中 10 万美元彩票奖金!
近日,美国怀恩多特县的45岁女子塔米・卡维在一次彩票购买中创造了奇迹。 她使用了 ChatGPT 推荐的号码参与 Powerball 彩票的抽奖,结果幸运地赢得了10万美元(约合人民币72万元)的奖金。 卡维成功匹配了4个白球和1个 Powerball 号码,赢得了这一令人惊喜的奖励。
10/20/2025 6:06:55 PM
AI在线
Bubble 推出其首个 AI Agent,革新可视化开发体验
Bubble 是一款专注于可视化开发的平台,近日宣布推出其全新产品 Bubble AI Agent,目前已在全球范围内进入公测阶段。 这个新工具结合了 AI 的快速生成能力和用户对开发控制的需求,使得用户可以通过拖拽操作或自然语言指令来构建和编辑网页及移动应用程序,既高效又不失精细控制。 图源备注:图片由AI生成,图片授权服务商Midjourney针对目前 AI 编码工具面临的一些关键挑战,Bubble AI Agent 应运而生。
10/20/2025 6:06:55 PM
AI在线
运动巨头锐步跨界健康科技:首款智能戒指发布,售价249美元,主打压力与体温监测
知名运动品牌锐步(Reebok)于上周五正式宣布进军竞争激烈的健康科技领域,并推出了其首款可穿戴设备——锐步智能戒指。 该智能戒指定价为 249美元(约合人民币1767元),可全面记录用户的活动、心率、睡眠、压力和体温等核心生理数据。 通过这些数据,戒指能生成一个“整体评分”(One Score),为用户提供关于全方位健康状态和训练准备情况的即时反馈。
10/20/2025 6:06:55 PM
AI在线
谷歌将于12月发布Gemini 3.0模型
近日在 Dreamforce2025大会上,谷歌及其母公司 Alphabet 的首席执行官桑达尔・皮查伊宣布,备受期待的 Gemini3.0人工智能模型正在加紧开发,预计将于今年晚些时候正式发布。 Gemini3.0相比于其前代版本,将具备更为革命性的功能,特别是在自主决策与执行方面。 这一新一代 AI 代理系统,能够实现更高效的智能化服务,极大提升用户体验。
10/20/2025 6:06:55 PM
AI在线
太强了!DeepSeek刚刚开源新模型,用视觉方式压缩一切
我们或许能通过文本到图像的方法实现近 10 倍无损上下文压缩。 没想到吧,DeepSeek 刚刚开源了新模型,还是一款 OCR 模型。 可以看到,该模型的参数量为 3B,刚上线不久就已经有 100 多次下载量了。
10/20/2025 5:50:00 PM
机器之心
NeurIPS 2025 | CMU、清华、UTAustin开源ReinFlow,用在线RL微调机器人流匹配策略
作者简介:本文第一作者为卡耐基梅隆大学机器人所研究生 Tonghe Zhang,主要研究方向为机器人操作大模型和全身控制算法。 合作者为德克萨斯大学奥斯汀分校博士生 Sichang Su, 研究方向为强化学习和通用机器人策略。 指导教师是清华大学和北京中关村学院的 Chao Yu 教授以及清华大学 Yu Wang 教授。
10/20/2025 5:44:00 PM
机器之心
ICCV 2025 | 扩散模型生成手写体文本行的首次实战,效果惊艳还开源
本文中,来自华南理工大学、MiroMind AI、新加坡国立大学以及琶洲实验室的研究者们提出一种新的生成模型 Diffusion Brush,首次将扩散模型用于文本行级的手写体生成,在英文、中文等多语言场景下实现了风格逼真、内容准确、排版自然的文本行生成。 研究背景AI 会写字吗? 在写字机器人衍生换代的今天,你或许并不觉得 AI 写字有多么困难。
10/20/2025 5:27:00 PM
机器之心
1.58bit不输FP16!微软推出全新模型蒸馏框架,作者全是华人
1.58bit量化,内存仅需1/10,但表现不输FP16? 微软最新推出的蒸馏框架BitNet Distillation(简称BitDistill),实现了几乎无性能损失的模型量化。 该框架在4B及以下的Qwen、Gemma上已被证实有效,理论上可用于其他Transformer模型。
10/20/2025 5:15:35 PM
Nature点赞!哈佛MIT最新作:AI科学家时代来了
随着近期大模型和智能体的飞速发展,这条路径正在通向一种全新的阶段:「AI科学家」。 在AI赋能科研的前沿,我们正见证一个重要的里程碑:从证明AI智能体「能否」解决特定科学问题,转向思考如何让它「高效、可靠、规模化」地参与整个研究过程。 Nature近期发布的新闻解析, 报道了由哈佛大学Marinka Zitnik和高尚华团队与MIT发布的首款大规模工具开源框架ToolUniverse。
10/20/2025 5:06:19 PM
IDC 2025 最新 Infra 报告力荐:GMI Cloud 领跑 AI 原生云赛道
近日,全球权威市场研究机构 IDC 发布《AI 原生云/新型云厂商重构 Agentic 基础设施》报告,深度剖析生成式 AI(GenAI)爆发背景下,AI 基础设施市场的变革趋势与核心玩家价值。 报告明确指出,“AI 原生云厂商凭借稳定的供应链、显著的价格优势及专业化能力,已在 AI 基础设施市场站稳脚跟”,并将 GMI Cloud 与 CoreWeave 列为新型 AI 原生云厂商中的重点调研推荐对象,从技术实力、生态资源、产品布局及战略视野四大维度,肯定其在推动企业 GenAI 落地中的核心作用。 IDC 洞察 AI 应用市场焦点:AI 原生云成 GenAI 跨越“PoC 到生产”关键,推理与合规需求凸显.
10/20/2025 5:00:28 PM
十三
微软BitDistill将LLM压缩到1.58比特:10倍内存节省、2.65倍CPU推理加速
大语言模型(LLM)不仅在推动通用自然语言处理方面发挥了关键作用,更重要的是,它们已成为支撑多种下游应用如推荐、分类和检索的核心引擎。 尽管 LLM 具有广泛的适用性,但在下游任务中高效部署仍面临重大挑战。 随着模型规模的急剧扩大,这些挑战被进一步放大,尤其是在资源受限的设备上(如智能手机),内存占用和计算开销都变得极其昂贵。
10/20/2025 4:39:00 PM
机器之心
AGILE:视觉学习新范式!自监督+交互式强化学习助力VLMs感知与推理全面提升
现有视觉语言大模型(VLMs)在多模态感知和推理任务上仍存在明显短板:1. 对图像中的细粒度视觉信息理解有限,视觉感知和推理能力未被充分激发;2. 强化学习虽能带来改进,但缺乏高质量、易扩展的 RL 数据。
10/20/2025 4:34:00 PM
机器之心
突破FHE瓶颈,Lancelot架构实现加密状态下的鲁棒聚合计算,兼顾「隐私保护」与「鲁棒性」
在金融、医疗等高度敏感的应用场景中,拜占庭鲁棒联邦学习(BRFL)能够有效避免因数据集中存储而导致的隐私泄露风险,同时防止恶意客户端对模型训练的攻击。 然而,即使是在模型更新的过程中,信息泄露的威胁仍然无法完全规避。 为了解决这一问题,全同态加密(FHE)技术通过在密文状态下进行安全计算,展现出保护隐私信息的巨大潜力。
10/20/2025 4:30:00 PM
机器之心
远景科技张雷提出"物理人工智能"概念:预测未来能源系统将以智能资产为核心
远景科技集团董事长张雷在 10 月 19 日举行的"人工智能与未来能源系统"闭门科技会上,提出了"物理人工智能"的概念框架,阐述了AI在能源系统中从工具向决策主体转变的趋势,并预测未来能源企业的竞争力将从物理资产规模转向智能资产规模。 张雷认为,AI技术与以往技术革命的本质区别在于,它不再仅仅是被动的工具,而是具备自我感知和决策能力的主体。 这标志着AI从"自动化"向"自主化"的跨越。
10/20/2025 4:21:27 PM
AI在线
视觉中国与多家AI公司合作开发可商用视觉大模型:已获阿里、微软等订单
视觉内容版权平台视觉中国在 10 月 19 日的线上会议中披露了其AI业务进展。 公司已与多家AIGC企业建立战略合作关系,计划共同研发"可商用 可溯源"的视觉创意行业大模型,并已获得阿里、微软等国际大模型公司的合规数据服务订单。 从业务模式来看,视觉中国的定位是为AI模型训练提供高质量、版权合规的数据资源。
10/20/2025 4:21:26 PM
AI在线