AI在线 - 阅读最新头条AI资讯文章，掌握AI人工智能科技动态

头条

重磅!谷歌开源Gemma3n多模态模型，手机也能跑出云端AI性能

谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n，这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本，虽然原始参数量分别为5B和8B，但通过架构创新，其内存占用仅相当于传统2B和4B模型，分别只需2GB和3GB内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理，支持140种文本语言和35种语言的多模态理解。

6/27/2025 11:00:52 AM

AI在线

一键生成爆款视频！HeyGen AI视频Agent席卷内容创作界！

近日，AI视频生成领域的领军企业HeyGen推出了一款革命性的AI视频Agent，为视频内容创作带来了全新突破。据AIbase了解，这款AI视频Agent能够通过简单的素材上传，自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程，让用户在几分钟内即可获得可直接发布的专业级视频内容。这一创新功能不仅大幅降低了视频创作门槛，还为广告、短视频、产品演示等场景提供了高效解决方案。

6/27/2025 11:00:52 AM

AI在线

YouTube 在搜索结果中添加AI摘要，测试对话式AI工具扩展

近日，YouTube 宣布将推出两项新的人工智能（AI）功能，旨在提升用户的观看体验。其中一项功能类似于 AI 概览，将出现在搜索结果中，而另一项则是对话式 AI 工具的扩展访问。这些新功能的推出，将为用户提供更加智能化的内容搜索和互动方式。

6/27/2025 11:00:52 AM

AI在线

第一次用Cursor？四步骤快速安装＋五大功能界面说明

Cursor 是一款长得像Visual Studio Code实际上也确实是在人家基础上二次开、塞进AI 功能的程序编辑器，让写整个开发流程都能靠AI 一路加速。使用Cursor 可以一键导入原本你在VsCode中已经设置过的主题、快捷键、extensions，不用再重新设置；它也整合了像 GPT 和Claude等顶尖AI 模型，能依上下文生成整段功能代码。写程序写到一半遇到bug，只要把错误讯息丢给Cursor，AI 就会协助分析、提供建议，甚至重构程序代码、帮你优化结构，让整体更好维护。

6/27/2025 10:11:35 AM

Kevin Yan11

突破通用领域推理的瓶颈！清华NLP实验室强化学习新研究RLPR

余天予，清华大学计算机系一年级博士生，导师为清华大学自然语言处理实验室刘知远副教授。研究兴趣主要包括高效多模态大模型、多模态大模型对齐和强化学习，在 CVPR、AAAI等人工智能领域的著名国际会议和期刊发表多篇学术论文，谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR（Reinforcement Learning with Verifiable Reward，基于可验证奖励的强化学习）的巨大潜力。

6/27/2025 10:10:43 AM

谷歌开源Gemma 3n：2G内存就能跑，100亿参数内最强多模态模型

端侧设备迎来了新架构的 AI 模型。本周五凌晨，谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。模型、权重：：：，Gemma 3n 代表了设备端 AI 的重大进步，它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能，其性能去年还只能在云端先进模型上才能体验。

6/27/2025 10:08:19 AM

91岁零基础！硬核爷爷用AI两天爆肝应用，350美元玩转氛围编程

一位91岁老人用Claude和Replit编写了一个复杂的教会活动管理系统！退休电气工程师John Blackman分享了他如何用Claude和Replit构建应用程序。 John从没碰过代码，但在孙子推荐下，只花两天就搞定了这个教会志愿者管理系统。

6/27/2025 10:04:31 AM

标谷歌推出 Doppl 应用，让你轻松体验虚拟试衣

近日，谷歌正式推出了一款名为 Doppl 的 AI 试衣应用，旨在为用户提供一种全新的虚拟试穿体验。通过这款应用，用户只需上传一张全身照片，就可以选择自己喜欢的服装进行试穿，无论这些服装来自旧货店、朋友的穿搭，还是社交媒体上的图片，都能轻松实现。 Doppl 的操作流程非常简单。

6/27/2025 10:00:52 AM

AI在线

扎克伯格亲自出马!Meta重金挖角OpenAI三大AI顶尖专家

Meta成功从OpenAI挖走三位顶级人工智能研究员:卢卡斯·贝耶尔（Lucas Beyer）、亚历山大·科列斯尼科夫(Alexander Kolesnikov)和翟晓华，引发业界广泛关注。这三位研究员在机器学习和计算机视觉领域享有盛誉，以开发可扩展图像模型和视觉转换器（ViT）架构的突破性工作而闻名。值得注意的是，他们此前曾在Google DeepMind工作，并于2024年底刚刚参与在苏黎世开设OpenAI办事处。

6/27/2025 10:00:52 AM

AI在线

Gemini 将取代 Google 助手，Android 用户迎来新体验

近日，Google 宣布即将推出的 Gemini 功能将会在 Android 设备上取代 Google 助手。根据 Android Police 获得的一封内部电子邮件，Gemini 的更新将在7月7日开始推送。这项更新将允许用户在关闭 Gemini 应用时，仍然可以通过该 AI 助手来控制手机的电话、信息、WhatsApp 等应用。

6/27/2025 10:00:51 AM

AI在线

Gemini 即将取代 Google 助手，隐私保护新模式来袭！

Google 近期宣布，将在7月7日推出一项重大更新，让其全新的 AI 助手 Gemini 成为用户手机的智能助理。这一更新允许 Gemini 在用户的手机上执行多项任务，比如拨打电话、发送信息、使用 WhatsApp 等，且无需开启 Gemini 应用。听起来是不是很方便?不过，随着这一变化，许多用户对隐私问题表示担忧。

6/27/2025 10:00:51 AM

AI在线

杀疯了，这个 AI+Python 智能体救了看门老大爷！

最近AiPy很火，我用了有一段时间了，感觉严重影响睡眠，感觉这东西容易上瘾，今天推荐给大家。 AiPy它是基于AI Python，官方的说法是他们给大模型装上了手脚，也就是说，用大白话就能自动操作电脑、控制手机、甚至连家里的智能灯泡也能控制，听起来有点逆天。然后AiPy是个开源项目，有命令行版和客户端。

6/27/2025 9:29:45 AM

老朱2000

超过GPT-image-1！大黑马Black Forest刚开源新模型，只用文本实现一键PS

今天凌晨，知名开源平台Black Forest开源了，文生图模型FLUX.1-Kontext的开发者版本。该版本主要专注于图像编辑任务，支持迭代编辑，在各种场景和环境中都能出色地保留角色特征，还允许进行精确的局部和全局编辑，例如，用户想给一个人脸加上胡子或者更改衣服穿着、场景，FLUX.1-Kontext都能轻松实现。简单来说，FLUX.1-Kontext开发版的主要功能可以像PS一样，让用户通过自然语言就能实现一键P图。

6/27/2025 9:26:50 AM

五款大模型考「山东卷」，Gemini、豆包分别获文理第一名

果然，高考已经快被 AI 攻克了。近日，5 款大模型参加了今年山东高考，按照传统的文理分科方式统计：豆包 Seed 1.6-Thinking 模型以 683 分的成绩拿下文科第一，Gemini 2.5 Pro 则凭借 655 分拔得理科头筹。测评来自字节跳动 Seed 团队。

6/27/2025 9:24:04 AM

机器之心

3D VLA新范式！CVPR冠军方案BridgeVLA，真机性能提升32%

近年来，视觉-语言-动作（VLA）模型在机器人操作任务中大放异彩，成为推动通用机器人操作的重要引擎。但现有的VLA模型，大多只以2D信息作为输入，且需要大量的机器人数据进行微调；反观以PerAct，RVT-2为代表的3D操作策略，通常仅需要10条轨迹就能够取得不错的效果，因此，一个很自然的想法是，是否能将现有的2D VLA升级为3D VLA，使其同时兼具2D VLA的效果以及3D操作策略的效率？中科院自动化所的研究人员提出的BridgeVLA给出了肯定的回答！

6/27/2025 9:10:17 AM

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

Black Forest Labs正式宣布，其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源，引发了AI社区的广泛关注。这一模型作为FLUX.1系列的最新成员，以其强大的图像编辑能力和高效性能被誉为可媲美GPT-4o的开源替代方案。 FLUX.1Kontext [dev] 基于12亿参数的流匹配变换器架构，专为图像编辑任务设计，支持消费级硬件运行，为创作者、开发者和研究人员提供了前所未有的灵活性。

6/27/2025 9:00:42 AM

AI在线

Meta 挖角 OpenAI 顶级研究员，AI 超级智能团队再添猛将

在 AI 领域的竞争日益激烈之际，Meta 公司于今天凌晨宣布，成功挖角 OpenAI 的顶级研究员 Trapit Bansal，加入其新成立的 AI 超级智能部门。根据 Techcrunch 的消息，OpenAI 的发言人 Kayla Wood 证实了 Bansal 的离职，Bansal 的 LinkedIn 页面也显示他已不再是 OpenAI 的员工。图源备注：图片由AI生成，图片授权服务商MidjourneyTrapit Bansal 自2022年起在 OpenAI 工作，他被认为是该公司强化学习的重要推动者之一，同时也是 OpenAI 首个 AI 推理模型 o1的基础贡献者。

6/27/2025 9:00:41 AM

AI在线

开源神器来了！FLUX.1 Kontext [dev]挑战GPT-4o，图像编辑进入新时代

近日，Black Forest Labs宣布正式开源其最新图像编辑模型FLUX.1Kontext [dev]，这一拥有120亿参数的AI模型被誉为对标OpenAI GPT-4o和Google Gemini的强力竞争者。据AIbase了解，该模型专为图像编辑任务设计，兼具高性能与易用性，不仅能在消费级硬件上高效运行，还为用户提供了前所未有的图像编辑体验。多场景精准编辑，角色一致性无与伦比FLUX.1Kontext [dev]以其强大的迭代编辑、角色保持以及局部与全局精细控制能力脱颖而出。

6/27/2025 9:00:41 AM

AI在线

资讯热榜

前 xAI 首席财务官加盟 OpenAI，担任新任业务财务官腾讯混元开源AI绘画新框架：24维度对齐人类意图，让AI读懂复杂指令谷歌 AI 承包商裁员风波：200 多名员工因工作条件争议被解雇美国 FTC 调查 AI 聊天机器人对未成年人影响引发广泛关注可灵2.1首尾帧外挂级教程！两张图秒变大片，附万能提示词！五年沉寂后高调回归，OpenAI重组机器人团队剑指“通用机器人” OpenAI Evals 新增原生音频评估功能，简化语音模型测试新世界首富：斥巨资求永生，TikTok收购案最可能买家，得OpenAI千亿订单

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术 AI新词马斯克图像智能体 Gemini AI创作 Anthropic 英伟达论文训练代码 LLM 算法 Stable Diffusion 芯片腾讯苹果蛋白质 Claude AI for Science 开发者 Agent 生成式神经网络机器学习 xAI 3D 研究人形机器人生成 AI视频百度工具计算 GPU 华为大语言模型 Sora RAG 具身智能 AI设计字节跳动搜索大型语言模型场景 AGI 深度学习视频生成预测视觉伟达架构 Transformer DeepMind 编程神器推荐亚马逊特斯拉 AI模型

重磅!谷歌开源Gemma3n多模态模型，手机也能跑出云端AI性能

一键生成爆款视频！HeyGen AI视频Agent席卷内容创作界！

YouTube 在搜索结果中添加AI摘要，测试对话式AI工具扩展

第一次用Cursor？四步骤快速安装＋五大功能界面说明

突破通用领域推理的瓶颈！清华NLP实验室强化学习新研究RLPR

谷歌开源Gemma 3n：2G内存就能跑，100亿参数内最强多模态模型

91岁零基础！硬核爷爷用AI两天爆肝应用，350美元玩转氛围编程

标谷歌推出 Doppl 应用，让你轻松体验虚拟试衣

扎克伯格亲自出马!Meta重金挖角OpenAI三大AI顶尖专家

​Gemini 将取代 Google 助手，Android 用户迎来新体验

Gemini 即将取代 Google 助手，隐私保护新模式来袭！

杀疯了，这个 AI+Python 智能体救了看门老大爷！

超过GPT-image-1！大黑马Black Forest刚开源新模型，只用文本实现一键PS

五款大模型考「山东卷」，Gemini、豆包分别获文理第一名

3D VLA新范式！CVPR冠军方案BridgeVLA，真机性能提升32%

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

​Meta 挖角 OpenAI 顶级研究员，AI 超级智能团队再添猛将

开源神器来了！FLUX.1 Kontext [dev]挑战GPT-4o，图像编辑进入新时代

Gemini 将取代 Google 助手，Android 用户迎来新体验

Meta 挖角 OpenAI 顶级研究员，AI 超级智能团队再添猛将