AI在线 AI在线

重磅!谷歌开源Gemma3n多模态模型,手机也能跑出云端AI性能

谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。 核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本,虽然原始参数量分别为5B和8B,但通过架构创新,其内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。 该模型原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。
6/27/2025 11:00:52 AM
AI在线

一键生成爆款视频!HeyGen AI视频Agent席卷内容创作界!

近日,AI视频生成领域的领军企业HeyGen推出了一款革命性的AI视频Agent,为视频内容创作带来了全新突破。 据AIbase了解,这款AI视频Agent能够通过简单的素材上传,自动完成从故事规划、脚本编写到镜头选择的整个视频制作流程,让用户在几分钟内即可获得可直接发布的专业级视频内容。 这一创新功能不仅大幅降低了视频创作门槛,还为广告、短视频、产品演示等场景提供了高效解决方案。
6/27/2025 11:00:52 AM
AI在线

YouTube 在搜索结果中添加AI摘要,测试对话式AI工具扩展

近日,YouTube 宣布将推出两项新的人工智能(AI)功能,旨在提升用户的观看体验。 其中一项功能类似于 AI 概览,将出现在搜索结果中,而另一项则是对话式 AI 工具的扩展访问。 这些新功能的推出,将为用户提供更加智能化的内容搜索和互动方式。
6/27/2025 11:00:52 AM
AI在线

第一次用Cursor?四步骤快速安装+五大功能界面说明

Cursor 是一款长得像Visual Studio Code实际上也确实是在人家基础上二次开、塞进AI 功能的程序编辑器,让写整个开发流程都能靠AI 一路加速。 使用Cursor 可以一键导入原本你在VsCode中已经设置过的主题、快捷键、extensions,不用再重新设置;它也整合了像 GPT 和Claude等顶尖AI 模型,能依上下文生成整段功能代码。 写程序写到一半遇到bug,只要把错误讯息丢给Cursor,AI 就会协助分析、提供建议,甚至重构程序代码、帮你优化结构,让整体更好维护。
6/27/2025 10:11:35 AM
Kevin Yan11

突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

余天予,清华大学计算机系一年级博士生,导师为清华大学自然语言处理实验室刘知远副教授。 研究兴趣主要包括高效多模态大模型、多模态大模型对齐和强化学习,在 CVPR、AAAI等人工智能领域的著名国际会议和期刊发表多篇学术论文,谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward,基于可验证奖励的强化学习)的巨大潜力。
6/27/2025 10:10:43 AM

谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型

端侧设备迎来了新架构的 AI 模型。 本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。 模型、权重:::,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。
6/27/2025 10:08:19 AM

91岁零基础!硬核爷爷用AI两天爆肝应用,350美元玩转氛围编程

一位91岁老人用Claude和Replit编写了一个复杂的教会活动管理系统! 退休电气工程师John Blackman分享了他如何用Claude和Replit构建应用程序。 John从没碰过代码,但在孙子推荐下,只花两天就搞定了这个教会志愿者管理系统。
6/27/2025 10:04:31 AM

标谷歌推出 Doppl 应用,让你轻松体验虚拟试衣

近日,谷歌正式推出了一款名为 Doppl 的 AI 试衣应用,旨在为用户提供一种全新的虚拟试穿体验。 通过这款应用,用户只需上传一张全身照片,就可以选择自己喜欢的服装进行试穿,无论这些服装来自旧货店、朋友的穿搭,还是社交媒体上的图片,都能轻松实现。 Doppl 的操作流程非常简单。
6/27/2025 10:00:52 AM
AI在线

扎克伯格亲自出马!Meta重金挖角OpenAI三大AI顶尖专家

Meta成功从OpenAI挖走三位顶级人工智能研究员:卢卡斯·贝耶尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)和翟晓华,引发业界广泛关注。 这三位研究员在机器学习和计算机视觉领域享有盛誉,以开发可扩展图像模型和视觉转换器(ViT)架构的突破性工作而闻名。 值得注意的是,他们此前曾在Google DeepMind工作,并于2024年底刚刚参与在苏黎世开设OpenAI办事处。
6/27/2025 10:00:52 AM
AI在线

​Gemini 将取代 Google 助手,Android 用户迎来新体验

近日,Google 宣布即将推出的 Gemini 功能将会在 Android 设备上取代 Google 助手。 根据 Android Police 获得的一封内部电子邮件,Gemini 的更新将在7月7日开始推送。 这项更新将允许用户在关闭 Gemini 应用时,仍然可以通过该 AI 助手来控制手机的电话、信息、WhatsApp 等应用。
6/27/2025 10:00:51 AM
AI在线

Gemini 即将取代 Google 助手,隐私保护新模式来袭!

Google 近期宣布,将在7月7日推出一项重大更新,让其全新的 AI 助手 Gemini 成为用户手机的智能助理。 这一更新允许 Gemini 在用户的手机上执行多项任务,比如拨打电话、发送信息、使用 WhatsApp 等,且无需开启 Gemini 应用。 听起来是不是很方便?不过,随着这一变化,许多用户对隐私问题表示担忧。
6/27/2025 10:00:51 AM
AI在线

杀疯了,这个 AI+Python 智能体救了看门老大爷!

最近AiPy很火,我用了有一段时间了,感觉严重影响睡眠,感觉这东西容易上瘾,今天推荐给大家。 AiPy它是基于AI Python,官方的说法是他们给大模型装上了手脚,也就是说,用大白话就能自动操作电脑、控制手机、甚至连家里的智能灯泡也能控制,听起来有点逆天。 然后AiPy是个开源项目,有命令行版和客户端。
6/27/2025 9:29:45 AM
老朱2000

超过GPT-image-1!大黑马Black Forest刚开源新模型,只用文本实现一键PS

今天凌晨,知名开源平台Black Forest开源了,文生图模型FLUX.1-Kontext的开发者版本。 该版本主要专注于图像编辑任务,支持迭代编辑,在各种场景和环境中都能出色地保留角色特征,还允许进行精确的局部和全局编辑,例如,用户想给一个人脸加上胡子或者更改衣服穿着、场景,FLUX.1-Kontext都能轻松实现。 简单来说,FLUX.1-Kontext开发版的主要功能可以像PS一样,让用户通过自然语言就能实现一键P图。
6/27/2025 9:26:50 AM

五款大模型考「山东卷」,Gemini、豆包分别获文理第一名

果然,高考已经快被 AI 攻克了。 近日,5 款大模型参加了今年山东高考,按照传统的文理分科方式统计:豆包 Seed 1.6-Thinking 模型以 683 分的成绩拿下文科第一,Gemini 2.5 Pro 则凭借 655 分拔得理科头筹。 测评来自字节跳动 Seed 团队。
6/27/2025 9:24:04 AM
机器之心

3D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32%

近年来,视觉-语言-动作(VLA)模型在机器人操作任务中大放异彩,成为推动通用机器人操作的重要引擎。 但现有的VLA模型,大多只以2D信息作为输入,且需要大量的机器人数据进行微调;反观以PerAct,RVT-2为代表的3D操作策略,通常仅需要10条轨迹就能够取得不错的效果,因此,一个很自然的想法是,是否能将现有的2D VLA升级为3D VLA,使其同时兼具2D VLA的效果以及3D操作策略的效率? 中科院自动化所的研究人员提出的BridgeVLA给出了肯定的回答!
6/27/2025 9:10:17 AM

Black Forest震撼开源FLUX.1 Kontext [dev]:媲美GPT-4o的图像编辑

Black Forest Labs正式宣布,其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源,引发了AI社区的广泛关注。 这一模型作为FLUX.1系列的最新成员,以其强大的图像编辑能力和高效性能被誉为可媲美GPT-4o的开源替代方案。 FLUX.1Kontext [dev] 基于12亿参数的流匹配变换器架构,专为图像编辑任务设计,支持消费级硬件运行,为创作者、开发者和研究人员提供了前所未有的灵活性。
6/27/2025 9:00:42 AM
AI在线

​Meta 挖角 OpenAI 顶级研究员,AI 超级智能团队再添猛将

在 AI 领域的竞争日益激烈之际,Meta 公司于今天凌晨宣布,成功挖角 OpenAI 的顶级研究员 Trapit Bansal,加入其新成立的 AI 超级智能部门。 根据 Techcrunch 的消息,OpenAI 的发言人 Kayla Wood 证实了 Bansal 的离职,Bansal 的 LinkedIn 页面也显示他已不再是 OpenAI 的员工。 图源备注:图片由AI生成,图片授权服务商MidjourneyTrapit Bansal 自2022年起在 OpenAI 工作,他被认为是该公司强化学习的重要推动者之一,同时也是 OpenAI 首个 AI 推理模型 o1的基础贡献者。
6/27/2025 9:00:41 AM
AI在线

开源神器来了!FLUX.1 Kontext [dev]挑战GPT-4o,图像编辑进入新时代

近日,Black Forest Labs宣布正式开源其最新图像编辑模型FLUX.1Kontext [dev],这一拥有120亿参数的AI模型被誉为对标OpenAI GPT-4o和Google Gemini的强力竞争者。 据AIbase了解,该模型专为图像编辑任务设计,兼具高性能与易用性,不仅能在消费级硬件上高效运行,还为用户提供了前所未有的图像编辑体验。 多场景精准编辑,角色一致性无与伦比FLUX.1Kontext [dev]以其强大的迭代编辑、角色保持以及局部与全局精细控制能力脱颖而出。
6/27/2025 9:00:41 AM
AI在线