资讯列表
谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型
端侧设备迎来了新架构的 AI 模型。 本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。 模型、权重:::,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。
6/27/2025 10:08:19 AM
91岁零基础!硬核爷爷用AI两天爆肝应用,350美元玩转氛围编程
一位91岁老人用Claude和Replit编写了一个复杂的教会活动管理系统! 退休电气工程师John Blackman分享了他如何用Claude和Replit构建应用程序。 John从没碰过代码,但在孙子推荐下,只花两天就搞定了这个教会志愿者管理系统。
6/27/2025 10:04:31 AM
标谷歌推出 Doppl 应用,让你轻松体验虚拟试衣
近日,谷歌正式推出了一款名为 Doppl 的 AI 试衣应用,旨在为用户提供一种全新的虚拟试穿体验。 通过这款应用,用户只需上传一张全身照片,就可以选择自己喜欢的服装进行试穿,无论这些服装来自旧货店、朋友的穿搭,还是社交媒体上的图片,都能轻松实现。 Doppl 的操作流程非常简单。
6/27/2025 10:00:52 AM
AI在线
扎克伯格亲自出马!Meta重金挖角OpenAI三大AI顶尖专家
Meta成功从OpenAI挖走三位顶级人工智能研究员:卢卡斯·贝耶尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)和翟晓华,引发业界广泛关注。 这三位研究员在机器学习和计算机视觉领域享有盛誉,以开发可扩展图像模型和视觉转换器(ViT)架构的突破性工作而闻名。 值得注意的是,他们此前曾在Google DeepMind工作,并于2024年底刚刚参与在苏黎世开设OpenAI办事处。
6/27/2025 10:00:52 AM
AI在线
Gemini 将取代 Google 助手,Android 用户迎来新体验
近日,Google 宣布即将推出的 Gemini 功能将会在 Android 设备上取代 Google 助手。 根据 Android Police 获得的一封内部电子邮件,Gemini 的更新将在7月7日开始推送。 这项更新将允许用户在关闭 Gemini 应用时,仍然可以通过该 AI 助手来控制手机的电话、信息、WhatsApp 等应用。
6/27/2025 10:00:51 AM
AI在线
Gemini 即将取代 Google 助手,隐私保护新模式来袭!
Google 近期宣布,将在7月7日推出一项重大更新,让其全新的 AI 助手 Gemini 成为用户手机的智能助理。 这一更新允许 Gemini 在用户的手机上执行多项任务,比如拨打电话、发送信息、使用 WhatsApp 等,且无需开启 Gemini 应用。 听起来是不是很方便?不过,随着这一变化,许多用户对隐私问题表示担忧。
6/27/2025 10:00:51 AM
AI在线
杀疯了,这个 AI+Python 智能体救了看门老大爷!
最近AiPy很火,我用了有一段时间了,感觉严重影响睡眠,感觉这东西容易上瘾,今天推荐给大家。 AiPy它是基于AI Python,官方的说法是他们给大模型装上了手脚,也就是说,用大白话就能自动操作电脑、控制手机、甚至连家里的智能灯泡也能控制,听起来有点逆天。 然后AiPy是个开源项目,有命令行版和客户端。
6/27/2025 9:29:45 AM
老朱2000
超过GPT-image-1!大黑马Black Forest刚开源新模型,只用文本实现一键PS
今天凌晨,知名开源平台Black Forest开源了,文生图模型FLUX.1-Kontext的开发者版本。 该版本主要专注于图像编辑任务,支持迭代编辑,在各种场景和环境中都能出色地保留角色特征,还允许进行精确的局部和全局编辑,例如,用户想给一个人脸加上胡子或者更改衣服穿着、场景,FLUX.1-Kontext都能轻松实现。 简单来说,FLUX.1-Kontext开发版的主要功能可以像PS一样,让用户通过自然语言就能实现一键P图。
6/27/2025 9:26:50 AM
五款大模型考「山东卷」,Gemini、豆包分别获文理第一名
果然,高考已经快被 AI 攻克了。 近日,5 款大模型参加了今年山东高考,按照传统的文理分科方式统计:豆包 Seed 1.6-Thinking 模型以 683 分的成绩拿下文科第一,Gemini 2.5 Pro 则凭借 655 分拔得理科头筹。 测评来自字节跳动 Seed 团队。
6/27/2025 9:24:04 AM
机器之心
3D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32%
近年来,视觉-语言-动作(VLA)模型在机器人操作任务中大放异彩,成为推动通用机器人操作的重要引擎。 但现有的VLA模型,大多只以2D信息作为输入,且需要大量的机器人数据进行微调;反观以PerAct,RVT-2为代表的3D操作策略,通常仅需要10条轨迹就能够取得不错的效果,因此,一个很自然的想法是,是否能将现有的2D VLA升级为3D VLA,使其同时兼具2D VLA的效果以及3D操作策略的效率? 中科院自动化所的研究人员提出的BridgeVLA给出了肯定的回答!
6/27/2025 9:10:17 AM
Black Forest震撼开源FLUX.1 Kontext [dev]:媲美GPT-4o的图像编辑
Black Forest Labs正式宣布,其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源,引发了AI社区的广泛关注。 这一模型作为FLUX.1系列的最新成员,以其强大的图像编辑能力和高效性能被誉为可媲美GPT-4o的开源替代方案。 FLUX.1Kontext [dev] 基于12亿参数的流匹配变换器架构,专为图像编辑任务设计,支持消费级硬件运行,为创作者、开发者和研究人员提供了前所未有的灵活性。
6/27/2025 9:00:42 AM
AI在线
Meta 挖角 OpenAI 顶级研究员,AI 超级智能团队再添猛将
在 AI 领域的竞争日益激烈之际,Meta 公司于今天凌晨宣布,成功挖角 OpenAI 的顶级研究员 Trapit Bansal,加入其新成立的 AI 超级智能部门。 根据 Techcrunch 的消息,OpenAI 的发言人 Kayla Wood 证实了 Bansal 的离职,Bansal 的 LinkedIn 页面也显示他已不再是 OpenAI 的员工。 图源备注:图片由AI生成,图片授权服务商MidjourneyTrapit Bansal 自2022年起在 OpenAI 工作,他被认为是该公司强化学习的重要推动者之一,同时也是 OpenAI 首个 AI 推理模型 o1的基础贡献者。
6/27/2025 9:00:41 AM
AI在线
开源神器来了!FLUX.1 Kontext [dev]挑战GPT-4o,图像编辑进入新时代
近日,Black Forest Labs宣布正式开源其最新图像编辑模型FLUX.1Kontext [dev],这一拥有120亿参数的AI模型被誉为对标OpenAI GPT-4o和Google Gemini的强力竞争者。 据AIbase了解,该模型专为图像编辑任务设计,兼具高性能与易用性,不仅能在消费级硬件上高效运行,还为用户提供了前所未有的图像编辑体验。 多场景精准编辑,角色一致性无与伦比FLUX.1Kontext [dev]以其强大的迭代编辑、角色保持以及局部与全局精细控制能力脱颖而出。
6/27/2025 9:00:41 AM
AI在线
谷歌AlphaGenome横空出世!40亿年生命代码一键破解,或再夺诺奖
基因组,宛如生命的蓝图,藏在我们每一个细胞之中。 这套完整的DNA指令集,主导着生命体从外观功能到生长繁殖的几乎每一个方面,甚至是对疾病抵御的能力。 2003年,人类基因组测序完成,让人类首次窥见了DNA的全貌。
6/27/2025 8:56:51 AM
人民大学&字节Seed:利用μP实现Diffusion Transformers高效扩展
本文由中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队共同完成。 第一作者郑晨宇是中国人民大学高瓴人工智能学院二年级博士生,主要研究方向为基础模型的优化、泛化和可扩展性理论,导师为李崇轩副教授,论文为其在字节跳动Seed实习期间完成。 第二作者张新雨是字节跳动研究员,主要研究方向为视觉生成模型。
6/27/2025 8:50:40 AM
北大发布学术搜索评测ScholarSearch:难倒一众DeepResearch的“开卷考试”
LLMs能当科研助手了? 北大出考题,结果显示:现有模型都不能胜任。 北京大学DS-Lab发布ScholarSearch,这是首个专门用于评估大语言模型在学术研究中复杂信息检索能力的数据集,包含223道高难度的学术检索题目及其答案。
6/27/2025 8:47:12 AM
Nature报道:谷歌新模型1秒读懂DNA变异!首次统一基因组全任务,性能碾压现有模型
谷歌DeepMind Alpha家族又双叒登上Nature报道,这次瞄准的是DNA变异。 现在只需1秒,就能精确定位基因组序列变异。 据Nature最新报道,谷歌DeepMind团队目前推出了突破性生物模型AlphaGenome。
6/27/2025 8:45:31 AM
推理越多,幻觉越重?多模态推理模型的「幻觉悖论」
在多模态大模型的飞速发展中,R1 系列多模态推理模型凭借显式的长链推理机制,在复杂任务中屡屡突破传统「快思考」范式的性能瓶颈。 然而,研究发现,随着推理链条的加长,这类模型的视觉感知能力却呈现出明显下滑的趋势,逐渐转而依赖语言先验进行「脑补」,生成内容也越来越容易脱离图像本身,甚至出现凭空捏造的幻觉现象。 这一「推理增强—感知削弱」的悖论,凸显了当前多模态推理模型在推理能力与感知准确性之间面临的平衡挑战。
6/27/2025 8:40:00 AM