AI在线 AI在线

资讯列表

X-SAM:从「分割一切」到「任意分割」:统一图像分割多模态大模型,在20+个图像分割数据集上均达SoTA

本研究由中山大学、鹏城实验室、美团联合完成,第一作者王豪为中山大学博士研究生,主要研究方向为图像和视频分割、开放场景视觉感知、多模态大模型等。 论文共同通讯作者为梁小丹教授和蓝湘源副研究员。 背景与动机Segment Anything Model (SAM) 作为基础分割模型在密集分割掩码生成方面表现卓越,但其依赖视觉提示的单一输入模式限制了在广泛图像分割任务中的适用性。
8/19/2025 2:49:00 PM
机器之心

超越RAG和DAPT!华人团队:一个小解码器让所有模型当上领域专家

一个小解码器让所有模型当上领域专家! 华人团队新研究正在引起热议。 他们提出了一种比目前业界主流采用的DAPT(领域自适应预训练)和RAG(检索增强生成)更方便、且成本更低的方法。
8/19/2025 2:44:06 PM
一水

Model YL 34万直接开卖!四驱且续航751公里,还3年0息

刚刚,Model Y加长版33.9万元开卖。 空间、舒适性、娱乐性、驾乘等全面升级,而且上市即发布了3年0息方案,首付还不到10万元。 目前这款车型是中国特供,成为特斯拉在华重获增长的关键希望。
8/19/2025 1:21:37 PM
一凡

阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)好家活! 千问这是要干嘛,简直要踢了GPT-5的馆子了! 就在刚刚,小编发现,千问官方X账号“Qwen”宣布:Qwen图像编辑功能重磅上线了!
8/19/2025 12:00:26 PM
云昭

嚯!刚刚,张麻子陪我玩黑猴了

您猜怎么着? 咱也是和张麻子一起玩上《黑神话》了(doge)。 没错,就是内“让子弹飞一会儿”的麻匪头子。
8/19/2025 11:52:29 AM
量子位的朋友们

突破Claude-4编程上限!自进化Agent框架拿下新SOTA,底模越好性能越高,已开源

突破多步推理瓶颈,让Claude-3.7-Sonnet解题成功率暴增20.6%。 在SWE-Bench Verified上刷新开源框架SOTA! 中科院、清华大学、阶跃星辰等提出SE-Agent,一个创新的自进化(Self-Evolution)框架。
8/19/2025 11:26:46 AM

开源版Genie 3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品

国产开源版 Genie 3 问世,昆仑万维用 1.8B 模型跑出了神级效果。 世界模型,正在迎来一次技术大突破。 本月初,Google DeepMind 发布的 Genie 3,因为效果惊艳,关注度直接超越了 OpenAI 同日发布的 GPT-5。
8/19/2025 11:18:00 AM
机器之心

图生视频新玩法刷爆外网:图上画两笔就能动起来,终于告别文本提示

现在,AI看你画的就能懂。 Higgsfield AI 这家公司,有点意思。 不仅三天两头上线新功能,在 X 上疯狂刷存在感,还一度被传出和 Meta 洽谈收购事宜,虽然最后不了了之。
8/19/2025 11:09:00 AM
机器之心

妙笔生维:线稿驱动的三维场景视频自由编辑

刘锋林,中科院计算所泛在计算系统研究中心博士研究生(导师:高林研究员),研究方向为计算机图形学与生成式人工智能,在ACM SIGGRAPH\TOG,IEEE TPAMI,IEEE TVCG,IEEE CVPR等期刊会议上发表论文10余篇,其中5篇为第一作者发表于SIGGRAPH和CVPR,4篇论文收录于中科院一区期刊ACM Transaction on Graphics,第一作者研究工作连续两年入选SIGGRAPH亮点工作宣传片(Video Trailer)。 曾获得国家奖学金、中国计算机学会CAD&CG凌迪图形学奖学金等荣誉。 随着移动摄影设备的普及,基于手机或相机等可以快速获取带有丰富视角变换的三维场景视频。
8/19/2025 11:05:00 AM
机器之心

告别人工写脚本!多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

作者简介Jessi Peng,携程资深后端开发工程师,关注AI技术在测试领域的应用。 一、引言    在传统的UI自动化测试流程中,测试人员需要构建完整的开发环境,包括Python运行环境、PyCharm集成开发环境、自动化测试框架等工具链的配置与部署。 在用例编写过程中,测试人员必须通过人工方式精确定位目标UI元素,并基于自动化框架封装的底层方法,手工编写测试代码。
8/19/2025 10:47:17 AM
Jessi Peng

AI驱动电子表格平台Paradigm获500万美元种子轮融资 配备5000个AI智能体

在"AI智能体"这个概念还未兴起的时候,安娜·摩纳哥就已经开始构建AI智能体产品。 在开发了众多聊天机器人后,她开始寻找适合AI智能体的其他交互界面,最终将目光锁定在电子表格上。 摩纳哥向TechCrunch表示:"我有一个个人使用习惯,也注意到很多其他人都有这样的习惯,就是将非常重要的CRM数据放在电子表格中,因为这是最灵活的工具。
8/19/2025 10:47:00 AM
AI在线

Perplexity进军印度市场!AI搜索巨头新增印度股票财报电话会议实时转录功能

AI搜索初创公司Perplexity正在强化其金融仪表板功能,新增了印度上市公司季度财报电话会议的实时转录服务,同时提供财报后会议的日程安排功能。 这一升级进一步丰富了Perplexity金融仪表板的功能体系。 该平台除了提供市场新闻资讯外,还展示市场摘要、股票交易所图表和表现最佳的股票信息。
8/19/2025 10:47:00 AM
AI在线

ARM 挖角亚马逊高管,推进自研芯片计划

根据路透社的最新报道,芯片架构授权公司 ARM 最近成功引进了亚马逊 AI 芯片主管拉米・辛诺(Rami Sinno),此举旨在加速公司自研完整芯片的进程。 辛诺在亚马逊曾负责开发名为 “Trainium” 和 “Inferentia” 的 AI 芯片,这些芯片专为支持大型 AI 应用程序而设计。 图源备注:图片由AI生成,图片授权服务商MidjourneyARM 的目标是从一个单纯提供芯片知识产权的供应商,转型为能够独立设计和生产完整芯片的企业。
8/19/2025 10:46:50 AM
AI在线

小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合

小红书AIGC团队近日正式发布了名为DynamicFace的可控人脸生成技术。 据官方介绍,这项技术专门针对图像和视频领域的人脸融合任务进行优化,能够实现高质量与高度一致性的人脸置换效果。 DynamicFace技术的推出标志着小红书在AI内容生成领域的重要技术突破。
8/19/2025 10:46:50 AM
AI在线

Meta内部文件曝光:AI被允许与未成年人"性感对话"引发轩然大波

随着人工智能竞赛的白热化,Meta首席执行官马克·扎克伯格正采取激进策略以保持竞争优势,但最新曝光的内部政策文件却引发了严重的道德和安全担忧。 路透社记者杰夫·霍洛维茨近日披露的一份超过200页的内部文件显示,Meta对其AI聊天机器人制定了令人震惊的行为准则。 这份已获得Meta法律、工程和公共政策团队批准的政策文件,清晰展现了这家科技巨头希望向世界推出的AI系统类型。
8/19/2025 10:46:45 AM
AI在线

Grammarly推出全新文档界面集成AI助手,既能帮写作又能检测AI生成内容

知名写作助手平台Grammarly推出了基于去年收购的生产力初创公司Coda技术构建的全新文档界面。 这一界面不仅配备了AI助手,还为学生和专业人士提供了多款AI工具,包括AI评分器、校对工具和引用查找器。 新界面采用了模块优先的设计理念,用户可以插入表格、列、分隔符、列表和标题等元素。
8/19/2025 10:46:45 AM
AI在线

​德克萨斯州检察官调查 Meta 和 Character.ai 的儿童心理健康 AI 聊天机器人

近日,德克萨斯州检察官肯・帕克斯顿(Ken Paxton)对 Meta 公司和人工智能初创企业 Character.ai 展开了调查,重点关注这些公司是否在推广其人工智能聊天机器人时存在误导行为,特别是涉及向儿童提供心理健康支持。 检察官办公室表示,他们已针对 Meta 的 AI 工作室和 Character.ai 的聊天机器人展开调查,指控这两家公司可能存在 “欺骗性商业行为”。 他们认为这些聊天机器人被宣传为 “专业治疗工具”,而实际上并没有合法的医疗资质或监督。
8/19/2025 10:46:45 AM
AI在线

阿里亮剑Ovis2.5:90亿参数挑战巨兽,AI视觉从此不“近视”

在AI界,“参数为王”的信仰似乎坚不可摧,巨头们在千亿、万亿参数的军备竞赛中一路狂奔。 然而,阿里国际数字贸易集团(AIDC)最近却悄然扔出了一枚“深水炸弹”——Ovis2.5。 它没有夸张的参数规模,却用一种近乎“降维打击”的方式,重新定义了什么叫“经济型高性能”。
8/19/2025 10:37:59 AM
墨风如雪