资讯列表
GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网
刚刚,OpenAI又离职一名华人大佬。 前OpenAI研究员Kevin Lu宣布加入AI新创Thinking Machines Lab。 Kevin Lu主导了GPT-4o mini的发布,并参与o*-mini、o3等模型工作。
8/19/2025 3:58:59 PM
凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”
henry 发自 凹非寺. 量子位 | 公众号 QbitAI用提示词就能点对点编辑图片? Qwen:没错,正是在下。
8/19/2025 3:56:06 PM
henry
MCP堆工具是大坑!开发者大佬:命令行的‘脆’让AI崩惨了!不如砍成一个代码执行器:7轮调用秒变1轮!网友:早该放弃黑箱工具了!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)你的 MCP,可能真用错了? MCP 常被视作大模型的“USB 接口”。 不少开发者第一反应就是:往里堆更多专用工具(grep、sed、tmux……),好像这样就能让 AI 更强大。
8/19/2025 3:19:56 PM
伊风
7年了,OpenAI官方给出五代GPT对比,网友却怀念起「狂野」初代
从2018年至今,GPT系列模型已经来到第五代,如果让你回忆第一次使用GPT-1时的感受,可能是一种新奇却略显笨拙的震撼,就像这样:当你问 GPT-1:麻醉状态下,你真的有意识吗? 它的回答很生硬,甚至有些胡言乱语:我没有。 你醒了。
8/19/2025 2:55:00 PM
机器之心
X-SAM:从「分割一切」到「任意分割」:统一图像分割多模态大模型,在20+个图像分割数据集上均达SoTA
本研究由中山大学、鹏城实验室、美团联合完成,第一作者王豪为中山大学博士研究生,主要研究方向为图像和视频分割、开放场景视觉感知、多模态大模型等。 论文共同通讯作者为梁小丹教授和蓝湘源副研究员。 背景与动机Segment Anything Model (SAM) 作为基础分割模型在密集分割掩码生成方面表现卓越,但其依赖视觉提示的单一输入模式限制了在广泛图像分割任务中的适用性。
8/19/2025 2:49:00 PM
机器之心
超越RAG和DAPT!华人团队:一个小解码器让所有模型当上领域专家
一个小解码器让所有模型当上领域专家! 华人团队新研究正在引起热议。 他们提出了一种比目前业界主流采用的DAPT(领域自适应预训练)和RAG(检索增强生成)更方便、且成本更低的方法。
8/19/2025 2:44:06 PM
一水
Model YL 34万直接开卖!四驱且续航751公里,还3年0息
刚刚,Model Y加长版33.9万元开卖。 空间、舒适性、娱乐性、驾乘等全面升级,而且上市即发布了3年0息方案,首付还不到10万元。 目前这款车型是中国特供,成为特斯拉在华重获增长的关键希望。
8/19/2025 1:21:37 PM
一凡
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)好家活! 千问这是要干嘛,简直要踢了GPT-5的馆子了! 就在刚刚,小编发现,千问官方X账号“Qwen”宣布:Qwen图像编辑功能重磅上线了!
8/19/2025 12:00:26 PM
云昭
突破Claude-4编程上限!自进化Agent框架拿下新SOTA,底模越好性能越高,已开源
突破多步推理瓶颈,让Claude-3.7-Sonnet解题成功率暴增20.6%。 在SWE-Bench Verified上刷新开源框架SOTA! 中科院、清华大学、阶跃星辰等提出SE-Agent,一个创新的自进化(Self-Evolution)框架。
8/19/2025 11:26:46 AM
开源版Genie 3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
国产开源版 Genie 3 问世,昆仑万维用 1.8B 模型跑出了神级效果。 世界模型,正在迎来一次技术大突破。 本月初,Google DeepMind 发布的 Genie 3,因为效果惊艳,关注度直接超越了 OpenAI 同日发布的 GPT-5。
8/19/2025 11:18:00 AM
机器之心
图生视频新玩法刷爆外网:图上画两笔就能动起来,终于告别文本提示
现在,AI看你画的就能懂。 Higgsfield AI 这家公司,有点意思。 不仅三天两头上线新功能,在 X 上疯狂刷存在感,还一度被传出和 Meta 洽谈收购事宜,虽然最后不了了之。
8/19/2025 11:09:00 AM
机器之心
妙笔生维:线稿驱动的三维场景视频自由编辑
刘锋林,中科院计算所泛在计算系统研究中心博士研究生(导师:高林研究员),研究方向为计算机图形学与生成式人工智能,在ACM SIGGRAPH\TOG,IEEE TPAMI,IEEE TVCG,IEEE CVPR等期刊会议上发表论文10余篇,其中5篇为第一作者发表于SIGGRAPH和CVPR,4篇论文收录于中科院一区期刊ACM Transaction on Graphics,第一作者研究工作连续两年入选SIGGRAPH亮点工作宣传片(Video Trailer)。 曾获得国家奖学金、中国计算机学会CAD&CG凌迪图形学奖学金等荣誉。 随着移动摄影设备的普及,基于手机或相机等可以快速获取带有丰富视角变换的三维场景视频。
8/19/2025 11:05:00 AM
机器之心
告别人工写脚本!多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段
作者简介Jessi Peng,携程资深后端开发工程师,关注AI技术在测试领域的应用。 一、引言 在传统的UI自动化测试流程中,测试人员需要构建完整的开发环境,包括Python运行环境、PyCharm集成开发环境、自动化测试框架等工具链的配置与部署。 在用例编写过程中,测试人员必须通过人工方式精确定位目标UI元素,并基于自动化框架封装的底层方法,手工编写测试代码。
8/19/2025 10:47:17 AM
Jessi Peng
AI驱动电子表格平台Paradigm获500万美元种子轮融资 配备5000个AI智能体
在"AI智能体"这个概念还未兴起的时候,安娜·摩纳哥就已经开始构建AI智能体产品。 在开发了众多聊天机器人后,她开始寻找适合AI智能体的其他交互界面,最终将目光锁定在电子表格上。 摩纳哥向TechCrunch表示:"我有一个个人使用习惯,也注意到很多其他人都有这样的习惯,就是将非常重要的CRM数据放在电子表格中,因为这是最灵活的工具。
8/19/2025 10:47:00 AM
AI在线
Perplexity进军印度市场!AI搜索巨头新增印度股票财报电话会议实时转录功能
AI搜索初创公司Perplexity正在强化其金融仪表板功能,新增了印度上市公司季度财报电话会议的实时转录服务,同时提供财报后会议的日程安排功能。 这一升级进一步丰富了Perplexity金融仪表板的功能体系。 该平台除了提供市场新闻资讯外,还展示市场摘要、股票交易所图表和表现最佳的股票信息。
8/19/2025 10:47:00 AM
AI在线
ARM 挖角亚马逊高管,推进自研芯片计划
根据路透社的最新报道,芯片架构授权公司 ARM 最近成功引进了亚马逊 AI 芯片主管拉米・辛诺(Rami Sinno),此举旨在加速公司自研完整芯片的进程。 辛诺在亚马逊曾负责开发名为 “Trainium” 和 “Inferentia” 的 AI 芯片,这些芯片专为支持大型 AI 应用程序而设计。 图源备注:图片由AI生成,图片授权服务商MidjourneyARM 的目标是从一个单纯提供芯片知识产权的供应商,转型为能够独立设计和生产完整芯片的企业。
8/19/2025 10:46:50 AM
AI在线
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
小红书AIGC团队近日正式发布了名为DynamicFace的可控人脸生成技术。 据官方介绍,这项技术专门针对图像和视频领域的人脸融合任务进行优化,能够实现高质量与高度一致性的人脸置换效果。 DynamicFace技术的推出标志着小红书在AI内容生成领域的重要技术突破。
8/19/2025 10:46:50 AM
AI在线