AI在线 AI在线

AI

突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

余天予,清华大学计算机系一年级博士生,导师为清华大学自然语言处理实验室刘知远副教授。 研究兴趣主要包括高效多模态大模型、多模态大模型对齐和强化学习,在 CVPR、AAAI等人工智能领域的著名国际会议和期刊发表多篇学术论文,谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward,基于可验证奖励的强化学习)的巨大潜力。
6/27/2025 10:10:43 AM

谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型

端侧设备迎来了新架构的 AI 模型。 本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。 模型、权重:::,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。
6/27/2025 10:08:19 AM

91岁零基础!硬核爷爷用AI两天爆肝应用,350美元玩转氛围编程

一位91岁老人用Claude和Replit编写了一个复杂的教会活动管理系统! 退休电气工程师John Blackman分享了他如何用Claude和Replit构建应用程序。 John从没碰过代码,但在孙子推荐下,只花两天就搞定了这个教会志愿者管理系统。
6/27/2025 10:04:31 AM

超过GPT-image-1!大黑马Black Forest刚开源新模型,只用文本实现一键PS

今天凌晨,知名开源平台Black Forest开源了,文生图模型FLUX.1-Kontext的开发者版本。 该版本主要专注于图像编辑任务,支持迭代编辑,在各种场景和环境中都能出色地保留角色特征,还允许进行精确的局部和全局编辑,例如,用户想给一个人脸加上胡子或者更改衣服穿着、场景,FLUX.1-Kontext都能轻松实现。 简单来说,FLUX.1-Kontext开发版的主要功能可以像PS一样,让用户通过自然语言就能实现一键P图。
6/27/2025 9:26:50 AM

五款大模型考「山东卷」,Gemini、豆包分别获文理第一名

果然,高考已经快被 AI 攻克了。 近日,5 款大模型参加了今年山东高考,按照传统的文理分科方式统计:豆包 Seed 1.6-Thinking 模型以 683 分的成绩拿下文科第一,Gemini 2.5 Pro 则凭借 655 分拔得理科头筹。 测评来自字节跳动 Seed 团队。
6/27/2025 9:24:04 AM
机器之心

3D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32%

近年来,视觉-语言-动作(VLA)模型在机器人操作任务中大放异彩,成为推动通用机器人操作的重要引擎。 但现有的VLA模型,大多只以2D信息作为输入,且需要大量的机器人数据进行微调;反观以PerAct,RVT-2为代表的3D操作策略,通常仅需要10条轨迹就能够取得不错的效果,因此,一个很自然的想法是,是否能将现有的2D VLA升级为3D VLA,使其同时兼具2D VLA的效果以及3D操作策略的效率? 中科院自动化所的研究人员提出的BridgeVLA给出了肯定的回答!
6/27/2025 9:10:17 AM

人民大学&字节Seed:利用μP实现Diffusion Transformers高效扩展

本文由中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队共同完成。 第一作者郑晨宇是中国人民大学高瓴人工智能学院二年级博士生,主要研究方向为基础模型的优化、泛化和可扩展性理论,导师为李崇轩副教授,论文为其在字节跳动Seed实习期间完成。 第二作者张新雨是字节跳动研究员,主要研究方向为视觉生成模型。
6/27/2025 8:50:40 AM

北大发布学术搜索评测ScholarSearch:难倒一众DeepResearch的“开卷考试”

LLMs能当科研助手了? 北大出考题,结果显示:现有模型都不能胜任。 北京大学DS-Lab发布ScholarSearch,这是首个专门用于评估大语言模型在学术研究中复杂信息检索能力的数据集,包含223道高难度的学术检索题目及其答案。
6/27/2025 8:47:12 AM

Nature报道:谷歌新模型1秒读懂DNA变异!首次统一基因组全任务,性能碾压现有模型

谷歌DeepMind Alpha家族又双叒登上Nature报道,这次瞄准的是DNA变异。 现在只需1秒,就能精确定位基因组序列变异。 据Nature最新报道,谷歌DeepMind团队目前推出了突破性生物模型AlphaGenome。
6/27/2025 8:45:31 AM

推理越多,幻觉越重?多模态推理模型的「幻觉悖论」

在多模态大模型的飞速发展中,R1 系列多模态推理模型凭借显式的长链推理机制,在复杂任务中屡屡突破传统「快思考」范式的性能瓶颈。 然而,研究发现,随着推理链条的加长,这类模型的视觉感知能力却呈现出明显下滑的趋势,逐渐转而依赖语言先验进行「脑补」,生成内容也越来越容易脱离图像本身,甚至出现凭空捏造的幻觉现象。 这一「推理增强—感知削弱」的悖论,凸显了当前多模态推理模型在推理能力与感知准确性之间面临的平衡挑战。
6/27/2025 8:40:00 AM

合成数据创造商业价值的七种方式

今年,几乎所有企业都在迅速采用AI,但大多数企业部署的都是与他人相同的平台,这些平台来自相同的供应商。 基于公司独特需求创建定制化的AI解决方案需要数据,不幸的是,公司手头的数据可能存在重大缺口,在使用时可能涉及隐私或合规性问题,此外,数据量可能也不足。 合成数据可以填补这一缺口,帮助企业从其AI部署中找到真正的商业价值。
6/27/2025 7:10:00 AM
Maria Korolov

SCIENCEBOARD:构建智能体驱动的科学探索新「环境」

大家好,我是肆〇柒。 今天,我们来聊聊 SCIENCEBOARD,这是一个由香港大学、上海人工智能实验室、复旦大学、北京大学、南京大学、华东师范大学和耶鲁大学等,多所知名高校和研究机构共同打造的创新平台。 它致力于在多域科学工作流中评估多模态自主智能体,为推动 AI 驱动的科学发现提供了全新的方法和工具。
6/27/2025 7:00:00 AM
肆零柒

裁员潮下,AI开始重塑IT就业格局

随着越来越多的公司将AI视为裁员的主要驱动力,IT专业人士不禁开始怀疑,职业焦虑是否正在成为现实,或者这个行业是否只是在适应另一个新的范式。 在新冠疫情期间,亚马逊是众多迅速扩大招聘规模以满足新封闭商业范式下需求的科技公司之一,其他寻求支持全远程工作队伍的企业也纷纷效仿,科技行业的招聘和薪资水平达到了前所未有的高度。 但这种繁荣并未持续太久,亚马逊与谷歌、Meta、微软以及其他知名企业一起,在2022年集体裁员超过10万人,以适应疫情后逐渐复苏的世界。
6/27/2025 7:00:00 AM
Sarah White

简述MCP的原理-AI时代的USB接口

1 简介2 执行流程3 mcp架构3.1 mcp架构设计3.2 mcp基本功能4 mcp通信原理4.1 JSON-RPC4.2 通信方式5 生命周期5.1 环境搭建5.2 建立连接获取可用工具列表5.3 调用工具6 总结1.简介随着AI的不断发展,RAG(检索增强生成)和function calling等技术的出现,使得大语言模型的对话生成能力得到了增强。 然而,function calling的实现逻辑比较复杂,一个简单的工具调用和实现方式需要针对不同的系统和大模型单独编写适配接口,十分复杂。 在此背景下,mcp应运而生,为当前业内AI高效可靠地调用外部工具实现了标准化。
6/27/2025 3:00:22 AM
张皓昱

生成式人工智能演变:生成式人工智能简史

从 Transformers(2017 年)到 DeepSeek-R1(2025 年)2025年初,我国推出突破性且经济高效的大型语言模型(LLM)DeepSeek-R1,引发了人工智能的巨变。 本文追溯了LLM的演变历程,始于2017年革命性的Transformer架构,该架构通过自注意力机制重塑了自然语言处理(NLP)。 到2018年,首批基于Transformer的两款LLM,GPT和BERT相继发布,显著增强了语境理解和文本生成能力,为未来的创新奠定了坚实的基础。
6/27/2025 3:00:00 AM

谷歌重磅开源Gemini CLI:免费AI工具,居然要干掉GitHub Copilot?

先说说我的第一印象6月25日那天,谷歌悄无声息地放出了Gemini CLI,Apache 2.0许可证,完全免费。 我当时就想,谷歌这是要和OpenAI正面刚了? 当Cursor靠着Claude 3.5在开发者群体里风生水起,GitHub Copilot还在那里慢悠悠地更新模型支持时,谷歌这招确实有点狠。
6/27/2025 2:29:00 AM
阿丸笔记

告别复杂SQL!用Spring AI + DeepSeek构建自然语言查询系统

项目概览现代应用越来越多地采用自然语言交互界面,让用户更轻松地操作系统。 这在数据查询场景中尤为实用,非技术人员可以直接用日常语言提,文本转 SQL 聊天机器人正是这样的典型应用。 它在人类语言和数据库之间搭建了沟通桥梁。
6/27/2025 2:00:00 AM
PIG AI

in AI敢赌100万美元 - AI客服是真的狂还是有底气

AI浪潮汹涌澎湃,风浪越大鱼越贵! Fin AI,一家做客服机器人的公司,居然推出了"百万美元保证"计划。 什么概念?
6/27/2025 12:00:00 AM
阿丸笔记