AI在线 AI在线

理论

第一次用Cursor?四步骤快速安装+五大功能界面说明

Cursor 是一款长得像Visual Studio Code实际上也确实是在人家基础上二次开、塞进AI 功能的程序编辑器,让写整个开发流程都能靠AI 一路加速。 使用Cursor 可以一键导入原本你在VsCode中已经设置过的主题、快捷键、extensions,不用再重新设置;它也整合了像 GPT 和Claude等顶尖AI 模型,能依上下文生成整段功能代码。 写程序写到一半遇到bug,只要把错误讯息丢给Cursor,AI 就会协助分析、提供建议,甚至重构程序代码、帮你优化结构,让整体更好维护。
6/27/2025 10:11:35 AM
Kevin Yan11

突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

余天予,清华大学计算机系一年级博士生,导师为清华大学自然语言处理实验室刘知远副教授。 研究兴趣主要包括高效多模态大模型、多模态大模型对齐和强化学习,在 CVPR、AAAI等人工智能领域的著名国际会议和期刊发表多篇学术论文,谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward,基于可验证奖励的强化学习)的巨大潜力。
6/27/2025 10:10:43 AM

谷歌开源Gemma 3n:2G内存就能跑,100亿参数内最强多模态模型

端侧设备迎来了新架构的 AI 模型。 本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。 模型、权重:::,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。
6/27/2025 10:08:19 AM

91岁零基础!硬核爷爷用AI两天爆肝应用,350美元玩转氛围编程

一位91岁老人用Claude和Replit编写了一个复杂的教会活动管理系统! 退休电气工程师John Blackman分享了他如何用Claude和Replit构建应用程序。 John从没碰过代码,但在孙子推荐下,只花两天就搞定了这个教会志愿者管理系统。
6/27/2025 10:04:31 AM

杀疯了,这个 AI+Python 智能体救了看门老大爷!

最近AiPy很火,我用了有一段时间了,感觉严重影响睡眠,感觉这东西容易上瘾,今天推荐给大家。 AiPy它是基于AI Python,官方的说法是他们给大模型装上了手脚,也就是说,用大白话就能自动操作电脑、控制手机、甚至连家里的智能灯泡也能控制,听起来有点逆天。 然后AiPy是个开源项目,有命令行版和客户端。
6/27/2025 9:29:45 AM
老朱2000

超过GPT-image-1!大黑马Black Forest刚开源新模型,只用文本实现一键PS

今天凌晨,知名开源平台Black Forest开源了,文生图模型FLUX.1-Kontext的开发者版本。 该版本主要专注于图像编辑任务,支持迭代编辑,在各种场景和环境中都能出色地保留角色特征,还允许进行精确的局部和全局编辑,例如,用户想给一个人脸加上胡子或者更改衣服穿着、场景,FLUX.1-Kontext都能轻松实现。 简单来说,FLUX.1-Kontext开发版的主要功能可以像PS一样,让用户通过自然语言就能实现一键P图。
6/27/2025 9:26:50 AM

五款大模型考「山东卷」,Gemini、豆包分别获文理第一名

果然,高考已经快被 AI 攻克了。 近日,5 款大模型参加了今年山东高考,按照传统的文理分科方式统计:豆包 Seed 1.6-Thinking 模型以 683 分的成绩拿下文科第一,Gemini 2.5 Pro 则凭借 655 分拔得理科头筹。 测评来自字节跳动 Seed 团队。
6/27/2025 9:24:04 AM
机器之心

3D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32%

近年来,视觉-语言-动作(VLA)模型在机器人操作任务中大放异彩,成为推动通用机器人操作的重要引擎。 但现有的VLA模型,大多只以2D信息作为输入,且需要大量的机器人数据进行微调;反观以PerAct,RVT-2为代表的3D操作策略,通常仅需要10条轨迹就能够取得不错的效果,因此,一个很自然的想法是,是否能将现有的2D VLA升级为3D VLA,使其同时兼具2D VLA的效果以及3D操作策略的效率? 中科院自动化所的研究人员提出的BridgeVLA给出了肯定的回答!
6/27/2025 9:10:17 AM

谷歌AlphaGenome横空出世!40亿年生命代码一键破解,或再夺诺奖

基因组,宛如生命的蓝图,藏在我们每一个细胞之中。 这套完整的DNA指令集,主导着生命体从外观功能到生长繁殖的几乎每一个方面,甚至是对疾病抵御的能力。 2003年,人类基因组测序完成,让人类首次窥见了DNA的全貌。
6/27/2025 8:56:51 AM

人民大学&字节Seed:利用μP实现Diffusion Transformers高效扩展

本文由中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队共同完成。 第一作者郑晨宇是中国人民大学高瓴人工智能学院二年级博士生,主要研究方向为基础模型的优化、泛化和可扩展性理论,导师为李崇轩副教授,论文为其在字节跳动Seed实习期间完成。 第二作者张新雨是字节跳动研究员,主要研究方向为视觉生成模型。
6/27/2025 8:50:40 AM

北大发布学术搜索评测ScholarSearch:难倒一众DeepResearch的“开卷考试”

LLMs能当科研助手了? 北大出考题,结果显示:现有模型都不能胜任。 北京大学DS-Lab发布ScholarSearch,这是首个专门用于评估大语言模型在学术研究中复杂信息检索能力的数据集,包含223道高难度的学术检索题目及其答案。
6/27/2025 8:47:12 AM

Nature报道:谷歌新模型1秒读懂DNA变异!首次统一基因组全任务,性能碾压现有模型

谷歌DeepMind Alpha家族又双叒登上Nature报道,这次瞄准的是DNA变异。 现在只需1秒,就能精确定位基因组序列变异。 据Nature最新报道,谷歌DeepMind团队目前推出了突破性生物模型AlphaGenome。
6/27/2025 8:45:31 AM

推理越多,幻觉越重?多模态推理模型的「幻觉悖论」

在多模态大模型的飞速发展中,R1 系列多模态推理模型凭借显式的长链推理机制,在复杂任务中屡屡突破传统「快思考」范式的性能瓶颈。 然而,研究发现,随着推理链条的加长,这类模型的视觉感知能力却呈现出明显下滑的趋势,逐渐转而依赖语言先验进行「脑补」,生成内容也越来越容易脱离图像本身,甚至出现凭空捏造的幻觉现象。 这一「推理增强—感知削弱」的悖论,凸显了当前多模态推理模型在推理能力与感知准确性之间面临的平衡挑战。
6/27/2025 8:40:00 AM

大语言模型热潮与现实的差距:CISO应关注什么

从AI应用中的风险,如中毒的训练数据和幻觉现象,到AI赋能的安全措施,再到深度伪造、用户错误以及新型AI生成的攻击技术,网络安全行业正充斥着令人恐惧的安全威胁,这些威胁让CISO们不堪重负。 例如,在2025年4月的RSA会议期间及之后,与会者纷纷对AI带来的恐惧、不确定性和怀疑(FUD)表示强烈不满,尤其是供应商方面的表现。 其中一位是Netflix的信息风险工程师Tony Martin-Vegue,他在RSAC会议后的采访中告诉记者,虽然AI的炒作和潜力很大,但无法阻止其发展,不过有方法可以穿透炒作,并在最关键的地方应用基本控制措施。
6/27/2025 7:12:00 AM
Deb Radcliff

合成数据创造商业价值的七种方式

今年,几乎所有企业都在迅速采用AI,但大多数企业部署的都是与他人相同的平台,这些平台来自相同的供应商。 基于公司独特需求创建定制化的AI解决方案需要数据,不幸的是,公司手头的数据可能存在重大缺口,在使用时可能涉及隐私或合规性问题,此外,数据量可能也不足。 合成数据可以填补这一缺口,帮助企业从其AI部署中找到真正的商业价值。
6/27/2025 7:10:00 AM
Maria Korolov

SCIENCEBOARD:构建智能体驱动的科学探索新「环境」

大家好,我是肆〇柒。 今天,我们来聊聊 SCIENCEBOARD,这是一个由香港大学、上海人工智能实验室、复旦大学、北京大学、南京大学、华东师范大学和耶鲁大学等,多所知名高校和研究机构共同打造的创新平台。 它致力于在多域科学工作流中评估多模态自主智能体,为推动 AI 驱动的科学发现提供了全新的方法和工具。
6/27/2025 7:00:00 AM
肆零柒

裁员潮下,AI开始重塑IT就业格局

随着越来越多的公司将AI视为裁员的主要驱动力,IT专业人士不禁开始怀疑,职业焦虑是否正在成为现实,或者这个行业是否只是在适应另一个新的范式。 在新冠疫情期间,亚马逊是众多迅速扩大招聘规模以满足新封闭商业范式下需求的科技公司之一,其他寻求支持全远程工作队伍的企业也纷纷效仿,科技行业的招聘和薪资水平达到了前所未有的高度。 但这种繁荣并未持续太久,亚马逊与谷歌、Meta、微软以及其他知名企业一起,在2022年集体裁员超过10万人,以适应疫情后逐渐复苏的世界。
6/27/2025 7:00:00 AM
Sarah White

一文彻底搞懂智能体Agent基于ReAct的工具调用

前言AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。 它结合了人工智能技术(如机器学习、自然语言处理、计算机视觉等),能够独立或协作完成目标。 基于大语言模型(LLM)的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。
6/27/2025 6:00:00 AM
AI大模型应用开发