资讯列表
从25亿到99亿估值飙升:Cursor一年三轮融资成AI编程赛道新王者
据彭博社报道,人工智能编程助手Cursor的制造商Anysphere已完成9亿美元融资,估值达99亿美元,距离百亿独角兽仅一步之遥。 本轮融资由回归投资者Thrive Capital领投,Andreessen Horowitz、Accel和DST Global等知名机构参投。 一年三轮融资创造增长奇迹。
硬刚到底,OpenAI 将就《纽约时报》的诉讼请求提出上诉
OpenAI 表示,“信任和隐私是我们产品的核心”,《纽约时报》及其他原告的诉讼请求从根本上违背了其对用户做出的隐私承诺,是越权行为。
AI Agent 产品交互设计:设计模式与案例分析
作者 | 贾思玉、亢江妹 或许你还记得 ChatGPT 问世时的轰动,第一次使用 DeepSeek R1 的兴奋和激动也历历在目。 AI Agent 发展一日千里,今年以来,几乎每个月都有新的 AI Agent 产品发布,现有产品也不断更新换代,让人目不暇接。 本文将从体验设计视角,来看看当下热门的 AI Agent 产品,如 Manus、Flowith、Gemini Deep Research、Cursor、Devin 等,分析 Agent 产品面临的设计挑战,探讨有效的交互设计模式,以及如何打造高效、易用、友好的 Agent 交互体验。
0day 漏洞量产?AI Agent “生产线”曝光
作者 | 悟空团队 — 新一代 AI 代码安全捉“妖”行者(原腾讯AI安全-啄木鸟团队)随着AI技术的迅猛发展,AI智能体在0day漏洞挖掘领域展现出前所未有的潜力。 本文将深入探讨AI Agent如何通过创新的多智能体协作系统,打造出高效的0day漏洞“生产线”,实现自动化的漏洞检测。 通过基准测试和实战验证,Agent在复杂代码和大型项目中的表现超越传统工具,极大提升了漏洞识别效率与准确性。
用Cursor / Trae AI 开发Go项目时,记得先做这些
这几天“字节内部禁止使用Cursor 等AI 编程工具” 的新闻挂上了热搜, 字节自己的AI 编程工具 Trae 也趁机开始了收费模式,这两个新闻同时出现,字节还是挺会炒作的。 随着Trae 的收费,我对Trae 长达半年的白嫖也算是到头了, 不过好在公司每月给报销Cursor的费用,不然现在没有AI让我手敲代码我还真有点不习惯。 现在我几乎所有代码都让AI先写一遍自己再微调,甚至连一条SQL都懒得敲。
危险?OpenAI 模型行为负责人:人类很快会进入「AI意识」,当前最重要是控制人机关系的影响
AI是否真的有意识? ChatGPT最近越来越懂你了? OpenAI模型行为与政策负责人Joanne Jang刚刚写了一篇长文,她并未纠缠于“AI是否真的有意识”这个哲学难题,而是提出了一个更具现实意义和紧迫性的视角:与其争论AI的“本体”,不如关注它对人类“情感福祉”的实际影响。
精准调控大模型生成与推理!浙大&腾讯新方法尝试为其注入“行为定向剂”
如果你面前有两个AI助手:一个能力超强却总爱“离经叛道”,另一个规规矩矩却经常“答非所问”,你会怎么选? 这正是当前大模型控制面临的两难困境:要么模型聪明却难以约束,要么守规矩却缺乏实用性。 但我们真正追求的,并不是在“聪明但难控”与“听话但愚钝”之间二选一,而是打造既强又好的AI助手——既具备强大的智能能力,又能始终按照人类意图行事。
Qwen&清华团队颠覆常识:大模型强化学习仅用20%关键token,比用全部token训练还好
近期arxiv最热门论文,Qwen&清华LeapLab团队最新成果:在强化学习训练大模型推理能力时,仅仅20%的高熵token就能撑起整个训练效果,甚至比用全部token训练还要好。 团队用这个发现在Qwen3-32B上创造了新的SOTA记录:AIME’24上达到63.5分,AIME’25上达到56.7分,这是600B参数以下直接从base模型训练的最高分。 最大响应长度从20k延长到29k,AIME’24的分数更是飙升到了68.1分。
性能大涨!阿里开源新版Qwen3模型,霸榜文本表征
今天凌晨,阿里巴巴开源了两款Qwen3系列新模型,Qwen3-Embedding和Qwen3-Reranker。 这两个模型是专为文本表征、检索与排序任务设计,基于 Qwen3基础模型训练,充分继承了Qwen 3在多语言文本理解方面的优势,支持119种语言。 根据测试数据显示,在多语言文本表征基准测试中,Qwen3 Embedding的性能非常出色。
让GPU不再摸鱼!清华蚂蚁联合开源首个全异步RL,一夜击穿14B SOTA
还记得今年初DeepSeek‑R1系列把纯强化学习(RL)训练开源,点燃社区对于RL的热情吗? 不久后,来自清华蚂蚁联合开源项目AReaL(v0.1)也通过在DeepSeek-R1-Distill-Qwen-1.5B上进行RL训练,观察到模型性能的持续提升。 AReaL(v0.1)在40小时内,使用RL训练的一个1.5B参数模型,在数学推理方面就超越了o1-Preview版本。
推理时间减少70%!前馈3DGS「压缩神器」来了,浙大Monash联合出品
在增强现实(AR)和虚拟现实(VR)等前沿应用领域,新视角合成(Novel View Synthesis,NVS)正扮演着越来越关键的角色。 3D高斯泼溅(3D Gaussian Splatting,3DGS)凭借其革命性的实时渲染能力和卓越的视觉质量,迅速成为NVS领域备受关注的技术方案。 现有的前馈3D高斯泼溅(Feed-Forward 3D Gaussian Splatting,3DGS)模型,虽然在实时渲染和高效生成3D场景方面取得了显著进展,但仍存在一些关键缺陷。
真实联网搜索Agent,7B媲美满血R1,华为盘古DeepDiver给出开域信息获取新解法
大型语言模型 (LLM) 的发展日新月异,但实时「内化」与时俱进的知识仍然是一项挑战。 如何让模型在面对复杂的知识密集型问题时,能够自主决策获取外部知识的策略? 华为诺亚方舟实验室研究团队提出了 Pangu DeepDiver 模型,通过 Search Intensity Scaling 实现了 LLM 搜索引擎自主交互的全新范式,使得 Pangu 7B 模型在开域信息获取能力上可以接近百倍参数的 DeepSeek-R1,并优于 DeepResearcher、R1-Searcher 等业界同期工作!
AI摧毁就业?DeepMind CEO:这是一场比互联网更猛的职业洗牌
AI需要重大突破才能实现AGI吗? 是的,但已经在路上! 它会摧毁现有就业市场吗?
DeepMind揭惊人答案:智能体就是世界模型!跟Ilya 2年前预言竟不谋而合
就在刚刚,DeepMind科学家Jon Richens在ICML 2025上发表的论文,一石激起千层浪。 实现人类水平的智能体(即AGI),是否需要世界模型,还是存在无模型的捷径? 他们从第一性原理出发,揭示了一个令人惊讶的答案——智能体就是世界模型!
可灵AI月度付费金额连续两个月超1亿元,用户规模破2200万
根据快手官网信息显示,可灵AI在推出10个月之后(即今年3月)的年化收入运行率(ARR)已突破1亿美元,另外今年4月和5月的月度付费金额均超过1亿元人民币。 据了解,目前P(Prosumer)端付费订阅会员贡献了可灵AI将近70%的营业收入。 目前可灵AI全球用户规模突破2200万,为超过1万家的企业客户提供API服务。
马斯克 X 平台更新政策,禁止第三方使用内容训练 AI 模型
马斯克旗下的社交平台 X(原推特)发布了更新的开发者协议,新增了一项条款,明确禁止第三方使用该平台的内容进行人工智能(AI)模型的训练。 根据外媒《The Verge》的报道,这一政策更新意味着开发者不能利用 X 平台或其 API 上的内容来 “微调或训练基础模型或前沿模型”。 图源备注:图片由AI生成,图片授权服务商Midjourney这一政策的出台,可能是 X 平台意图与第三方公司进行 AI 训练合作的表现,类似于 Reddit 和谷歌之间的协议。
谷歌推出更新版 Gemini 2.5 Pro,AI 性能大幅提升
谷歌最近在其 AI 模型系列中迎来了重要更新。 继今年3月底推出 Gemini2.5Pro 模型后,谷歌紧接着在4月发布了更为轻量的 Gemini2.5Flash 版本。 虽然两者目前都处于预览阶段,但 Gemini2.5Flash 版本已经通过 Gemini App 向全球用户开放,用户可以体验其强大的功能。
Anthropic 发布专为国家安全定制的 AI 模型,获亚马逊和谷歌支持
人工智能公司 Anthropic 推出了一款专为美国国家安全机构设计的 AI 模型套件,名为 Claude Gov。 这一产品已经得到了亚马逊和谷歌的战略支持,现阶段仅向持有最高安全许可的机构开放使用。 Claude Gov 模型套件是根据国防和情报部门的具体需求开发而成的。