AI
首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025
3D点云处理(PCP)涉及多种任务,如分割、去噪、配准、重建等,传统方法通常是为每个任务设计专用模型,导致过程繁杂、成本高昂。 虽然多任务学习(MTL)能缓解模型数量问题,但在任务冲突、参数调优方面仍存在挑战。 近年来兴起的In-Context Learning(ICL,上下文学习)技术,是指大型语言模型在不进行显式参数更新的情况下,仅通过输入中的示例(即上下文信息)来完成新的任务。
Anthropic 全新 AI 模型 Claude Neptune 即将亮相,竞逐市场巨头
科技媒体 testingcatalog 发透露了 AI 公司 Anthropic 正在研发的新模型 Claude Neptune 的相关信息。 目前,这一新 AI 模型已进入内部安全测试阶段,预计将与 OpenAI 的 GPT-5及谷歌的 Gemini Ultra 展开竞争。 根据博文的介绍,Claude Neptune 的安全测试正在使用 Anthropic Workbench 平台进行。
Perplexity AI将融资5亿美元,估值飙升至140亿美元挑战搜索巨头
据外媒报道,Perplexity AI正就一轮高达5亿美元的融资进行深入谈判,预计将公司估值推至140亿美元。 此轮融资由知名风险投资公司Accel领投,标志着Perplexity在AI搜索领域的迅猛崛起,旨在挑战谷歌和微软支持的OpenAI的搜索霸主地位。 AIbase观察到,这一消息引发了科技圈的广泛热议,投资者对AI重塑搜索市场的潜力表现出极高热情。
谷歌重磅AI代理即将上线!从任务到文档一键搞定,开发效率飙升3倍!
最近,谷歌正积极开发一款名为“软件开发生命周期AI代理”(Software Development Lifecycle AI Agent)的创新工具,预计未来可能集成至Gemini生态()。 该代理旨在为软件工程师提供端到端的开发支持,覆盖从任务响应到代码文档化的全流程,堪称“全天候数字同事”。 AIbase观察到,这一消息在2025年5月13日引发开发者社区热议,被认为是谷歌在AI驱动开发工具领域的又一重大布局。
清华大学与面壁智能发布端侧GUI Agent:AgentCPM-GUI
近日,清华大学THUNLP实验室联合面壁智能推出了一款创新的端侧GUI Agent——**AgentCPM-GUI**,为移动设备的人机交互带来全新突破。 该智能体基于**MiniCPM-V**模型构建,总参数量仅**8B**,以手机屏幕图像为输入,支持中英文操作,可自动执行用户提出的任务,展现出强大的GUI元素定位能力。 AgentCPM-GUI覆盖了包括**高德地图**、**大众点评**、**B站**、**小红书**在内的**30多个主流中文APP**,能够精准识别和操作APP界面元素,满足多样化的用户需求。
英伟达发布新 RL 范式:受 DeepSeek-R1 启发,重塑 AI 模型外部工具能力
英伟达联合推出 Nemotron-Research-Tool-N1 系列模型,受 DeepSeek-R1 启发,采用新型强化学习(RL)范式,强化模型推理能力。
Anthropic 即推 AI 新星:Claude Neptune 安全测试收官在即,对战 GPT-5 和 Gemini Ultra
Anthropic 即将发布 Claude Neptune 新 AI 模型,目前正接受内部安全测试,可与 OpenAI 的 GPT-5,以及谷歌的 Gemini Ultra 竞争。
ICML 2025 | 如何在合成文本数据时避免模型崩溃?
随着生成式人工智能技术的飞速发展,合成数据正日益成为大模型训练的重要组成部分。 未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。 然而,这一趋势也带来了严峻挑战:合成数据如果不加控制地使用,可能引发 “模型崩溃”(Model Collapse)问题。
特朗普计划利用 AI 芯片优势推动中东合作
美国总统唐纳德・特朗普在本周的中东访问中,人工智能(AI)芯片成为了讨论的重点。 根据《纽约时报》的最新报道,沙特阿拉伯和阿联酋等海湾国家希望从美国公司获得先进的 AI 芯片,而特朗普政府似乎对此持开放态度,准备促进相关交易。 图源备注:图片由AI生成,图片授权服务商Midjourney这一变化与拜登政府的限制政策形成鲜明对比。
Devv2.0正式开启 Private Beta:AI 驱动的开发者工具迎来全新升级
2025年5月13日,人工智能驱动的开发者工具平台 Devv 正式宣布其2.0版本进入 Private Beta 阶段。 这一消息标志着 Devv 在过去两年间的重大转型,从最初的 AI 搜索引擎进化为一款更智能、更高效的开发者生产力工具,旨在通过生成和部署代码的创新方式,重新定义开发者工作流程。 从搜索到生成:Devv2.0的战略转型Devv 最初于2023年推出,定位为一款面向开发者的 AI 搜索引擎,旨在帮助开发者快速查找技术答案。
通义千问 Qwen 免费上线 AI“深入研究”:十几分钟完成数小时任务
通义千问 Qwen 官方公众号昨日(5 月 13 日)发布博文,宣布推出 Deep Research (深入研究),该智能助理系统能够逐步规划复杂的研究任务,综合大量在线信息,并协助用户完成复杂的科研任务。
我花了整整两周,深度体验了五款最火的 AI 工具,发现它们都有个致命的问题......
Hello,大家好,我是 Sunday。 2025 年都来了,AI 工具已经不再是什么 “黑科技” 拉,而是实打实落地到我们每一个前端人日常开发流程中的 真 -- 提效神器。 但问题也来了,目前市面上 AI 工具越来越多,宣传都很猛,那么真的能用的到底几个呢?
TikTok 推出新 AI 工具 “AI Alive”,轻松将照片变成视频
最近,TikTok 推出了一款名为 “AI Alive” 的新工具,用户可以通过这一 AI 驱动的功能,将静态照片转换为短视频。 用户只需在描述框中输入他们想要的视频效果,系统就会为其生成生动的视频内容。 这一功能的推出使得无论用户是否具备编辑经验,都能够轻松制作出引人注目的短视频。
法律AI独角兽Harvey拥抱Anthropic与谷歌模型,打破OpenAI独家依赖
备受瞩目的法律人工智能工具 Harvey 近日宣布战略调整,未来将整合 Anthropic 和谷歌的领先基础模型,结束了此前完全依赖 OpenAI 技术的局面。 值得注意的是,Harvey 曾是 OpenAI 初创基金的明星投资项目之一,该基金旨在扶持基于 AI 技术(特别是 OpenAI 自研技术)的公司。 尽管 Harvey 强调不会放弃 OpenAI,只是增加了更多模型和云服务选项,但此举无疑对 OpenAI 的竞争对手来说是一次重要的胜利。
英国政府推出 AI 工具“Consult”加速公众咨询
英国政府近日宣布将推出一款名为 “Consult” 的人工智能工具,该工具将用于快速分析公众对政府咨询的反馈。 这是该工具首次在政府咨询中被使用,旨在节省成本和人员时间。 最初,Consult 工具由苏格兰政府应用于对非手术美容程序(如填充唇部)的监管进行公众意见征集。
突发,美商务部叫停「AI扩散规则」藏杀机!英伟达市值再破3万亿
《AI扩散规则》生效前夜,特朗普政府正式叫停。 13日晚,美商务部工业和安全局(BIS)宣布,撤销拜登签署的《AI扩散规则》(即将在5月15日生效)。 图片与此同时,他们又出台了加强全球半导体出口管制的新措施,这些限制可谓是又准又狠。
ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式
该工作由通用人工智能研究院 × 北京大学联手打造。 第一作者郑欣悦为通用人工智能研究院研究员,共同一作为北京大学人工智能研究院博士生林昊苇,通讯作者为北京大学助理教授梁一韬和通用人工智能研究院研究员郑子隆。 开发能在开放世界中完成多样任务的通用智能体,是AI领域的核心挑战。
首次!流匹配模型引入GRPO,GenEval几近满分,组合生图能力远超GPT-4o
本文由香港中文大学与快手可灵等团队联合完成。 第一作者为香港中文大学 MMLab 博士生刘杰,他的研究方向为强化学习和生成模型,曾获 ACL Outstanding Paper Award。 流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能,已成为图像生成(Stable Diffusion, Flux)和视频生成(可灵,WanX,Hunyuan)领域最先进模型的训练方法。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
大型语言模型
生成式AI
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Transformer
Copilot
架构
MCP
编程
视觉