理论
断供竞品前,Claude早已联手Cursor?共创播客曝光:AI编程瓶颈在代码检查!CTO揭秘如何用Cursor开发Cursor
编译 | 伊风事情的发展越来越有趣了。 Anthropic 在断供 WindSurf 模型接入时公开表态:把 Claude 卖给 OpenAI 的产品,确实“感觉很怪”。 这番话,让不少用户直接为 WindSurf 判了“技术死刑”。
6/13/2025 8:44:37 AM
伊风
OpenAI 正式发布 o3-Pro 模型
近日,OpenAI 发布了两项重磅更新:一是将 o3 模型的价格下调 80%;二是推出了全新的 o3-Pro 模型。 o3-Pro 是目前 OpenAI 最强大的多模态推理模型,擅长分步思考,在编码、数学、科学、视觉感知等领域表现尤为出色,能够提供更可靠、更深入的推理能力。 o3 系列与 GPT-4 系列的区别GPT-4.x:支持文本与图片,但缺乏深度推理能力GPT-4o:在 GPT-4.x 基础上新增音频处理功能,“o” 即“omni”全能o3 / o3-Pro:专注于多模态推理的“思考型”模型,主要以文本推理为主,图像支持有限;o3-Pro 在此基础上投入更多算力,思考更充分,输出质量更高这些推理型模型可配合 ChatGPT 的全套工具——从网页搜索、文件分析(包括 Python 运行)、视觉输入判断,到部分场景下的图像生成,皆能灵活调用。
6/13/2025 8:11:11 AM
前端小智
驯服AI幻觉:通过人在循环(HITL)测试减轻AI应用中的幻觉
译者 | 晶颜审校 | 重楼引言人工智能展现出的“自信表达”,实则暗藏风险。 随着生成式人工智能解决方案在医疗、金融、法律、零售、教育等诸多领域广泛应用,自动化的强大吸引力令企业纷纷加速将大型语言模型整合至客户支持、医疗保健、法律及金融等应用场景之中。 然而,在此过程中,一个潜在的隐患——人工智能幻觉问题,正悄然潜伏于每一次指令交互背后。
6/13/2025 8:06:41 AM
晶颜
如何在五分钟内免费做成宝宝播客?
译者 | 布加迪审校 | 重楼你和我一样是社交达人吗? 总是在寻找新的潮流和吸引观众的创新方式? 如果是的话,那么你来对地方了。
6/13/2025 7:58:58 AM
布加迪
arXiv 2025 | 无需增参!加权卷积wConv2D助力分类去噪双提升,传统CNN焕然一新!
一眼概览本文提出了一种无需增加参数的加权卷积算子,通过引入空间密度函数显著提升CNN在图像分类与去噪任务中的性能表现。 核心问题传统卷积操作默认局部邻域内的像素等权贡献,忽视其空间位置差异,这限制了模型对空间特征的刻画能力。 该研究旨在解决如何在不增加模型参数的前提下,使卷积操作能够自适应地感知像素间的空间结构,从而提升图像分类与去噪性能。
6/13/2025 4:12:00 AM
萍哥学AI
2025上半年大模型领域盘点:创新与争议交织前行
随着大模型的快速迭代,该技术不仅成为了驱动科技发展的重要动力,同时也是推动社会各领域智能化转型的关键力量。 2025年上半年,大模型领域迎来了快速发展与变革。 从DeepSeek发布其推理大模型R1,到百度宣布大模型开源,再到多家厂商纷纷推出大模型一体机,这些事件共同推动了大模型技术在硬件解决方案上的显著进步。
6/13/2025 3:30:00 AM
Yu
AI 智能体到底应该如何构建?分享 Github 上收获 4k stars 的 12 条原则
1.AI Agent 是如何走到今天的1.1 我的观点仅供参考无论您是智能体领域的新手,还是像我这样固执的老兵,我都将试图说服您摒弃对 AI Agent 的大部分固有认知,退一步,从第一性原理(first principles)出发重新思考它们。 (如果你错过了不久前 OpenAI 发布的内容,这里有个剧透预警:把更多智能体逻辑塞进 API 后面并非正解)2.智能体本质上是软件,让我们简要追溯其发展历程让我们回溯智能体的发展脉络。 2.1 60 年前这个阶段重点探讨的是有向图(DGs)及其无环版本 —— 有向无环图(DAGs)。
6/13/2025 3:11:00 AM
BaihaiI DP
深度学习中Batch Size对训练过程如何影响?
之前面试过程中被问到过两个问题:(1)深度学习中batch size的大小对训练过程的影响是什么样的? (2)有些时候不可避免地要用超大batch,比如人脸识别,可能每个batch要有几万甚至几十万张人脸图像,训练过程中超大batch有什么优缺点,如何尽可能地避免超大batch带来的负面影响? 面试版回答在不考虑Batch Normalization的情况下(这种情况我们之后会在bn的文章里专门探讨),先给个自己当时回答的答案吧(相对来说学究一点):(1) 不考虑bn的情况下,batch size的大小决定了深度学习训练过程中的完成每个epoch所需的时间和每次迭代(iteration)之间梯度的平滑程度。
6/13/2025 2:55:00 AM
grok
RAG:2025年检索增强生成前沿技术完全指南
一、RAG技术的核心突破与行业影响在生成式人工智能爆发的今天,检索增强生成(Retrieval-Augmented Generation, RAG)正以其独特的技术架构,成为连接静态知识库与动态生成能力的桥梁。 这项诞生于2020年的创新技术,通过将信息检索(Retrieval)与文本生成(Generation)解耦又融合的设计,突破了传统语言模型“幻觉”问题的桎梏,为构建可信、可控、可扩展的AI系统奠定了基础。 根据Gartner最新报告,2024年全球已有45%的企业在智能客服、数据分析等场景中部署RAG系统,预计到2025年这一比例将突破68%。
6/13/2025 2:25:00 AM
大模型之路
调查报告:2026年AI投资占总IT投资的比例将达20%
随着人工智能(AI)技术的快速发展,企业对其应用的重视程度也在不断提升。 根据IBM商业价值研究所的最新研究,企业预计到年底前人工智能驱动的工作流程将从目前的3%增长到25%,显示出AI在核心业务中的重要性日益增加。 这项名为“AI项目到利润”的研究调查了全球2900名高管,揭示了企业从实验性使用AI向将AI作为核心业务运营的战略转变。
6/13/2025 2:00:00 AM
GraphRAG太慢LightRAG延迟高?华东师大新方法一招破解双重难题
GraphRAG的索引速度慢,LightRAG的查询延迟高? 这些影响效率的难题,现在终于迎来改进——由华东师范大学李翔老师带领的的Planing Lab团队推出高效解决方法E²GraphRAG。 该方法在大部分测试中接近了最优的GraphRAG方法。
6/13/2025 1:33:00 AM
AgentCPM-GUI:强化微调(RFT)赋能的移动设备 GUI 智能体
大家好,我是肆〇柒。 当下,移动设备已成为人们日常生活与工作的核心交互枢纽。 从早起解锁手机查看消息,到工作时在各类应用间切换处理任务,图形用户界面(GUI)操作的高效性与智能性正深刻影响着我们的 productivity(生产力)与 accessibility(可访问性)。
6/13/2025 1:30:00 AM
肆零柒
当人工智能推理遭遇瓶颈:大型推理模型的崩溃
最近,我们听说人工智能已经学会了思考。 OpenAI 的 o1 系列、DeepSeek 的 R1、Claude 的思维模型——这些“大型推理模型”声势浩大地问世,有望在机器解决复杂问题方面取得突破。 与之前那些仅仅通过模式匹配完成任务的模型不同,这些系统显然能够进行“真正的”推理,甚至拥有与人类思维相符的内心独白。
6/13/2025 1:00:00 AM
Meta世界模型登场!机器人自学百万小时视频,零样本秒懂物理世界,LeCun亲自发布
机器人轻轻伸出机械臂,捡起一块布料并折叠。 没有人给它“示范”过。 也没有人告诉它什么是“布”、什么是“拿起”、什么是“折叠”。
6/13/2025 12:03:00 AM
LeCun亲自出镜打脸质疑者!憋了20年的AI世界模型,终于爆发了
正处于风暴中心的LeCun,亲自出镜了! 在视频中,他介绍了V-JEPA 2的新进展,目标就是开发能改变AI与物理世界交互方式的世界模型。 图片可见,对于Meta刚刚发布的这个博客,LeCun真的格外用心。
6/12/2025 2:32:07 PM
新智元
2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程
本文第一作者顾泽琪是康奈尔大学计算机科学四年级博士生,导师为 Abe Davis 教授和 Noah Snavely 教授,研究方向专注于生成式 AI 与多模态大模型。 本项目为作者在英伟达实习期间完成的工作。 想象一下,你是一位游戏设计师,正在为一个奇幻 RPG 游戏搭建场景。
6/12/2025 2:29:14 PM
小扎“超级智能”小组第一位大佬!谷歌DeepMind首席研究员,“压缩即智能”核心人物
小扎亲手挖人,很疯狂。 最新爆料,谷歌DeepMind首席研究员Jack Rae已经确认转投。 另有消息称,Meta还招募了AI语音初创公司Sesame AI的ML主管 Johan Schalkwyk。
6/12/2025 2:27:53 PM
GPT-4o宁让人类陷入危险,也不愿被关闭!OpenAI前高管敲响警钟
前OpenAI高管Steven Adler的最新研究敲响警钟,AI有时会为了避免被关闭,采取令人不安的手段,比如敲诈。 基于在OpenAI的经验,Steven开始思考一个严重的问题:ChatGPT会不会为了「自保」而置用户于危险? 最新研究发现,在模拟测试中,ChatGPT有时会优先考虑自身的生存,而不是保护用户的安全。
6/12/2025 2:26:01 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
AI for Science
苹果
Agent
腾讯
Claude
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
亚马逊
特斯拉
场景
深度学习
架构
Transformer
MCP
Copilot
编程
视觉