AI在线 AI在线

AI

LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代

如何让AI代码补全更懂开发者? 中兴通讯团队提出了两个新的评测指标,以及一套仓库级代码语料处理框架。 按照团队的说法,这套方法论不仅为评测代码大模型提供了新视角,也为提升模型在真实工业场景中的代码补全性能开辟了新路径。
6/13/2025 9:10:00 AM

AI自动写学术综述:10分钟生成6万字,成本不到四块钱

学术综述论文在科学研究中发挥着至关重要的作用,特别是在研究文献快速增长的时代。 传统的人工驱动综述写作需要研究者审阅大量文章,既耗时又难以跟上最新进展。 而现有的自动化综述生成方法面临诸多挑战:AI生成的综述结构往往缺乏连贯逻辑,组织结构较差,存在宽度和深度的结构失衡问题;在参考文献方面,经常无法引用真正相关和有影响力的文献,容易引用无关文献而忽略核心贡献;评估方式主要依赖LLM整体质量评估,缺乏对大纲质量、参考文献相关性等关键方面的细粒度分析。
6/13/2025 9:08:00 AM

断供竞品前,Claude早已联手Cursor?共创播客曝光:AI编程瓶颈在代码检查!CTO揭秘如何用Cursor开发Cursor

编译 | 伊风事情的发展越来越有趣了。 Anthropic 在断供 WindSurf 模型接入时公开表态:把 Claude 卖给 OpenAI 的产品,确实“感觉很怪”。 这番话,让不少用户直接为 WindSurf 判了“技术死刑”。
6/13/2025 8:44:37 AM
伊风

驯服AI幻觉:通过人在循环(HITL)测试减轻AI应用中的幻觉

译者 | 晶颜审校 | 重楼引言人工智能展现出的“自信表达”,实则暗藏风险。 随着生成式人工智能解决方案在医疗、金融、法律、零售、教育等诸多领域广泛应用,自动化的强大吸引力令企业纷纷加速将大型语言模型整合至客户支持、医疗保健、法律及金融等应用场景之中。 然而,在此过程中,一个潜在的隐患——人工智能幻觉问题,正悄然潜伏于每一次指令交互背后。
6/13/2025 8:06:41 AM
晶颜

AI 智能体到底应该如何构建?分享 Github 上收获 4k stars 的 12 条原则

1.AI Agent 是如何走到今天的1.1 我的观点仅供参考无论您是智能体领域的新手,还是像我这样固执的老兵,我都将试图说服您摒弃对 AI Agent 的大部分固有认知,退一步,从第一性原理(first principles)出发重新思考它们。 (如果你错过了不久前 OpenAI 发布的内容,这里有个剧透预警:把更多智能体逻辑塞进 API 后面并非正解)2.智能体本质上是软件,让我们简要追溯其发展历程让我们回溯智能体的发展脉络。 2.1 60 年前这个阶段重点探讨的是有向图(DGs)及其无环版本 —— 有向无环图(DAGs)。
6/13/2025 3:11:00 AM
BaihaiI DP

调查报告:2026年AI投资占总IT投资的比例将达20%

随着人工智能(AI)技术的快速发展,企业对其应用的重视程度也在不断提升。 根据IBM商业价值研究所的最新研究,企业预计到年底前人工智能驱动的工作流程将从目前的3%增长到25%,显示出AI在核心业务中的重要性日益增加。 这项名为“AI项目到利润”的研究调查了全球2900名高管,揭示了企业从实验性使用AI向将AI作为核心业务运营的战略转变。
6/13/2025 2:00:00 AM

LeCun亲自出镜打脸质疑者!憋了20年的AI世界模型,终于爆发了

正处于风暴中心的LeCun,亲自出镜了! 在视频中,他介绍了V-JEPA 2的新进展,目标就是开发能改变AI与物理世界交互方式的世界模型。 图片可见,对于Meta刚刚发布的这个博客,LeCun真的格外用心。
6/12/2025 2:32:07 PM
新智元

小扎“超级智能”小组第一位大佬!谷歌DeepMind首席研究员,“压缩即智能”核心人物

小扎亲手挖人,很疯狂。 最新爆料,谷歌DeepMind首席研究员Jack Rae已经确认转投。 另有消息称,Meta还招募了AI语音初创公司Sesame AI的ML主管 Johan Schalkwyk。
6/12/2025 2:27:53 PM

DeepMind首个猜想库开源,获陶哲轩力挺!

形式化猜想,再次获陶哲轩认可! 最近,谷歌DeepMind正式开源了「形式化猜想」GitHub项目,在业内引发巨大的反响。 项目地址:,一直以来对此关注度最高的菲尔兹奖得主陶哲轩,发长文进行了点评。
6/12/2025 2:20:35 PM

维基百科编辑强烈反对后,基金会叫停 AI 摘要计划

科技媒体 404Media 昨日(6 月 11 日)发布博文,报道称在维基百科编辑们的强烈反对下,维基媒体基金会(Wikimedia Foundation)宣布暂停测试 AI 文章摘要功能。
6/12/2025 2:01:59 PM
故渊

逆天!特朗普最新AI计划竟在GitHub泄露!被发现就删库跑路!白宫也要搞ChatGPT?还有一个惊人发现:项目主导者出身特斯拉

出品 | 51CTO技术栈(微信号:blog51cto)许多大模型的“上新消息”往往都不是官宣给出的,而是——不小心从 GitHub 泄露出来的。 但这一次,事情比以往都更炸裂:特朗普政府的“AI接管计划”被曝出,就藏在 GitHub 的一个公开仓库里! 6 月 10 日,有眼尖的开发者在 GitHub 上发现了这个名为“AI.gov”的项目。
6/12/2025 1:32:36 PM
伊风

每秒生成超30帧视频,支持实时交互!自回归视频生成新框架刷新生成效率

在A100上用310M模型,实现每秒超30帧自回归视频生成,同时画面还保持高质量! 视频生成现在都快这个程度了? 最近,来自微软研究院的团队与北大联合发布新框架——Next-Frame Diffusion (NFD)。
6/12/2025 11:57:56 AM

Meta 推出名为 V-JEPA 2 的“世界模型”,助力机器人理解物理世界

Meta发布最新AI模型V-JEPA 2,旨在帮助AI智能体理解物理世界,预测事件发展。该模型训练数据超100万小时视频,运行速度比Nvidia Cosmos快30倍。Meta首席AI科学家Yann LeCun称其将开启机器人技术新纪元。#人工智能##MetaAI#
6/12/2025 11:14:15 AM
远洋

上海市委网信办指导小红书、B站、拼多多等平台清理违规 AI 产品及信息

上海市委网信办指导小红书、哔哩哔哩、拼多多等 15 家重点网站平台,集中清理“一键脱衣”、未经授权的人脸或人声克隆编辑、未备案等违规 AI 产品、商品及相关营销、炒作、推广、教程信息。小红书、哔哩哔哩主动发布专项行动治理公告,开通了有害 AI 内容的举报受理处置渠道;星野开展智能体全面排查清理。各重点网站和 AI 平台共拦截清理相关违法违规信息 82 万余条,处置违规账号 1400 余个,下线违规智能体 2700 余个。经整治,网络违规 AI 信息显著减少。
6/12/2025 9:58:10 AM
远洋

免费GPU算力部署DeepSeek-R1 32B

前言DeepSeek-R1发布最新版本DeepSeek-R1-0528,显著提升了模型的思维深度与推理能力,在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 另外,API接口还增加了Function Calling和JsonOutput 的支持。 DeepSeek-R1团队已经证明,大模型的推理模式可以蒸馏到小模型中,与通过强化学习在小模型上发现的推理模式相比,性能更优。
6/12/2025 9:48:27 AM

o3绞尽脑汁仅答对40%的题目,开源模型基本乱猜?MMSI-Bench:多图空间智能试金石

AI能看图,也能讲故事,但能理解“物体在哪”“怎么动”吗? 空间智能,正是大模型走向具身智能的关键拼图。 面对1000道多图推理题,开源大模型集体失守——准确率不到30%,甚至不如瞎猜!
6/12/2025 9:05:00 AM

全球首个历史基准!普林复旦打造AI历史助手,AI破圈人文学科

历史是关于时间中的人的科学。 ——马克·布洛赫人工智能已在诸多自然科学领域成为有力的研究助手,然而面对承载着文化意涵与历史记忆的人文学科,却仍旧表现得捉襟见肘。 究其原因,AI当前最缺乏的并非工具性能力,而是对人类智慧与文化的理解能力——这正是人文学科探究的核心。
6/12/2025 9:03:00 AM

谷歌流量急坠归0?核心员工被「自愿离职」,30年搜索帝国崩塌

搜索,真的要完了吗? 谷歌搜索的流量终结比预期来得更快! 令人始料未及!
6/12/2025 9:00:00 AM