AI在线 AI在线

理论

2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程

本文第一作者顾泽琪是康奈尔大学计算机科学四年级博士生,导师为 Abe Davis 教授和 Noah Snavely 教授,研究方向专注于生成式 AI 与多模态大模型。 本项目为作者在英伟达实习期间完成的工作。 想象一下,你是一位游戏设计师,正在为一个奇幻 RPG 游戏搭建场景。
6/12/2025 2:29:14 PM

小扎“超级智能”小组第一位大佬!谷歌DeepMind首席研究员,“压缩即智能”核心人物

小扎亲手挖人,很疯狂。 最新爆料,谷歌DeepMind首席研究员Jack Rae已经确认转投。 另有消息称,Meta还招募了AI语音初创公司Sesame AI的ML主管 Johan Schalkwyk。
6/12/2025 2:27:53 PM

GPT-4o宁让人类陷入危险,也不愿被关闭!OpenAI前高管敲响警钟

前OpenAI高管Steven Adler的最新研究敲响警钟,AI有时会为了避免被关闭,采取令人不安的手段,比如敲诈。 基于在OpenAI的经验,Steven开始思考一个严重的问题:ChatGPT会不会为了「自保」而置用户于危险? 最新研究发现,在模拟测试中,ChatGPT有时会优先考虑自身的生存,而不是保护用户的安全。
6/12/2025 2:26:01 PM

DeepMind首个猜想库开源,获陶哲轩力挺!

形式化猜想,再次获陶哲轩认可! 最近,谷歌DeepMind正式开源了「形式化猜想」GitHub项目,在业内引发巨大的反响。 项目地址:,一直以来对此关注度最高的菲尔兹奖得主陶哲轩,发长文进行了点评。
6/12/2025 2:20:35 PM

逆天!特朗普最新AI计划竟在GitHub泄露!被发现就删库跑路!白宫也要搞ChatGPT?还有一个惊人发现:项目主导者出身特斯拉

出品 | 51CTO技术栈(微信号:blog51cto)许多大模型的“上新消息”往往都不是官宣给出的,而是——不小心从 GitHub 泄露出来的。 但这一次,事情比以往都更炸裂:特朗普政府的“AI接管计划”被曝出,就藏在 GitHub 的一个公开仓库里! 6 月 10 日,有眼尖的开发者在 GitHub 上发现了这个名为“AI.gov”的项目。
6/12/2025 1:32:36 PM
伊风

夸克发布高考志愿大模型,蒸馏数百名人类志愿专家经验

6月12日,夸克发布国内首个为高考志愿填报场景开发的高考志愿大模型,并同步上线“高考深度搜索”、“志愿报告”、“智能选志愿”三大核心功能。 该模型具备专家级决策能力,能够为每位考生提供精准、个性化的志愿填报服务。 让每位考生都有自己的AI志愿顾问高考志愿大模型驱动的夸克“志愿报告”以Agent方式运行,目前已开放试用。
6/12/2025 1:03:13 PM

每秒生成超30帧视频,支持实时交互!自回归视频生成新框架刷新生成效率

在A100上用310M模型,实现每秒超30帧自回归视频生成,同时画面还保持高质量! 视频生成现在都快这个程度了? 最近,来自微软研究院的团队与北大联合发布新框架——Next-Frame Diffusion (NFD)。
6/12/2025 11:57:56 AM

最大的开源GraphRag:知识图谱完全自主构建|港科大&华为

知识图谱(KGs)已经可以很好地将海量的复杂信息整理成结构化的、机器可读的知识,但目前的构建方法仍需要由领域专家预先创建模式,这限制了KGs的可扩展性、适应性和领域覆盖范围。 为此,香港科技大学KnowComp实验室联合香港华为理论部提出了AutoSchemaKG:一个无需预定义模式、用于完全自主知识图谱构建的框架。 该系统利用大型语言模型,可以直接从文本中同时提取知识三元组并归纳出全面的模式,对实体和事件进行建模,同时采用概念化方法将实例组织成语义类别。
6/12/2025 11:56:30 AM

超实用!手把手教你Dify版本升级

很多情况下,我们需要升级 Dify 版本以获得新的功能和性能的提升,同时还能确保系统的安全性、稳定性和兼容性,从而更好地满足用户的需求。 那问题来了,怎么升级 Dify 版本呢? 接下来,我们以 Docker 方式安装 Dify 的升级为例,给大家演示一下升级的流程和注意事项,当然源码安装的升级方式也是类似的,升级思路都相同的,只是具体的操作可能略有不同。
6/12/2025 10:27:02 AM
磊哥

免费GPU算力部署DeepSeek-R1 32B

前言DeepSeek-R1发布最新版本DeepSeek-R1-0528,显著提升了模型的思维深度与推理能力,在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 另外,API接口还增加了Function Calling和JsonOutput 的支持。 DeepSeek-R1团队已经证明,大模型的推理模式可以蒸馏到小模型中,与通过强化学习在小模型上发现的推理模式相比,性能更优。
6/12/2025 9:48:27 AM

刚刚,LeCun亲自出镜,Meta推出新世界模型!

最近,Meta 大动作不断。 前些天有外媒曝出马克・扎克伯格正在组建一个名为「超级智能团队」的专家团队,以实现通用人工智能。 随后开出 9 位数的薪酬为该团队吸纳人才。
6/12/2025 9:37:30 AM
机器之心

杨立昆亲自指导开源世界大模型,为AI Agent打造超级大脑

今天凌晨,全球社交巨头Meta在官网开源了一个世界大模型V-JEPA 2。 与第一代相比,V-JEPA 2使用了100万视频 100万图片超大规模训练数据集,可以让AI Agent像人类那样理解真实的物理世界,为智能体打造一个“超级大脑”自主学会观察、规划到执行全自动化能力。 值得一提的是,图灵奖获得者、Meta首席科学家杨立昆(Yann LeCun)参与了该模型的开发,这在Meta开源的众多大模型中很罕见。
6/12/2025 9:12:00 AM

o3绞尽脑汁仅答对40%的题目,开源模型基本乱猜?MMSI-Bench:多图空间智能试金石

AI能看图,也能讲故事,但能理解“物体在哪”“怎么动”吗? 空间智能,正是大模型走向具身智能的关键拼图。 面对1000道多图推理题,开源大模型集体失守——准确率不到30%,甚至不如瞎猜!
6/12/2025 9:05:00 AM

全球首个历史基准!普林复旦打造AI历史助手,AI破圈人文学科

历史是关于时间中的人的科学。 ——马克·布洛赫人工智能已在诸多自然科学领域成为有力的研究助手,然而面对承载着文化意涵与历史记忆的人文学科,却仍旧表现得捉襟见肘。 究其原因,AI当前最缺乏的并非工具性能力,而是对人类智慧与文化的理解能力——这正是人文学科探究的核心。
6/12/2025 9:03:00 AM

谷歌流量急坠归0?核心员工被「自愿离职」,30年搜索帝国崩塌

搜索,真的要完了吗? 谷歌搜索的流量终结比预期来得更快! 令人始料未及!
6/12/2025 9:00:00 AM

端到端GUI智能体首次实现“犯错-反思-修正”闭环,模拟人类认知全过程

端到端多模态GUI智能体有了“自我反思”能力! 南洋理工大学MMLab团队提出框架GUI-Reflection。 随着多模态大模型的发展,端到端GUI智能体在手机、电脑等设备上的自动化任务中展示出巨大潜力。
6/12/2025 8:58:00 AM

MSRA清北推出强化预训练!取代传统自监督,14B模型媲美32B

“预测下一个token”——这个支撑LLM的核心训练机制,正在被强化学习颠覆。 微软亚洲研究院(MSRA)联合清华大学、北京大学提出全新预训练范式RPT(强化预训练),首次将强化学习深度融入预训练阶段,让模型在预测每个token前都能先“动脑推理”,并根据推理正确性获得奖励。 传统预训练依赖海量文本进行自监督学习,模型通过简单预测下一个token建立语言能力,作者将之比喻为一块蛋糕胚,而RL只是作为上面点缀的一颗樱桃。
6/12/2025 8:46:00 AM

简易实用项目攻略:如何创建集文档问答、摘要、转录、翻译与提取于一身的AI门户

译者 | 核子可乐审校 | 重楼如今AI虽已全面普及,但多数职场人士仍难以统一运用各类互不相关的工具:一会需要使用聊天机器人、一会需要将文本复制到摘要器内,再加上会议转录和翻译,将本应顺畅的工作流程拆分得零散琐碎。 所以问题来了:为什么不能把各项AI功能集中起来? 为此我决定构建单一Web门户,供用户随时上传文档、提问、获取摘要、转录会议内容、翻译文件,甚至从PDF中提取表格等。
6/12/2025 8:24:57 AM
核子可乐