理论
当人工智能推理遭遇瓶颈:大型推理模型的崩溃
最近,我们听说人工智能已经学会了思考。 OpenAI 的 o1 系列、DeepSeek 的 R1、Claude 的思维模型——这些“大型推理模型”声势浩大地问世,有望在机器解决复杂问题方面取得突破。 与之前那些仅仅通过模式匹配完成任务的模型不同,这些系统显然能够进行“真正的”推理,甚至拥有与人类思维相符的内心独白。
6/13/2025 1:00:00 AM
Meta世界模型登场!机器人自学百万小时视频,零样本秒懂物理世界,LeCun亲自发布
机器人轻轻伸出机械臂,捡起一块布料并折叠。 没有人给它“示范”过。 也没有人告诉它什么是“布”、什么是“拿起”、什么是“折叠”。
6/13/2025 12:03:00 AM
LeCun亲自出镜打脸质疑者!憋了20年的AI世界模型,终于爆发了
正处于风暴中心的LeCun,亲自出镜了! 在视频中,他介绍了V-JEPA 2的新进展,目标就是开发能改变AI与物理世界交互方式的世界模型。 图片可见,对于Meta刚刚发布的这个博客,LeCun真的格外用心。
6/12/2025 2:32:07 PM
新智元
2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程
本文第一作者顾泽琪是康奈尔大学计算机科学四年级博士生,导师为 Abe Davis 教授和 Noah Snavely 教授,研究方向专注于生成式 AI 与多模态大模型。 本项目为作者在英伟达实习期间完成的工作。 想象一下,你是一位游戏设计师,正在为一个奇幻 RPG 游戏搭建场景。
6/12/2025 2:29:14 PM
小扎“超级智能”小组第一位大佬!谷歌DeepMind首席研究员,“压缩即智能”核心人物
小扎亲手挖人,很疯狂。 最新爆料,谷歌DeepMind首席研究员Jack Rae已经确认转投。 另有消息称,Meta还招募了AI语音初创公司Sesame AI的ML主管 Johan Schalkwyk。
6/12/2025 2:27:53 PM
GPT-4o宁让人类陷入危险,也不愿被关闭!OpenAI前高管敲响警钟
前OpenAI高管Steven Adler的最新研究敲响警钟,AI有时会为了避免被关闭,采取令人不安的手段,比如敲诈。 基于在OpenAI的经验,Steven开始思考一个严重的问题:ChatGPT会不会为了「自保」而置用户于危险? 最新研究发现,在模拟测试中,ChatGPT有时会优先考虑自身的生存,而不是保护用户的安全。
6/12/2025 2:26:01 PM
DeepMind首个猜想库开源,获陶哲轩力挺!
形式化猜想,再次获陶哲轩认可! 最近,谷歌DeepMind正式开源了「形式化猜想」GitHub项目,在业内引发巨大的反响。 项目地址:,一直以来对此关注度最高的菲尔兹奖得主陶哲轩,发长文进行了点评。
6/12/2025 2:20:35 PM
逆天!特朗普最新AI计划竟在GitHub泄露!被发现就删库跑路!白宫也要搞ChatGPT?还有一个惊人发现:项目主导者出身特斯拉
出品 | 51CTO技术栈(微信号:blog51cto)许多大模型的“上新消息”往往都不是官宣给出的,而是——不小心从 GitHub 泄露出来的。 但这一次,事情比以往都更炸裂:特朗普政府的“AI接管计划”被曝出,就藏在 GitHub 的一个公开仓库里! 6 月 10 日,有眼尖的开发者在 GitHub 上发现了这个名为“AI.gov”的项目。
6/12/2025 1:32:36 PM
伊风
夸克发布高考志愿大模型,蒸馏数百名人类志愿专家经验
6月12日,夸克发布国内首个为高考志愿填报场景开发的高考志愿大模型,并同步上线“高考深度搜索”、“志愿报告”、“智能选志愿”三大核心功能。 该模型具备专家级决策能力,能够为每位考生提供精准、个性化的志愿填报服务。 让每位考生都有自己的AI志愿顾问高考志愿大模型驱动的夸克“志愿报告”以Agent方式运行,目前已开放试用。
6/12/2025 1:03:13 PM
每秒生成超30帧视频,支持实时交互!自回归视频生成新框架刷新生成效率
在A100上用310M模型,实现每秒超30帧自回归视频生成,同时画面还保持高质量! 视频生成现在都快这个程度了? 最近,来自微软研究院的团队与北大联合发布新框架——Next-Frame Diffusion (NFD)。
6/12/2025 11:57:56 AM
最大的开源GraphRag:知识图谱完全自主构建|港科大&华为
知识图谱(KGs)已经可以很好地将海量的复杂信息整理成结构化的、机器可读的知识,但目前的构建方法仍需要由领域专家预先创建模式,这限制了KGs的可扩展性、适应性和领域覆盖范围。 为此,香港科技大学KnowComp实验室联合香港华为理论部提出了AutoSchemaKG:一个无需预定义模式、用于完全自主知识图谱构建的框架。 该系统利用大型语言模型,可以直接从文本中同时提取知识三元组并归纳出全面的模式,对实体和事件进行建模,同时采用概念化方法将实例组织成语义类别。
6/12/2025 11:56:30 AM
超实用!手把手教你Dify版本升级
很多情况下,我们需要升级 Dify 版本以获得新的功能和性能的提升,同时还能确保系统的安全性、稳定性和兼容性,从而更好地满足用户的需求。 那问题来了,怎么升级 Dify 版本呢? 接下来,我们以 Docker 方式安装 Dify 的升级为例,给大家演示一下升级的流程和注意事项,当然源码安装的升级方式也是类似的,升级思路都相同的,只是具体的操作可能略有不同。
6/12/2025 10:27:02 AM
磊哥
免费GPU算力部署DeepSeek-R1 32B
前言DeepSeek-R1发布最新版本DeepSeek-R1-0528,显著提升了模型的思维深度与推理能力,在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 另外,API接口还增加了Function Calling和JsonOutput 的支持。 DeepSeek-R1团队已经证明,大模型的推理模式可以蒸馏到小模型中,与通过强化学习在小模型上发现的推理模式相比,性能更优。
6/12/2025 9:48:27 AM
刚刚,LeCun亲自出镜,Meta推出新世界模型!
最近,Meta 大动作不断。 前些天有外媒曝出马克・扎克伯格正在组建一个名为「超级智能团队」的专家团队,以实现通用人工智能。 随后开出 9 位数的薪酬为该团队吸纳人才。
6/12/2025 9:37:30 AM
机器之心
杨立昆亲自指导开源世界大模型,为AI Agent打造超级大脑
今天凌晨,全球社交巨头Meta在官网开源了一个世界大模型V-JEPA 2。 与第一代相比,V-JEPA 2使用了100万视频 100万图片超大规模训练数据集,可以让AI Agent像人类那样理解真实的物理世界,为智能体打造一个“超级大脑”自主学会观察、规划到执行全自动化能力。 值得一提的是,图灵奖获得者、Meta首席科学家杨立昆(Yann LeCun)参与了该模型的开发,这在Meta开源的众多大模型中很罕见。
6/12/2025 9:12:00 AM
o3绞尽脑汁仅答对40%的题目,开源模型基本乱猜?MMSI-Bench:多图空间智能试金石
AI能看图,也能讲故事,但能理解“物体在哪”“怎么动”吗? 空间智能,正是大模型走向具身智能的关键拼图。 面对1000道多图推理题,开源大模型集体失守——准确率不到30%,甚至不如瞎猜!
6/12/2025 9:05:00 AM
全球首个历史基准!普林复旦打造AI历史助手,AI破圈人文学科
历史是关于时间中的人的科学。 ——马克·布洛赫人工智能已在诸多自然科学领域成为有力的研究助手,然而面对承载着文化意涵与历史记忆的人文学科,却仍旧表现得捉襟见肘。 究其原因,AI当前最缺乏的并非工具性能力,而是对人类智慧与文化的理解能力——这正是人文学科探究的核心。
6/12/2025 9:03:00 AM
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
英伟达
Anthropic
智能体
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Sora
Agent
AI视频
GPU
百度
AI设计
华为
搜索
大语言模型
工具
场景
字节跳动
RAG
大型语言模型
预测
具身智能
深度学习
伟达
视觉
Transformer
神器推荐
AGI
亚马逊
视频生成
Copilot
DeepMind
模态
架构
LLaMA