AI
AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型
多模态大语言模型(MLLM)在具身智能和自动驾驶“端到端”方案中的应用日益增多,但它们真的准备好理解复杂的物理世界了吗? 上海交通大学联合中国地质大学、南洋理工大学、智源研究院以及斯坦福大学的研究团队推出首个多模态大模型(MLLM)时空智能评测基准STI-Bench(Spatial-Temporal Intelligence Benchmark),向当前最先进的多模态大语言模型发起了关于精确空间时间理解的严峻挑战。 结果显示,即便是Gemini-2.5-Pro、GPT-4o、Claude-3.7-Sonnet、Qwen 2.5 VL等当前最强的多模态大模型,在需要定量分析真实世界空间关系和动态变化的任务上,表现并不尽人意。
4/15/2025 12:14:10 PM
量子位
MCP 协议深度解读:技术创新正以前所未有的速度突破
作者 | rianOpenAI 官宣全面支持MCP协议,至此MCP已得到业界广泛的认可。 正逐步成为AI应用架构的基础协议。 做为AI应用架构的USB-C,MCP原理是怎样的?
4/15/2025 10:16:12 AM
腾讯技术工程
GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比 关注前沿科技 量子位 2025年04月15日 09:44
4.1与4.5孰大? OpenAI刚刚给出答案:发布GPT-4.1,比GPT-4.5强的那种。 新模型系列更新,一共带来三个版本:GPT-4.1,GPT-4.1 mini、GPT-4.1 nano——与通常中杯大杯超大杯的设置不同,这回翻译过来,是中杯、小杯、超小杯。
4/15/2025 9:50:06 AM
量子位
中国初创芯片登Nature:比英伟达A10快500倍!自研光电混合技术
来自国内的光电混合芯片技术,登上最新顶刊Nature! 这次的成果主要聚焦在了自主研发的光子计算处理器——PACE(Photonic Arithmetic Computing Engine)。 简单来说,PACE是一种基于光电混合的架构,它通过光执行矩阵向量乘法,可以实现超低延迟和高能效的计算。
4/15/2025 9:24:00 AM
量子位
一套算法控制机器人军团!纯模拟环境强化学习,Figure学会像人一样走路
现在训练机器人,都不需要真实数据了? 刚刚,Figure提出了一种全新的基于RL的端到端网络。 只需要在纯模拟环境中进行训练,用几个小时生成模拟数据,就能让Figure 02像人类一样自然行走了!
4/15/2025 9:15:00 AM
新智元
Gemini 2.5编程全球霸榜,谷歌重回AI王座!神秘模型曝光,奥特曼迎战
谷歌,彻底打了一场漂亮的翻身仗。 aider多语言编程基准测试显示,Gemini 2.5 Pro近出世半个多月,编程能力已经是全球第一,口碑一众超越Claude 3.7 Sonnet。 不仅如此,除了DeepSeek,它的性价比也是最优的,成本低至6美金。
4/15/2025 9:03:00 AM
新智元
智谱发布新一代开源 AI 模型 GLM-4-32B-0414 系列,效果比肩 GPT 系列和 DeepSeek-V3 / R1
智谱昨日(4 月 14 日)发布博文,宣布推出新一代 GLM-4-32B-0414 系列模型,320 亿参数,效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列,且支持非常友好的本地部署特性。
4/15/2025 9:01:31 AM
故渊
推理AI「脑补」成瘾,废话拉满!马里兰华人学霸揭开内幕
推理模型越来越成为主流了。 像GPT-4.5这样没有推理功能的大语言模型则越来越少见,就连OpenAI自身也将重心放到了推理模型o系列上面。 原因在于推理模型通过在回答之前先「思考」,从而能够获得更加优秀的效果。
4/15/2025 9:00:00 AM
新智元
单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点
单张图直接就能生成可编辑的CAD工程文件! 来自魔芯科技、NTU等的研究人员提出图生3D新框架,名为CADCrafter。 CADCrafter和过去得到网格(Mesh)或3D高斯泼溅(3DGS)的图生3D方法大不相同。
4/15/2025 8:57:00 AM
量子位
DeepSeek公布了推理引擎开源路径,OpenAI也将开始连续一周发布
DeepSeek 默默地在自己的 open-infra-index 库中发布了一份题为「开源 DeepSeek 推理引擎的路径」的文档,宣布将开源自己的内部推理引擎(internal inference engine)并与开源社区建立更广泛的合作。 有意思的是,该文档发布之后不久就经历了两次修改,对一些措辞和表述进行了更加中立和宽泛的处理。 在其中一次修改中,DeepSeek 提到了与 SGLang 和 vLLM 项目的合作关系,但这两个具体的项目名称在新版本中被替换成了「现有的开源项目」。
4/15/2025 8:50:01 AM
机器之心
AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明
就在刚刚,AI完成了首个非平凡研究数学证明! 完成这项研究的,是美国纽约布鲁克海文国家实验室凝聚态物理与材料科学分部的一位华人学者Weiguo Yin。 论文地址:,作者在一维J_1-J_2 q态Potts模型,通过引入最大对称子空间(MSS)方法,对其精确求解。
4/15/2025 8:50:00 AM
新智元
CIO在AI安全方面最大的盲点是什么?
AI竞赛正在如火如荼地进行,但急于求成的企业可能会发现自己陷入了安全盲点。 创新与安全之间的紧张关系由来已久,创新者和CIO希望凭借新技术开辟道路,CISO和其他安全负责人则希望采取更为审慎的方法来降低风险。 近年来,随着AI的崛起,人们经常用“军备竞赛”来形容其发展态势,紧迫感切实存在,但那些有安全意识的人所担心的风险仍然存在。
4/15/2025 7:30:00 AM
Carrie
苹果揭秘 Apple 智能开发:差分隐私 + 合成数据,隐私原则贯穿 AI 技术演进
苹果公司昨日(4 月 14 日)发布博文,披露其 AI 隐私保护核心技术细节,重点介绍差分隐私和合成数据在 Apple Intelligence 中的应用。
4/15/2025 7:23:12 AM
故渊
专访GMI Cloud创始人Alex Yeh:算力即未来,不做AI时代的旁观者
嘉宾 | Alex作者 | 云昭Alex Yeh回忆过去两年半的创业历程,用“一头深海中求生的鲨鱼”来形容GMI Cloud这家新创公司。 海水中礁石隐藏在未知的角落,绕开礁石继续前行则成为了这条鲨鱼的常态。 Alex Yeh是AI Native Cloud 提供商 GMI Cloud 的创始人兼CEO。
4/15/2025 6:45:34 AM
云昭
图灵奖得主LeCun:人类智能不是通用智能,下一代AI可能基于非生成式
在最新一档播客节目中,Meta首席AI科学家&图灵奖得主LeCun发表了如上观点。 他表示,AGI(通用人工智能)一词非常具有误导性,但人类智能本质是非通用的,它非常专业。 更有意思的是,当大家都在谈论生成式AI时,他却凭借直觉大胆预测:下一代AI的突破可能基于非生成式。
4/15/2025 3:43:00 AM
IT之家采访联发科高管:AI 智能体应用碎片化需树立“灯塔效应”
4 月 11 日,联发科在深圳举行了以“AI 随芯应用无界”为主题的天玑开发者大会 2025(MDDC 2025),大会过程中,,IT之家参加了联发科高管的采访
4/14/2025 8:22:02 PM
汐元
微软AI收入年化达130亿美元,计划投资800亿美元引领科技潮流
微软公司最近在人工智能(AI)领域取得了显著进展,其年化收入已达到130亿美元,并宣布将计划投资高达800亿美元以进一步扩展其 AI 业务。 这一消息不仅显示出微软在 AI 领域的雄心壮志,也反映了该公司在科技创新和市场竞争中的积极布局。 随着全球经济逐渐受到 AI 技术的影响,投资者对这一领域的关注也愈发浓厚。
4/14/2025 12:01:17 PM
AI在线
前谷歌 CEO 向国会警告:超级智能AI将消耗 99% 的电力资源
近日,前谷歌首席执行官埃里克・施密特在国会能源与商业委员会的听证发表了引人关注的言论。 他指出,未来人工智能(AI)将消耗全球99% 的电力,这一说法引发了与会者的广泛关注和讨论。 施密特表示,当前技术行业对电力的需求正在快速增长,预计将从目前的3% 飙升至99%。
4/14/2025 12:01:17 PM
AI在线
资讯热榜
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
Former DeepSeek executive secretly starts new AI Agent project, already backed by top VC
腾讯LeVo来袭!媲美Suno 4.5的AI唱歌模型,支持零样本音色克隆
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
OpenAI Upgrades ChatGPT Search Functionality to Provide More Precise and Smarter Responses
Luo Yonghao's digital person achieves success in its first live broadcast on Baidu e-commerce: GMV exceeds that of a real person in an hour in 26 minutes
MiniMax-M1开源!1M超长上下文推理,AI新王者仅53万美元打造!
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
训练
智能体
神经网络
3D
研究
苹果
生成
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
华为
LLM
搜索
百度
xAI
场景
大语言模型
预测
伟达
字节跳动
深度学习
Agent
Transformer
工具
视觉
模态
神器推荐
RAG
具身智能
文本
大型语言模型
LLaMA
算力
Copilot
API
驾驶
应用
架构