理论
Gemini 2.5编程全球霸榜,谷歌重回AI王座!神秘模型曝光,奥特曼迎战
谷歌,彻底打了一场漂亮的翻身仗。 aider多语言编程基准测试显示,Gemini 2.5 Pro近出世半个多月,编程能力已经是全球第一,口碑一众超越Claude 3.7 Sonnet。 不仅如此,除了DeepSeek,它的性价比也是最优的,成本低至6美金。
4/15/2025 9:03:00 AM
新智元
推理AI「脑补」成瘾,废话拉满!马里兰华人学霸揭开内幕
推理模型越来越成为主流了。 像GPT-4.5这样没有推理功能的大语言模型则越来越少见,就连OpenAI自身也将重心放到了推理模型o系列上面。 原因在于推理模型通过在回答之前先「思考」,从而能够获得更加优秀的效果。
4/15/2025 9:00:00 AM
新智元
单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点
单张图直接就能生成可编辑的CAD工程文件! 来自魔芯科技、NTU等的研究人员提出图生3D新框架,名为CADCrafter。 CADCrafter和过去得到网格(Mesh)或3D高斯泼溅(3DGS)的图生3D方法大不相同。
4/15/2025 8:57:00 AM
量子位
DeepSeek公布了推理引擎开源路径,OpenAI也将开始连续一周发布
DeepSeek 默默地在自己的 open-infra-index 库中发布了一份题为「开源 DeepSeek 推理引擎的路径」的文档,宣布将开源自己的内部推理引擎(internal inference engine)并与开源社区建立更广泛的合作。 有意思的是,该文档发布之后不久就经历了两次修改,对一些措辞和表述进行了更加中立和宽泛的处理。 在其中一次修改中,DeepSeek 提到了与 SGLang 和 vLLM 项目的合作关系,但这两个具体的项目名称在新版本中被替换成了「现有的开源项目」。
4/15/2025 8:50:01 AM
机器之心
AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明
就在刚刚,AI完成了首个非平凡研究数学证明! 完成这项研究的,是美国纽约布鲁克海文国家实验室凝聚态物理与材料科学分部的一位华人学者Weiguo Yin。 论文地址:,作者在一维J_1-J_2 q态Potts模型,通过引入最大对称子空间(MSS)方法,对其精确求解。
4/15/2025 8:50:00 AM
新智元
CIO在AI安全方面最大的盲点是什么?
AI竞赛正在如火如荼地进行,但急于求成的企业可能会发现自己陷入了安全盲点。 创新与安全之间的紧张关系由来已久,创新者和CIO希望凭借新技术开辟道路,CISO和其他安全负责人则希望采取更为审慎的方法来降低风险。 近年来,随着AI的崛起,人们经常用“军备竞赛”来形容其发展态势,紧迫感切实存在,但那些有安全意识的人所担心的风险仍然存在。
4/15/2025 7:30:00 AM
Carrie
GPT-4.1深夜登场,中科大校友领队!百万上下文编程惊人,GPT-4.5三个月后淘汰
就在刚刚,OpenAI专为开发者重磅推出了三款全新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano! 它们均拥有最高100万Token的超大上下文窗口,在代码、指令跟随等核心能力上全面超越GPT-4o及GPT-4o mini,并且知识截止日期也已更新至2024年6月。 值得注意的是,GPT‑4.1系列将仅通过API提供,并已向所有开发者开放。
4/15/2025 7:26:16 AM
新智元
专访GMI Cloud创始人Alex Yeh:算力即未来,不做AI时代的旁观者
嘉宾 | Alex作者 | 云昭Alex Yeh回忆过去两年半的创业历程,用“一头深海中求生的鲨鱼”来形容GMI Cloud这家新创公司。 海水中礁石隐藏在未知的角落,绕开礁石继续前行则成为了这条鲨鱼的常态。 Alex Yeh是AI Native Cloud 提供商 GMI Cloud 的创始人兼CEO。
4/15/2025 6:45:34 AM
云昭
ICLR高分论文险遭拒,只因未引用「造假」研究???作者怒喷:对方论文用Claude生成
有在离谱。 高分论文因为没有引用先前的研究而被ICLR拒稿了? 图片于是作者提起上诉,审稿主席们推翻之前的决定,最终论文被接收并选为Spotlight。
4/15/2025 4:00:00 AM
图灵奖得主LeCun:人类智能不是通用智能,下一代AI可能基于非生成式
在最新一档播客节目中,Meta首席AI科学家&图灵奖得主LeCun发表了如上观点。 他表示,AGI(通用人工智能)一词非常具有误导性,但人类智能本质是非通用的,它非常专业。 更有意思的是,当大家都在谈论生成式AI时,他却凭借直觉大胆预测:下一代AI的突破可能基于非生成式。
4/15/2025 3:43:00 AM
GitHub中国IP访问崩了又复活!OpenAI API新政恐锁死GPT-5?
昨日,众多网友上GitHub,竟发现无法访问了。 一时间,GitHub无法访问在国内开发者中炸锅了。 如今,终于等到了官方回应——对于那些未登录的用户,暂时封锁访问,主要是因为一项带来意外影响的配置更改。
4/15/2025 3:20:00 AM
WOT大会7月北京启幕!12大AI主题诚征议题和嘉宾
WOT全球人工智能技术峰会是由51CTO开创的面向人工智能领域的高端技术会议品牌,它与另一大会品牌WOT全球技术创新大会一道,自2012年首次举办以来,历时十余年沉淀,累计吸引超过万名技术人员现场参与,同时吸引了数百家国内外知名科技企业和行业龙头、近千位技术领军人物深度合作。 ChatGPT引爆的热潮没有丝毫减缓之势,而DeepSeek又给这一热度添了一把火。 伴随大模型的快速迭代、持续演进,生成式AI技术从理念到实践,从应用落地到产品百花齐放,创新速度之快令人瞩目,这也正是WOT全球人工智能技术峰会2025召开的目的和初衷。
4/14/2025 1:55:31 PM
更长思维并不等于更强推理性能,强化学习可以很简洁
今天早些时候,著名研究者和技术作家 Sebastian Raschka 发布了一条推文,解读了一篇来自 Wand AI 的强化学习研究,其中分析了推理模型生成较长响应的原因。 他写到:「众所周知,推理模型通常会生成较长的响应,这会增加计算成本。 现在,这篇新论文表明,这种行为源于强化学习的训练过程,而并非更高的准确度实际需要更长的答案。
4/14/2025 1:46:00 PM
机器之心
官方回应!微软旗下GitHub“崩了”系配置变更导致的意外,并非屏蔽中国IP!现已恢复
上周末,一些网友发现微软旗下的代码托管平台 GitHub无法访问,疑似屏蔽了中国IP! 这一消息立即在多个平台被热议,有人联想到最近微软旗下的微创公司刚刚停止了中国区运营,表示“微软最近动作不断”。 还好,官方已经进行回应,表示暂时的封锁访问是由一项配置更改带来的意外。
4/14/2025 12:06:48 PM
Agno框架介绍:用于构建多模态智能体的轻量库
译者 | 核子可乐审校 | 重楼在开发代理式AI时,开发者往往需要在速度、灵活性和资源利用率间反复权衡。 本文将向大家介绍Agno——一款用于构建多模态智能体的轻量化框架。 其速度号称比LangGraph快上万倍,内存使用量则仅为1/50。
4/14/2025 10:58:53 AM
核子可乐
谢赛宁等新作上线,多模态理解生成大一统!思路竟与GPT-4o相似?
在不久之前机器之心报道文章《3D领域DeepSeek「源神」启动! 国产明星创业公司,一口气开源八大项目》中,我们曾介绍到,国内专注于构建通用 3D 大模型的创业公司 VAST 将持续开源一系列 3D 生成项目。 近日,新的开源项目它来了,包括针对任意三维模型生成完整可编辑部件的 HoloPart 与通用自动绑定框架 UniRig。
4/14/2025 9:38:00 AM
新智元
苹果AI首秀,竟然只有跑马灯是真的!长文揭秘苹果彻底搞砸AI
去年6月,苹果展示了AI版Siri。 随后的几个月,Siri团队对实现这些功能的基础技术方案摇摆不定。 据一位知情的前苹果员工透露,团队曾计划打造一小一大两种模型,分别命名为「迷你鼠」(Mini Mouse)和「大力鼠」(Mighty Mouse)。
4/14/2025 9:35:00 AM
新智元
最强32B中文推理大模型易主:开源免费商用,1/20 DeepSeek-R1参数量SOTA,权重代码数据集全开源
千亿参数内最强推理大模型,刚刚易主了。 32B——DeepSeek-R1的1/20参数量;免费商用;且全面开源——模型权重、训练数据集和完整训练代码,都开源了。 这就是刚刚亮相的Skywork-OR1 (Open Reasoner 1)系列模型——通用32B尺寸(Skywork-OR1-32B)完全超越同规模阿里QwQ-32B;代码生成媲美DeepSeek-R1,但性价比更高。
4/14/2025 9:27:00 AM
量子位
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
蛋白质
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
字节跳动
工具
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉