理论
Bengio亲手戳穿CoT神话!LLM推理是假象,25%顶会论文遭打脸
图灵奖大牛Bengio新作上线了! 这篇由牛津、谷歌DeepMind、Mila多家机构联手论文指出——思维链并非可解释性。 这一观点彻底打破了许多人的认知:CoT看似一步步给出答案,实则并不一定是其真实的推理过程。
7/3/2025 1:45:00 AM
新智元
李飞飞最新访谈:没有空间智能,AGI就不完整
这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。 不过她有自己的表述,从进入人工智能领域开始,她就确定了她终身奋斗的梦想:让智能体能够讲述世界的故事。 而这,离不开空间智能。
7/2/2025 6:15:02 PM
Grok4未上线源码先泄露!马斯克的Code模型被实锤!将深度对齐开发者编程习惯,能否逆袭前代硬伤?再获融资百亿,算力多到用不完
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Grok 4真的要来了! 马斯克预告多次的Grok 3.5跳票,直接给大家端上4.0的更强版本。 为了这一次发布能够给AI圈一点震撼,Grok团队也是真的够拼,又一次把帐篷搭进了办公室。
7/2/2025 4:53:28 PM
伊风
Grok 4源代码刚刚泄露!上线倒计时,马斯克xAI估值破1130亿,大模型要变天
突发消息:Grok 4即将上线! 与此同时,xAI再度获得百亿美元融资,估值已经直冲1130亿。 马斯克的AI帝国,再度以可怕的规模扩张。
7/2/2025 2:42:03 PM
9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA | 智谱开源
如果一个视觉语言模型(VLM)只会“看”,那真的是已经不够看的了。 因为现在真实世界的任务简直不要太复杂,要想让AI干点实事儿,光有多模态还不够,必须还得有深度思考的强推理能力。 而就在刚刚,智谱发布并开源了一个仅9B大小的模型——GLM-4.1V-9B-Thinking,在28项评测中一举拿下23个SOTA!
7/2/2025 2:39:29 PM
Prompt格局小了,上下文工程称王!Shopify CEO提上下文工程,大神Karpathy一众创业者狂喊+1,网友:都是巫术
编辑 | 云昭Prompt工程又“失效”了? ! 之前是各种白领对它“喊打喊杀”,担心它取代自己的工作,后来的口风就变成了“大模型强大到不再需要Prompt工程了”,现在圈里又有谷歌的大佬抛出了神断言,让评论区炸锅的那种。
7/2/2025 12:10:50 PM
云昭
小扎狂砸3亿美金薪酬包!奥特曼放狠话:传教士终将打败雇佣兵
「传教士将打败雇佣兵」! 在小扎挖走近十位OpenAI研究院后,奥特曼在内部备忘录中,写下了这句提振士气的话。 这张在全网疯传的图片中,OpenAI多数大神纷纷加入Meta,华人研究员更是占据了半壁江山。
7/2/2025 9:56:09 AM
震惊!OpenAI创始人透露:这是人类历史上创业最好的时代,但99%的人都理解错了
Hi,大家好,我叫秋水,当前专注于 AI Agent(智能体)。 你有没有想过,为什么有些人能在短短几年内从默默无闻变成改变世界的人? 近期,我看到了OpenAI的创始人Sam Altman的访谈,这个34岁就创造出ChatGPT、估值千亿美元公司的男人,说了一句让所有人震惊的话:"这是人类历史上,创业最好的时代!
7/2/2025 9:56:06 AM
秋水
开源端到端语音大模型:直接从原始音频输入,生成语音输出
目前,大模型LLMs能胜任知识问答、代码辅助等多种任务,但传统模型大多只能输出文本,无法直接生成自然语音,这让人机音频交互不够顺畅。 要知道,人类交流和感知环境可不只是靠文字,语音里藏着音色、情感、语调等丰富信息,其他音频也包含着现实场景的关键信息。 所以,能根据语音或音频输入直接回应的音频语言模型就很重要,也是迈向AGI的关键一步。
7/2/2025 9:46:30 AM
比10年专业医生准4倍!微软发布突破性医疗AI系统
微软首席执行官Satya Nadella在社交平台分享了,微软最新发布的突破性医疗AI系统MAI-DxO。 MAI-DxO最大技术创新在于其模型无关的设计,使其能够适配不同厂商、不同能力的语言模型,并普遍提升它们的诊断性能。 并且能模拟真实医生的诊断流程,比专业医生的准确率更高。
7/2/2025 9:43:13 AM
亚马逊宣布全球已部署100万台机器人 新AI模型助力物流效率提升
据外媒报道,亚马逊近日宣布其全球机器人部署数量已达 100 万台,标志着该公司在自动化与人工智能领域实现重大突破。 与此同时,亚马逊推出名为 DeepFleet 的生成式 AI 基础模型,将进一步提升物流网络运行效率。 资料显示,作为全球最大的移动机器人制造商和运营商,亚马逊自2012 年起持续推进机器人化进程,目前已在全球 300 多个设施中部署机器人系统。
7/2/2025 9:37:02 AM
深度解析 MEM1:开启智能体长时序高效交互之门
大家好,我是肆〇柒。 相信大家在落地AI应用的时候,对长上下文的处理时所遇到的挑战,都深有感触。 大型语言模型(LLM)于单轮任务中表现卓越,然而现实应用场景日益复杂,多轮交互需求剧增。
7/2/2025 9:33:54 AM
肆零柒
Cursor也挖人了:Claude Code开发主管和产品经理被一锅端
编程神器Cursor的母公司Anysphere也开始挖人了Cursor这次挖到了合作伙伴Anthropic的两名前核心高管:原“Claude Code”项目开发负责人Boris Cherny将出任首席架构师兼工程主管,原项目产品经理Cat Wu将担任产品负责人Boris Cherny 2024年9月加入Anthropic,入职还不到一年,之前在小扎公司Meta 干了六年多,任职首席软件工程师, Instagram 的服务器架构和开发基础设施主管, Meta 的代码质量主管,毕业于美国加州大学圣迭戈分校,学的是经济学Cat Wu全名Catherine Wu,2024年8月加入Anthropic,擅长构建高可靠、可解释、可控制的人工智能系统,本科毕业于普林斯顿大学,专业计算机科学,加入Anthropic之前有多段不同领域工作实习经历,最长两年,比如在谷歌实习任职软件工程师,在J.P. 摩根实习任职交易员,在Alexandr Wang公司scale AI作为作为产品经理任职两年此番“挖角”或将使两家公司的合作关系变得微妙——毕竟Cursor的大部分AI功能都由Anthropic提供技术支持。 目前,Anthropic的年化收入已高达40亿美元,而Cursor的年度经常性收入也已突破5亿美元AI编程领域现在竞争非常激烈,下面给大家梳理一下,如今,AI编程领域的战火已蔓延至四大战场:1.
7/2/2025 9:29:34 AM
不用AI编程就滚蛋!这家公司CEO一封邮件把程序员都惹毛了
想象一下,你的老板突然在全员邮件里宣布:从下个月开始,公司每月投入5万美元购买AI编程工具,所有不使用"Vibe Coding"的程序员都要接受绩效改进。 这不是假设。 这是一家真实公司的CEO刚刚发出的邮件内容。
7/2/2025 9:25:01 AM
阿丸笔记
ICML 2025 Spotlight | 清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式,刷新图像生成SOTA
文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。 该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。
7/2/2025 9:21:30 AM
大模型时代,通用视觉模型将何去何从?
过去几年,通用视觉模型(Vision Generalist Model,简称 VGM)曾是计算机视觉领域的研究热点。 它们试图构建统一的架构,能够处理图像、点云、视频等多种视觉模态输入,以及分类、检测、分割等多样的下游任务,向着「视觉模型大一统」的目标迈进。 然而,随着大语言模型 LLM 的迅猛发展,研究热点已经悄然发生转移。
7/2/2025 9:17:13 AM
Meta“1亿美元年薪”震荡硅谷!奥特曼回应:总有人唯利是图,而且都算不上TOP
疯狂,太疯狂。 这两天,硅谷乃至全球AI领域的注意力都被Meta老板扎克伯克带走了,毕竟也不是谁都能boss直聘,一举挖走8名OpenAI核心员工。 更何况其中大部分,还是以聪明能干吃苦耐劳著称的华人研究员。
7/2/2025 9:13:56 AM
华为又开源了个大的:超大规模MoE推理秘籍
超大规模MoE模型(如DeepSeek),到底该怎么推理才能做到又快又稳。 现在,这个问题似乎已经有了标准答案——华为一个新项目,直接把推理超大规模MoE背后的架构、技术和代码,统统给开源了! 这个新开源项目名叫Omni-Infer,整体来看,它对于企业用户来说是非常利好的。
7/2/2025 8:55:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉