AI
世界模型再进化!博士AdaWM:自适应世界模型规划新SOTA
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接::基于自适应世界模型的自动驾驶规划。 基于世界模型的强化学习(RL)已经成为一种有前景的自动驾驶方法,它学习潜在动态模型并且用其训练规划策略。
1/26/2025 11:00:00 AM
自动驾驶专栏
重构的道法术器:探讨AI智能对工具的影响
经过影片出租店的完整演练,对这样一个如麻雀般完整而小的遗留项目展开重构,使得我们对重构建立了一个整体的印象,也有利于我们将前面介绍的各种重构知识串联起来,现在,有必要对整个重构做一次复盘。 为了帮助大家更好地理解重构,我认为可以从道、法、术、器这四个层次做一番总结。 图片道是万物变迁循环中亘古不变的规律,是自然环境、事物的自然规律和发展方向。
1/26/2025 10:12:13 AM
张逸少
人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题,DeepSeek竟是王者
捍卫「人类智慧」最后一战!刚刚,Scale AI和Center for AI Safety(CAIS)公布了「人类最后一场考试」结果! 新基准全称「人类最后一次考试」(Humanity’s Last Exam),简称「HLM」,包含3000个问题,由数百位领域专家开发,用于追寻人类知识推理的边界。 目前,最好的模型,准确率也小于10%,而且自信「过头」。
1/26/2025 9:45:00 AM
新智元
曝DeepSeek让Llama4未发布已落后!小扎坐不住了:2025预算4000亿起步,年底AI算力将达130万卡
Meta这次真的坐不住了,计划在AI上继续加码! 匿名员工爆料,黑马DeepSeek的出现,让Llama 4还未发布就已经落后,Meta慌了。 就在这一消息沸沸扬扬时,小扎放出消息,2025年继续扩大AI投资。
1/26/2025 9:00:00 AM
量子位
DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看
“神秘东方力量”DeepSeek给硅谷带来的影响,还在不断泛起涟漪——刚刚,DeepSeek-R1跻身大模型竞技榜前三。 以开源、便宜20倍的“身价”与ChatGPT-4o(2024.11.20)并列。 在复杂提示词/风格控制榜单上,R1位列第一。
1/26/2025 8:00:00 AM
量子位
CS本科就业寒冬来袭!名校24届就业率被曝不足50%,企业宁用AI不招应届生
前段时间,UC伯克利CS本科生毕业即失业,以及焦虑的AI博士们在顶会现场后悔读博的故事,曾引起了业界的广泛关注。 今天,一条知乎热搜,再次引起了全网热议。 (图片经过处理)有传言称,某高校计算机学院的24届本科生,就业不足50%,低于全校平均水平。
1/26/2025 7:45:00 AM
新智元
让AI成为你的React代码专家的3个秘诀
深夜,我盯着眼前庞大的React项目,一行行代码仿佛在跳动。 作为一名全栈开发者,我深知重构这样的项目将耗费无数个不眠之夜。 然而,当我尝试让AI协助修改代码时,却屡屡遇到挫折:组件太复杂导致AI理解困难,代码结构混乱让AI无从下手,项目依赖关系复杂使得AI难以准确推断......如何让AI真正成为我们的得力助手?
1/26/2025 12:00:30 AM
coderidea
Siri迎来救星?苹果资深元老空降AI部门,力求重塑AI竞争力
苹果公司正全力加速其人工智能(AI)的研发进程,以期重回行业领先地位。 为实现这一目标,苹果进行了重要的人事调整,资深执行副总裁Kim Vorrath被调任至人工智能与机器学习部门,担任AI主管John Giannandrea的首席副手。 Vorrath以其卓越的问题解决能力和推动重大项目成功的经验而闻名,此次调任被视为苹果加强AI团队,并重塑其AI竞争力的关键举措。
1/25/2025 9:16:00 AM
AI在线
免费体验:微软 Copilot 开放“深度思考”,你的专属 AI 策略顾问
科技媒体 Windows Latest 昨日(1 月 24 日)发布博文,报道称微软正开始邀请 Copilot 用户,免费体验“深度思考”(Think Deeper),会花费更多时间分析问题,并逐步剖析推理生成更详细、更符合用户需求的答案。
1/25/2025 9:02:06 AM
故渊
满血o3即将推出,OpenAI的Q1还有硬货!首席产品官:o1 Pro不可能一直傻乎乎地亏钱!今明两年不会推出机器人
出品 | 51CTO技术栈(微信号:blog51cto)前天,OpenAI最大的产品经理,首席产品官Weil刚剧透智能体Q1就发出。 一转头,今天就把Operator推出来了? ?
1/24/2025 4:52:32 PM
“人类终极考试”基准测试发布:顶级 AI 系统表现惨淡,回答准确率均未超 10%
非营利组织“人工智能安全中心”(CAIS)与提供数据标注和 AI 开发服务的公司 Scale AI 联合推出了一个名为“人类终极考试”(Humanity's Last Exam)的新型基准测试,旨在评估前沿 AI 系统的综合能力。这一测试因其极高的难度引起关注。
1/24/2025 4:27:49 PM
远洋
颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级
最近,非营利研究机构AI2上新了OLMo2系列模型,他们称之为「迄今为止最好的完全开源模型」。 OLMo 2系列包含7B和13B两个型号,相比如Llama 3.1和Qwen 2.5等开源模型达到了同等甚至更优的性能,同时FLOPS计算量更少,在性能和计算效率之间取得了极佳的平衡,为开源LLM开辟了新的可能性。 不同大小开源模型的性能对比,OLMo 2的表现优于同参数规模模型在多个下游任务上,OLMo 2展现出了强大的泛化能力和适应能力。
1/24/2025 3:40:00 PM
新智元
六大维度,LLM「问题生成」首次正面PK人类!伯克利等发布最新研究
长期以来,问题生成(Question Generation)任务都是根据「给定事实」来编写各种相关问题,已经发展出了很多自动化的方法。 大型语言模型(LLM)的兴起,极大提升了各种自然语言处理(NLP)任务的性能,其中也包括问题生成,虽然应用广泛,但还没有研究讨论过「用LLMs生成问题的特点」。 没有额外提示约束时,LLMs是更倾向于生成较长还是较短的问题?
1/24/2025 3:30:00 PM
新智元
OpenAI首个智能体Operator大测评,你也能拥有24小时私人管家!
演唱会抢票终于不用自己蹲守了,公司订餐也可以直接「无脑托管」,这就是OpenAI今天发布的Operator。 顾名思义,Operator就是能帮你端到端处理任务的AI智能体。 比较有趣的是,OpenAI针对Operator新开了一个网页operator.chatgpt.com,而不是像之前发布的功能都直接统一内置在ChatGPT中。
1/24/2025 3:09:43 PM
新智元
向视觉版o1出击,阶跃张祥雨团队推出“慢感知”,实现感知层面的推理时scaling
视觉版o1的初步探索,阶跃星辰&北航团队推出“慢感知”。 研究人员认为:1)目前多模领域o1-like的模型,主要关注文本推理,对视觉感知的关注不够。 2)精细/深度感知是一个复杂任务,且是未来做视觉推理的重要基础。
1/24/2025 3:05:09 PM
量子位
打造科学研究“革命的工具”,『AI4S攀登者行动计划』开放申请
驱动科学研究的人工智能(AI for Science,以下简称AI4S)正逐渐改变科学研究的模式,然而学科之间的“烟囱式”发展模式,既容易造成资源分散和重复投入,也在一定程度上制约颠覆性成果涌现。 同时,由于AI4S具有“极宏观拓展、极微观深入、极端条件迈进、极综合交叉”的特性,使得具有重大意义的变革性突破,难以从现有组织模式中诞生——这类突破超出了单一团队的研究能力,需要依赖大规模研究、工程与系统协作,而早期价值又难以被商业风投支持——“AI4S攀登者行动计划”旨在解决这一难题。 如果你渴望突破AI4S传统研究模式的限制,欢迎申请加入“AI4S攀登者行动计划”,与我们共同推动下一代技术变革。
1/24/2025 2:58:00 PM
ScienceAI
活性提高42倍,ML引导的无细胞表达加速酶工程,登Nature子刊
编辑 | 萝卜皮酶是人类生活中不可或缺的天然催化剂,不仅助我们消化食物,还能增强香水香味、提高洗衣效率,甚至用于疾病治疗。 科学家们正使用酶工程创造新酶,用于吸收温室气体、降解环境毒素、研发高效药物。 但是,酶工程受限于快速生成和使用大量序列功能关系数据集进行预测设计的挑战。
1/24/2025 2:55:00 PM
ScienceAI
一文读懂 OpenAI 最新 Operator
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景最新突破 - 构建高效、灵活的创新的 AI Agent。 人工智能(AI)领域正迎来一个崭新的时代,AI 不再仅仅是被动地响应指令,而是能够主动地理解用户意图,并在数字世界中自主执行任务。 OpenAI 近期发布的 Operator 正是这一变革的先锋。
1/24/2025 2:38:51 PM
架构驿站
资讯热榜
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
超多案例!让 Lovart 作图更好看更高效的提示词在这里了!
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%!
谷歌发布Flow AI剪辑工具:Veo3 与Imagen4 驱动、镜头控制与场景扩展
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
Google搜索推出AI Mode实验,探索全新智能问答体验
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
Anthropic
神经网络
研究
3D
计算
Sora
机器学习
AI设计
AI for Science
生成
苹果
GPU
AI视频
搜索
场景
华为
百度
训练
人形机器人
Claude
预测
伟达
xAI
深度学习
Transformer
大语言模型
智能体
字节跳动
模态
文本
具身智能
神器推荐
Copilot
驾驶
LLaMA
视觉
API
算力
应用
安全
干货合集
工具
大型语言模型
视频生成
Agent