理论
Transformer原作打脸DeepSeek观点?一句Wait就能引发反思,RL都不用
只要预训练,LLM就能涌现自我反思、自我纠正! Transformer首席作者Ashish Vaswani带队的新研究引来万人围观! 强化学习已证明能有效激发大语言模型的反思能力。
4/23/2025 9:36:23 AM
新智元
外媒:DeepSeek震撼世界 中国大学成为AI人才池
近年来,美国频繁渲染所谓的“中美争夺AI霸权”,尽管这一说法是否契合现实尚存争议,但不可否认的是,在美国的AI战略视野中,中国已被明确界定为核心竞争对手。 《巴伦周刊》报道称,当前美国在AI创新领域依然保持领先地位,不过中国正在快速缩小差距。 在学术研究、资本投入以及政策战略布局等关键层面,中国展现出强大的追赶态势:海量论文产出彰显科研活力,持续增长的投资为产业发展注入动力,而系统的政策支持更是为AI技术发展筑牢根基。
4/23/2025 9:34:46 AM
从Minecraft到虚幻5,AI首次实现3D游戏零样本迁移,跨游戏直接上手
该研究成果由北京大学和加州大学洛杉矶分校共同完成。 第一作者蔡少斐为北京大学三年级博士生,通讯作者为北京大学助理教授梁一韬。 该工作基于 MineStudio 开源项目,一个全流程简化版 Minecraft AI Agent 开发包,相关代码均已在 GitHub 上开源。
4/23/2025 9:28:58 AM
机器之心
生成式AI进入第二幕:交大携手创智学院提出「认知工程」,AI新纪元开始了
第二幕将催生一种全新的专业:认知工程师 (Cognitive Engineers)— 专注于将人类或 AI 在各领域的深度认知提炼、结构化并转化为 AI 可学习的形式。 无论你是技术创造者还是使用者,理解这场认知革命都至关重要。 我们正在从「AI as tools」向「AI as thinking partners」转变,这不仅改变了技术的能力边界,也改变了我们与技术协作的方式。
4/23/2025 9:23:15 AM
机器之心
AI也要007?Letta、伯克利提出「睡眠时间计算」,推理效率翻倍还不加钱
AI 也要 007 工作制了! 近日,AI 初创公司 Letta 和 UC 伯克利的研究人员提出了一种扩展人工智能能力的新方式 —— 睡眠时间计算(Sleep-time Compute),让模型在空闲时间「思考」,旨在提高大型语言模型(LLM)的推理效率,降低推理成本,同时保持或提升准确性。 睡眠时间计算的核心理念在于:智能体即使在「睡眠」(即用户未提出查询时的闲置状态)时段,也应持续运行,利用这些非交互期重组信息、提前完成推理。
4/23/2025 9:10:00 AM
机器之心
连Claude 3.5都败下阵来,大语言模型能否定位软件服务的故障根因?
论文的第一作者是香港中文大学(深圳)数据科学学院三年级博士生徐俊杰龙,指导老师为香港中文大学(深圳)数据科学学院的贺品嘉教授和微软主管研究员何世林博士。 贺品嘉老师团队的研究重点是软件工程、LLM for DevOps、大模型安全。 大型语言模型(LLM)近期在软件工程领域取得了显著进展,催生了 MetaGPT、SWE-agent、OpenDevin、Copilot 和 Cursor 等大量研究成果与实际应用,深刻影响着软件开发的方法论和实践。
4/23/2025 9:06:00 AM
机器之心
3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机
随着3D Gaussian Splatting(3DGS)成为新一代高效三维建模技术,它的自适应特性却悄然埋下了安全隐患。 在本篇 ICLR 2025 Spotlight 论文中,研究者们提出首个专门针对3DGS的攻击方法——Poison-Splat,通过对输入图像加入扰动,即可显著拖慢训练速度、暴涨显存占用,甚至导致系统宕机。 这一攻击不仅隐蔽、可迁移,还在现实平台中具备可行性,揭示了当前主流3D重建系统中一个未被重视的安全盲区。
4/23/2025 8:50:00 AM
量子位
最先进推理模型! OpenAI 推出 o3 和 o4-mini 模型
译者 | 崔皓审校 | 重楼开篇就在OpenAI推出 GPT 4.1 系列几天后,又发布了o3 和 o4-mini 的推理模型,这表明大模型正式迈向 AGI( 人工通用智能 )。 o3 和 o4-mini 不仅仅是 AI 模型;它们还具备智能性、自治性、可调用工具以及与真实软件对接的技能,是一个真正意义上的AI 系统。 新模型不会被动工作;而是主动使用工具自动完成任务!
4/23/2025 8:30:05 AM
崔皓
少即是多:为什么文档检索量低反而会提高答案质量
译者 | 核子可乐审校 | 重楼检索增强生成(RAG)是一种将语言模型与外部知识源结合的AI系统构建方法。 简单来说,AI会先搜索与用户查询相关的文档(如文章或网页),然后利用这些文档生成更准确的答案。 这种方法因能帮助大语言模型(LLM)扎根真实数据、减少虚构信息而受到推崇。
4/23/2025 8:14:41 AM
核子可乐
“Google一下” AI 化,头部网站点击率暴跌三分之一
2024年,Google大规模上线“AI 总结功能(AI Overviews)”——搜索结果页首条直接由AI生成的答案。 Google声称这能帮用户“更高效地获取信息”,甚至还说可能带动网站点击量提升。 但真实数据打脸来得很快——最新的Ahrefs分析显示:AI 总结功能让头部网站点击率暴跌34.5%。
4/23/2025 7:01:00 AM
文摘菌
数智飞轮:AI时代企业增长的核心密码
格罗斯用了几十年才从债券市场获得惊人利润,离不开彭博终端这把钥匙。 华尔街精英用彭博终端洞察市场,你的企业用什么洞察业务增长? 数据时代,企业掌握着海量信息,却常常无法变现。
4/23/2025 4:00:00 AM
大数据AI智能圈
MinerU部署实践:从零开始搭建你的专属PDF解析服务
在多模态RAG(Retrieval-Augmented Generation)系统中,PDF文件的高效、安全解析与处理是实现高质量知识检索和生成的关键环节。 PDF文件通常包含丰富的文本、图像和表格信息,这些多模态数据的有效提取和整合对于提升RAG系统的性能至关重要。 然而,传统的PDF解析工具往往存在解析精度不足、无法处理复杂格式(如图像和表格)等问题,尤其是在涉及私密文档时,数据安全和隐私保护也是一大挑战。
4/23/2025 3:00:00 AM
Goldma
哥大退学生打造“AI作弊器”获3800万元融资,声称可以在各种场景中作弊
在当今数字化时代,人工智能技术正以前所未有的速度渗透到各个领域,从智能家居到自动驾驶,从医疗诊断到金融分析,AI 的应用场景不断拓展。 然而,技术的双刃剑特性也在某些领域引发了争议。 最近,两位哥伦比亚大学的退学生凭借一款“AI 作弊器”获得了大笔融资,再次引发广泛关注。
4/22/2025 5:25:50 PM
Claude竟藏着3307种「人格」?深扒70万次对话,这个AI会看人下菜碟
想象一下,如果能「偷听」70万次AI和人类的私密对话(别担心,是匿名的),会发现什么? AI仅仅是个概率机器,还是一个善于隐藏自己真实性格的——等会,AI真的有性格吗? 也许说性格不合适,现阶段的AI智能或许用「价值观」来形容最为合适。
4/22/2025 3:38:54 PM
新智元
「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!
视频生成领域,又出现一位重量级开源选手。 今天,马尔奖、清华特奖得主曹越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。 这是一个通过自回归预测视频块序列来生成视频的世界模型,生成效果自然流畅,还有多个版本可以下载。
4/22/2025 3:34:08 PM
机器之心
「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!
视频生成领域,又出现一位重量级开源选手。 今天,马尔奖、清华特奖得主曹越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。 这是一个通过自回归预测视频块序列来生成视频的世界模型,生成效果自然流畅,还有多个版本可以下载。
4/22/2025 3:34:08 PM
机器之心
142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究
你是否曾想过DeepSeek-R1为什么能「思考」? 距离DeepSeek-R1这只「巨鲸」引发的全球AI海啸似乎刚刚平静下来,但推理模型已经成为了AI宠儿。 不论是Gemini 2.5Pro,还是o3,o4-mini,以及所有人都在期待的DeepSeek-R2,都是推理模型。
4/22/2025 3:32:06 PM
新智元
清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者
整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计,给人一种视频版DeepSeek的感觉。 图片Magi-1将视频生成卷到了新高度,大片级品质直接锁住大家的眼球,请看VCR:其主打能力,一是无限长度扩展,实现跨时间的无缝连贯叙事:图片二是能将生成时长控制精确到每一“秒”:图片另外,Magi-1对物理规律也有更深度的理解,Physics-IQ基准测试56.02%,大幅领先一众顶流。 现在看这张图,Sora的时代是真的过去了。
4/22/2025 3:29:05 PM
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind