理论
量子计算重大突破!谷歌发布混合量子模拟方法
今天凌晨1点,谷歌AI发布了一种全新的模拟-数字混合量子模拟方法,可在保持速度的同时增强可控制性,颠覆了传统量子计算的模拟方法。 在研究量子热化和临界现象方面实现了重大突破。 传统的量子模拟主要面临两大难题:灵活性差,纯数字的量子模拟效率非常慢,经常会受到噪声的干扰;速度快却无法控制,速度上来了却无法精准控制所有粒子的相互作用。
4/22/2025 9:50:01 AM
AIGC开放社区
突破封锁!华为将发布大量AI芯片,平替英伟达H100
今天凌晨2点,路透社独家消息,华为最早将于5月份发布大量910C AI芯片,部分出货已完成。 华为此次发布产品主要是针对美国对国内AI芯片的封锁,帮助国内企业解决AI芯片短缺的难题。 因为美国政府本月要求英伟达销售H20需出口许可证。
4/22/2025 9:47:07 AM
AIGC开放社区
用任务向量做模型编辑为何有效?这篇ICLR 2025 Oral论文给出了理论分析
本文作者李宏康,博士毕业于美国伦斯勒理工大学,本科毕业于中国科学技术大学,并即将前往宾夕法尼亚大学担任博士后研究员。 研究方向包括深度学习理论、大语言模型理论等等。 本文的通讯作者为伦斯勒理工大学的汪孟教授。
4/22/2025 9:40:00 AM
机器之心
百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板
在 AI 长文写作领域,一项革命性突破正在改写行业规则 —— 由「人工智能之父」Jürgen Schmidhuber 领衔的团队,正式开源其长文写作框架 WriteHERE。 该框架凭借异质递归规划(Heterogeneous Recursive Planning)技术,实现单次生成超 4 万字、100 页专业报告的能力,在小说创作、报告生成场景中全面超越 Perplexity 付费版「深度研究」、DeepMind 的 Agent's Room 及斯坦福 STORM 等顶尖方案。 论文标题:Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models论文地址: & 在线 Demo: 仓库:「大纲先行」到「实时编织」现有 AI 长文生成系统(如 Agent's Room、STORM)多将写作简化为「规划 - 填充」的线性流程,而 WriteHERE 首次通过数学形式化揭示:长文写作本质上是检索(Retrieval)、推理(Reasoning)、写作(Composition)三类异构任务的动态编织。
4/22/2025 9:35:00 AM
机器之心
RL很重要,但远非All You Need!微软副总裁:AI不靠单个技术撑起
「AI 领域确实存在苦涩的教训,但若当初全盘接受它,我们现在可能还在用线性回归搞强化学习。 」刚刚,微软副总裁 Nando de Freitas 一篇长推文表达了自己的观点:反对单一技术的过度宣传,如 RL,应该强调多领域合作的重要性;AI 进步不是靠单一天才撑起的,而是成千上万的参与者共同推动了这一领域的发展;过去的一些观点在当时看似合理,但随着技术的发展,这些观点显得过时;人工智能的发展需要不断突破传统观念,就像数学一样,通过不断的探索和试错来逐步推进。 推文中,Freitas 还透露 RL 固然重要,但还远未达到「RL is all you need」的程度。
4/22/2025 9:30:00 AM
机器之心
直观即时绘制3D模型,可添加文本提示,VAST又开源了
3D生成明星玩家VAST,又又又又又开源了! Tripo Doodle(内部代号TripoSG Scribble) ,能够将简单的2D草图和文本提示(Text Prompt)实时转化为精细的3D模型。 它改进了传统3D建模学习曲线陡峭、耗时耗力的痛点,尤其是在初期“打形”阶段。
4/22/2025 9:26:00 AM
量子位
多模态大模型改造人脸防伪检测,厦大腾讯优图等研究入选CVPR 2025
近年来,人脸合成技术在快速发展,相关检测任务也逐渐从“看得出来”向“说明白为什么”演进。 除了判断一张脸是真还是假,更需要模型能“说出个所以然”。 在CVPR 2025的工作《Towards General Visual-Linguistic Face Forgery Detection》中,研究团队尝试从视觉 语言的多模态视角来改进伪造检测方法。
4/22/2025 9:22:00 AM
量子位
满血o3降智和幻觉倍增的原因可能找到了
OpenAI推出的满血O3“跑分”(Benchmark)貌似又被独立测试揭穿是刷榜了,而奇怪的测试基准数据可能就是o3降智和幻觉倍增的原因? 你可能要问了,一个数学基准测试,与降智和幻觉有什么关系? 事情要从去年12月说起。
4/22/2025 9:18:57 AM
AI寒武纪
MCP vs Function Calling,该如何选?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景落地 - 如何为 LLM 集成选择合适的策略? 众所周知,大型语言模型(LLMs)已经彻底改变了企业自动化、客户交互以及决策制定的方式,其强大的语言生成能力为各行业带来了前所未有的机遇。 然而,要充分发挥 LLMs 的潜力,仅仅部署一个预训练模型是远远不够的。
4/22/2025 9:17:41 AM
Luga Lee
全球首个无限时长视频生成!新扩散模型引爆万亿市场,电影级理解,全面开源
不是5秒,不是10秒,更不只是1分钟。 AI视频生成,正式迎来无限时长的时代! 来,话不多说,直接来看一部AI版《罗马假日》:而就是这么一部小短剧片段,它的“起点”,仅仅就是一张照片和一句Prompt:身着优雅西装的欧美男子与一位美女漫步在罗马街头,分享各自的生活趣事,眼神中满是欣赏;夕阳西下,余晖洒在两人脸上,彼此深情对视。
4/22/2025 9:17:00 AM
量子位
Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限
著名 AI 研究者和博主 Sebastian Raschka 又双叒叕更新博客了。 这次的主题是《LLM 推理的强化学习现状》。 博客地址: AI 社区很热闹,尤其是 Llama 4 和 GPT-4.5 等新旗舰模型的发布。
4/22/2025 9:12:00 AM
机器之心
AI创造新物理学,暴力破解引力波!宇宙观测开挂50倍,三体人直呼内行
就在刚刚,AI又将物理学,推动到了全新的领域。 来自马克斯·普朗克光科学研究所(MPL)、加州理工等机构的科学家发现,AI已经设计出了人类尚未理解的引力波探测工具。 这一发现,直接将可观测的宇宙体积扩大了50倍!
4/22/2025 9:08:00 AM
新智元
UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换
本文的作者来自伊利诺伊大学香槟分校(UIUC)、马萨诸塞大学(UMass)和谷歌。 本文的第一作者为 UIUC 博士生金博文,主要研究方向为与大语言模型相关的智能体、推理和强化学习研究。 其余学生作者为 UMass 博士生曾翰偲和 UIUC 博士生岳真锐。
4/22/2025 9:06:00 AM
机器之心
更懂公务员的大模型:写作/意图理解/公文排版全拿捏,部署成本直降90%,来自金山
当政务大模型具备推理能力,部署成本直降90%,写作效率提升71.58%、意图理解提升34.87%、公文排版能力提升12%。 如上新进展,来自金山办公。 时隔四个月,金山自研政务大模型完成推理能力升级。
4/22/2025 9:05:36 AM
量子位
采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解
先让模型生成多个候选答案,再通过自我验证挑出「真金」。 基于采样的搜索在许多推理任务中表现优异,可关于它的扩展趋势,还有许多未解之谜。 随着采样数量的增加,模型的推理性能能否继续提升?
4/22/2025 8:50:00 AM
新智元
谷歌新型 AI 系统在复杂诊断中表现超越医生
译者 | 刘汪洋审校 | 重楼最近,《自然》杂志上的一篇新论文引发了关注。 它展示了谷歌如何用 AI 改变医疗的未来:通过自动化技术降低成本、减轻医生负担,使他们能够将更多精力投入到复杂病例的处理中。 当你带着疑难杂症就医时,自然希望得到准确的诊断。
4/22/2025 8:13:39 AM
刘汪洋
AI模型蒸馏:大语言模型的“瘦身革命”
译者 | 朱先忠审校 | 重楼简介模型蒸馏是一种机器学习新技术,其基本思想是让较小的模型(学生)模仿较大的模型(老师)的行为。 当前,已经存在几种方法可以实现这一技术(将在下文中展开具体介绍),但其目标都是在学生模型中获得比从头开始训练更好的泛化能力。 模型蒸馏示例:学生(较小)模型使用蒸馏损失函数从教师模型中学习,该函数使用“软标签”和预测(使用OpenAI GPT4o生成的图表)一、为什么模型蒸馏很重要?
4/22/2025 8:08:37 AM
朱先忠
万字拆解!最新多模态 RAG 技术全景解析!
来自华为云的最新多模态RAG综述,非常全面,对多模态RAG感兴趣的朋友强烈推荐! 复制1、引言传统的RAG系统主要依赖于文本数据,通过检索与查询语义相似的相关文档片段,并将其与查询结合,形成增强的输入,供LLMs生成回答。 这种方法使得LLMs能够在推理阶段动态整合最新信息,从而提高回答的准确性和可靠性。
4/22/2025 7:00:00 AM
Goldma
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind