AI在线 AI在线

资讯列表

智能软体仿生观赏鱼“金鳞”亮相,在水族馆、公园有望“以假乱真”

智能软体仿生观赏鱼“金鳞”亮相,在水族馆、公园有望“以假乱真”

据介绍,这款以金龙鱼为原型精心设计的仿生鱼具备前沿的仿生科技,在水生生物科普教育、水族馆娱乐观赏以及家庭互动体验等领域掀起一场革命性的浪潮。
4/22/2025 9:40:47 AM 清源
用任务向量做模型编辑为何有效?这篇ICLR 2025 Oral论文给出了理论分析

用任务向量做模型编辑为何有效?这篇ICLR 2025 Oral论文给出了理论分析

本文作者李宏康,博士毕业于美国伦斯勒理工大学,本科毕业于中国科学技术大学,并即将前往宾夕法尼亚大学担任博士后研究员。 研究方向包括深度学习理论、大语言模型理论等等。 本文的通讯作者为伦斯勒理工大学的汪孟教授。
4/22/2025 9:40:00 AM 机器之心
百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板

百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板

在 AI 长文写作领域,一项革命性突破正在改写行业规则 —— 由「人工智能之父」Jürgen Schmidhuber 领衔的团队,正式开源其长文写作框架 WriteHERE。 该框架凭借异质递归规划(Heterogeneous Recursive Planning)技术,实现单次生成超 4 万字、100 页专业报告的能力,在小说创作、报告生成场景中全面超越 Perplexity 付费版「深度研究」、DeepMind 的 Agent's Room 及斯坦福 STORM 等顶尖方案。 论文标题:Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models论文地址: & 在线 Demo: 仓库:「大纲先行」到「实时编织」现有 AI 长文生成系统(如 Agent's Room、STORM)多将写作简化为「规划 - 填充」的线性流程,而 WriteHERE 首次通过数学形式化揭示:长文写作本质上是检索(Retrieval)、推理(Reasoning)、写作(Composition)三类异构任务的动态编织。
4/22/2025 9:35:00 AM 机器之心
RL很重要,但远非All You Need!微软副总裁:AI不靠单个技术撑起

RL很重要,但远非All You Need!微软副总裁:AI不靠单个技术撑起

「AI 领域确实存在苦涩的教训,但若当初全盘接受它,我们现在可能还在用线性回归搞强化学习。 」刚刚,微软副总裁 Nando de Freitas 一篇长推文表达了自己的观点:反对单一技术的过度宣传,如 RL,应该强调多领域合作的重要性;AI 进步不是靠单一天才撑起的,而是成千上万的参与者共同推动了这一领域的发展;过去的一些观点在当时看似合理,但随着技术的发展,这些观点显得过时;人工智能的发展需要不断突破传统观念,就像数学一样,通过不断的探索和试错来逐步推进。 推文中,Freitas 还透露 RL 固然重要,但还远未达到「RL is all you need」的程度。
4/22/2025 9:30:00 AM 机器之心
直观即时绘制3D模型,可添加文本提示,VAST又开源了

直观即时绘制3D模型,可添加文本提示,VAST又开源了

3D生成明星玩家VAST,又又又又又开源了! Tripo Doodle(内部代号TripoSG Scribble) ,能够将简单的2D草图和文本提示(Text Prompt)实时转化为精细的3D模型。 它改进了传统3D建模学习曲线陡峭、耗时耗力的痛点,尤其是在初期“打形”阶段。
4/22/2025 9:26:00 AM 量子位
多模态大模型改造人脸防伪检测,厦大腾讯优图等研究入选CVPR 2025

多模态大模型改造人脸防伪检测,厦大腾讯优图等研究入选CVPR 2025

近年来,人脸合成技术在快速发展,相关检测任务也逐渐从“看得出来”向“说明白为什么”演进。 除了判断一张脸是真还是假,更需要模型能“说出个所以然”。 在CVPR 2025的工作《Towards General Visual-Linguistic Face Forgery Detection》中,研究团队尝试从视觉 语言的多模态视角来改进伪造检测方法。
4/22/2025 9:22:00 AM 量子位
满血o3降智和幻觉倍增的原因可能找到了

满血o3降智和幻觉倍增的原因可能找到了

OpenAI推出的满血O3“跑分”(Benchmark)貌似又被独立测试揭穿是刷榜了,而奇怪的测试基准数据可能就是o3降智和幻觉倍增的原因? 你可能要问了,一个数学基准测试,与降智和幻觉有什么关系? 事情要从去年12月说起。
4/22/2025 9:18:57 AM AI寒武纪
MCP vs Function Calling,该如何选?

MCP vs Function Calling,该如何选?

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景落地 - 如何为 LLM 集成选择合适的策略? 众所周知,大型语言模型(LLMs)已经彻底改变了企业自动化、客户交互以及决策制定的方式,其强大的语言生成能力为各行业带来了前所未有的机遇。 然而,要充分发挥 LLMs 的潜力,仅仅部署一个预训练模型是远远不够的。
4/22/2025 9:17:41 AM Luga Lee
全球首个无限时长视频生成!新扩散模型引爆万亿市场,电影级理解,全面开源

全球首个无限时长视频生成!新扩散模型引爆万亿市场,电影级理解,全面开源

不是5秒,不是10秒,更不只是1分钟。 AI视频生成,正式迎来无限时长的时代! 来,话不多说,直接来看一部AI版《罗马假日》:而就是这么一部小短剧片段,它的“起点”,仅仅就是一张照片和一句Prompt:身着优雅西装的欧美男子与一位美女漫步在罗马街头,分享各自的生活趣事,眼神中满是欣赏;夕阳西下,余晖洒在两人脸上,彼此深情对视。
4/22/2025 9:17:00 AM 量子位
Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限

Sebastian Raschka长文:DeepSeek-R1、o3背后,RL推理训练正悄悄突破上限

著名 AI 研究者和博主 Sebastian Raschka 又双叒叕更新博客了。 这次的主题是《LLM 推理的强化学习现状》。 博客地址: AI 社区很热闹,尤其是 Llama 4 和 GPT-4.5 等新旗舰模型的发布。
4/22/2025 9:12:00 AM 机器之心
AI创造新物理学,暴力破解引力波!宇宙观测开挂50倍,三体人直呼内行

AI创造新物理学,暴力破解引力波!宇宙观测开挂50倍,三体人直呼内行

就在刚刚,AI又将物理学,推动到了全新的领域。 来自马克斯·普朗克光科学研究所(MPL)、加州理工等机构的科学家发现,AI已经设计出了人类尚未理解的引力波探测工具。 这一发现,直接将可观测的宇宙体积扩大了50倍!
4/22/2025 9:08:00 AM 新智元
UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换

UIUC联手谷歌发布Search-R1:大模型学会「边想边查」,推理、搜索无缝切换

本文的作者来自伊利诺伊大学香槟分校(UIUC)、马萨诸塞大学(UMass)和谷歌。 本文的第一作者为 UIUC 博士生金博文,主要研究方向为与大语言模型相关的智能体、推理和强化学习研究。 其余学生作者为 UMass 博士生曾翰偲和 UIUC 博士生岳真锐。
4/22/2025 9:06:00 AM 机器之心
更懂公务员的大模型:写作/意图理解/公文排版全拿捏,部署成本直降90%,来自金山

更懂公务员的大模型:写作/意图理解/公文排版全拿捏,部署成本直降90%,来自金山

当政务大模型具备推理能力,部署成本直降90%,写作效率提升71.58%、意图理解提升34.87%、公文排版能力提升12%。 如上新进展,来自金山办公。 时隔四个月,金山自研政务大模型完成推理能力升级。
4/22/2025 9:05:36 AM 量子位
数据:​ChatGPT 搜索在欧洲迅速增长

数据:​ChatGPT 搜索在欧洲迅速增长

根据 OpenAI 在其最新报告中披露的信息,ChatGPT 搜索功能在欧洲的增长势头惊人。 ChatGPT 搜索允许用户通过聊天机器人获取最新的网络信息,并将这些信息整合到回答中。 OpenAI 的欧盟子公司 OpenAI Ireland Limited 表示,在截至今年3月31日的六个月内,ChatGPT 搜索的平均每月活跃用户数已达到约4130万,这一数字相比于2024年10月31日的六个月内的1120万用户,显著增加。
4/22/2025 9:00:40 AM AI在线
ChatGPT Search 用户激增,欧盟监管压力加剧

ChatGPT Search 用户激增,欧盟监管压力加剧

根据 OpenAI 最近的一份报告,其旗下的 ChatGPT Search 在欧盟的用户数量在过去六个月内大幅增长,活跃用户数达到了约4130万。 这个数字相比于2024年10月的1120万几乎是三倍的提升。 这一变化意味着 ChatGPT Search 很可能在不久的将来达到欧盟《数字服务法》(DSA)所规定的4500万用户的门槛,一旦超过这一界限,将面临更严格的监管措施。
4/22/2025 9:00:40 AM AI在线
GLM-4-32B 与 GLM-Z1-32B 在 OpenRouter 上线,免费开放

GLM-4-32B 与 GLM-Z1-32B 在 OpenRouter 上线,免费开放

清华大学 KEG 实验室(THUDM)研发的 GLM-4-32B 及 GLM-Z1-32B 两款前沿大语言模型(LLM)正式在 OpenRouter 平台上线,且完全免费向全球用户开放。 这一里程碑式的事件标志着高性能 AI 模型的普及迈出了重要一步,为开发者、研究人员及 AI 爱好者提供了强大的工具,以推动人工智能应用的进一步创新。 模型上线:性能强劲,免费开放GLM-4-32B 作为一款拥有320亿参数的通用大语言模型,以其在复杂推理、数学能力及多语言处理方面的卓越表现,成为当前开源 LLM 领域的佼佼者。
4/22/2025 9:00:40 AM AI在线
​马斯克的 x 计划筹 250 亿美元开发 Colossus 2 超级计算机

​马斯克的 x 计划筹 250 亿美元开发 Colossus 2 超级计算机

近日,埃隆・马斯克创办的人工智能公司 xAI 在扩大其现有 Colossus 超级计算机的基础上,宣布将启动一个雄心勃勃的新项目。 据报道,xAI 计划在即将进行的融资中筹集高达250亿美元,以支持其下一个超级计算机 Colossus2的开发。 图源备注:图片由AI生成,图片授权服务商Midjourney在与现有投资者的电话会议中,马斯克表示,公司将进行合理的估值,这一表态被市场解读为即将进行新一轮融资的信号。
4/22/2025 9:00:40 AM AI在线
采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解

采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解

先让模型生成多个候选答案,再通过自我验证挑出「真金」。 基于采样的搜索在许多推理任务中表现优异,可关于它的扩展趋势,还有许多未解之谜。 随着采样数量的增加,模型的推理性能能否继续提升?
4/22/2025 8:50:00 AM 新智元