AI在线 AI在线

理论

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA|上海AI Lab&西工大新研究

仅用4090就能实现大规模城市场景重建! 高效几何重建新架构CityGS-X来了,通过一种新型并行化混合分层三维表征架构(PH²-3D)的可扩展系统,突破了传统三维重建在算力消耗和几何精度上的限制。 算力瓶颈无处不在,当前3D高斯泼溅技术虽取得显著进展,却仍面临三大核心挑战:处理速度缓慢、计算成本高昂、几何精度有限。
4/14/2025 8:40:00 AM
量子位

手机实现GPT级智能,比MoE更极致的稀疏技术:省内存效果不减|对话面壁&清华肖朝军

在大模型争霸的时代,算力与效率的平衡成为决定胜负的关键。 端侧部署一直是大模型落地的最后一公里,却因算力瓶颈困难重重。 面壁智能和清华走出了一条与MoE不同的路径——神经元级稀疏激活,让模型在保持性能的同时大幅降低资源消耗。
4/14/2025 8:30:00 AM
量子位

八个面向前端方向的 AI 编程助手,总有一款适合你!

Hello,大家好,我是 Sunday。 通过 AI 辅助开发是未来的大趋势,所以今天就为大家推荐 8 个 AI 编程助手(针对前端方向),大家可以选择适合的工具,从而大幅提升工作效率! Webcrumbs — 使用 TailwindCSS 即时生成组件图片官网地址: 的 Frontend AI 是一个 AI 助手,它可以根据用户请求、图像或屏幕截图生成 UI 组件的代码。
4/14/2025 3:45:00 AM
程序员Sunday

一文读懂A2A与MCP如何重塑AI生态

当下的AI世界正处于一个关键节点,就像二战后的国际秩序重建。 各家AI企业各自为政,形成了壁垒分明的"数字孤岛"。 代理们无法顺畅对话,工具无法共享调用,用户被迫在多个平台间来回切换。
4/14/2025 3:00:00 AM
大数据AI智能圈

最新版Spring Ai实践

深入探索 Spring AI 1.0.0-M6在人工智能与软件开发深度融合的时代,Spring AI 作为一个强大的框架,持续为开发者提供着高效且便捷的工具,以实现与大语言模型(LLM)的无缝交互。 Spring AI 的最新版本引入了一系列令人瞩目的特性,其中 Function Calling 到 Tool Calling 的转换以及模型上下文协议(MCP)的应用,标志着该框架在 AI 集成领域的又一次重大飞跃。 聊天接口示例在今天的内容之前我们回一下如何使用SpringAI实现一个简单的聊天接口,使用千问API实现聊天功能:添加依赖复制配置复制实现复制当进行下面的提问时:现在北京时间几点了?
4/14/2025 2:25:00 AM

Dify+MCP: 泵类设备的预测性维护案例 (升级版 )

上篇文章中,给大家分享了一个使用 Dify RAGFlow 实现的泵类设备的预测性维护案例,过去两天里有很多盆友在后台私信我了一些实现细节,比如:HTTP 请求的数据存在哪里? IoT 平台的数据能否直接实时“流”入 Dify? 以及如何使用 MCP 的方案实现四个数据源(IoT, CMMS, MES, ERP)的智能查询。
4/14/2025 12:40:00 AM
韦东东

Moonshot AI开源轻量级MoE多模态模型Kimi-VL,2.8B参数媲美SOTA模型!

最近有点忙,没来得及更新,但一直保持着对前沿技术的紧密关注,不得不感叹当今技术日新月异。 多模态推理模型进展,现有的开源大型视觉语言模型在可扩展性、计算效率和高级推理能力方面显著落后于纯文本语言模型。 OpenAI的GPT-4o和Google的Gemini等模型能够无缝感知和解释视觉输入,但不开源,DeepSeek-R1等模型虽然采用了MoE架构,但在长上下文推理和多模态任务上仍有不足。
4/14/2025 12:30:00 AM
Goldma

本地部署DeepSeek+DiFy平台构建智能体应用

在大模型实际应用落地时候,利用智能体平台,构建本地的向量化知识库,基于RAG知识增强技术和大模型的推理能力,提升效率。 本文简要介绍RAG、大模型微调和大模型蒸馏的特点,通用智能体平台,并在本地部署DiFy智能体平台,利用本地部署的DeepSeek模型和知识库构建智能体应用。 1、RAG、微调和蒸馏大模型的落地使用主要有RAG、微调和蒸馏几种方式,每种方式有各自的特点和适用场景。
4/14/2025 12:22:00 AM
大唐小少

阿里全模态Qwen2.5-Omni技术报告万字解读!

Qwen 团队最近发布了一款统一多模态大模型 Qwen2.5-Omni,开放了 7B 版本的权重。 能够同时处理文本、图像、音频和视频输入,并以流式方式生成文本和语音响应。 下面来详细看下:开源地址:论文地址:: 地址: Face:::官方体验:::在日常生活中,人类能够同时感知视觉和听觉信息,并通过大脑处理这些信息后,以书写、说话或使用工具等方式进行反馈,从而与世界上的各种生物进行信息交流并展现智能。
4/14/2025 12:20:00 AM
Goldma

DataAgent是最容易落地的Agent场景?

数据分析是任何企业的核心需求。 在大模型技术蓬勃发展的当下,众多企业都在思考如何将AI能力快速注入现有业务。  从目前的市场表现来看,DataAgent(数据智能体)似乎成为了最易落地且价值明显的Agent应用场景。
4/14/2025 12:00:00 AM

Llama 4重测竞技场排名大跳水,网友:社区很难再信任Meta了

Llama 4被曝在大模型竞技场作弊后,重新上架了非特供版模型。 但是你很可能没发现它。 因为排名一下子从第2掉到了第32,要往下翻好久才能看到。
4/13/2025 5:04:23 PM
量子位

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。 在探索的过程中,一个核心的议题是:对于模型推理性能的提升来说,什么有效? 什么无效?
4/13/2025 3:10:00 PM
机器之心

Science子刊 | 基于公平贝叶斯扰动,首个面向医学图像生成公平性的方法FairDiffusion来了

编辑 | ScienceAI随着人工智能在医学影像领域的广泛应用,文本到图像扩散模型(如 Stable Diffusion)正逐步渗透到医学数据合成、医学教育和数据共享中。 然而,尽管生成质量整体较高,模型在不同人口统计属性(性别、种族、族裔)上却存在明显差异。 例如,实验表明,Stable Diffusion 在生成女性、白人及非西班牙裔样本时图像细节和临床特征更为突出,而在男性、亚洲人及西班牙裔样本上则表现欠佳。
4/12/2025 5:16:00 PM
ScienceAI

苹果发现原生多模态模型Scaling Laws:早融合优于后融合,MoE优于密集模型

让大模型进入多模态模式,从而能够有效感知世界,是最近 AI 领域里人们一直的探索目标。 目前我们见到的很多多模态大模型应用是「组合式」的:其中集成了数个单独预训练的组件,例如将视觉编码器连接到 LLM 上并继续进行多模态训练;而在谷歌 Gemin 2.0 推出之后,原生多模态模型(NMM)被认为是正确的方向。 但从零开始训练的多模态大模型真的是更好的方法吗?
4/12/2025 3:52:00 PM
机器之心

微软突然封锁Cursor,全面禁用C、C++、C#扩展,网友:理解微软,Cursor白嫖VSCode

编辑 | 云昭就在两天前,有用户在知名AI编程工具Cursor的论坛上提出了一个问题:怎么回事? VSCode的扩展以后还能在Cursor上使用吗? 这个问题震惊了Cursor用户们,他们发现微软的C/C 语言服务扩展突然停止支持Cursor,这是反常识的:因为Cursor使用了跟VSCode同源的基础代码。
4/12/2025 2:01:42 PM
云昭

击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!

刚刚,字节旗下的豆包团队发布了他们最新的推理模型Seed-Thinking-v1.5! 亮点很突出:200B参数击败DeepSeek R1(671B),不到后者参数量的三分之一! 与其他最新的超大杯推理模型相比,Seed-Thinking-v1.5 是一个相对小型的专家混合(MoE)模型——激活参数为 20B,总参数规模为 200B。
4/11/2025 2:54:44 PM

召回率98.5%,开源混合学习系统精准预测生物大分子中金属结合位点

编辑丨&金属离子是许多蛋白质中用于蛋白质功能推断和工程化的重要成分,其复杂性与结构催化等作用有关。 现如今的技术在应对过渡金属离子的建模,特别是在瞬时、可逆和浓度依赖性调节位点等难题时,显得有些乏力。 汕头大学医学院、湖南大学与美国弗吉尼亚大学(University of Virginia)带来了一种混合机器学习系统,名为 PinMyMetal(PMM)。
4/11/2025 2:13:00 PM
ScienceAI

OpenAI史上最硬核技术播客!系统揭秘GPT4.5诞生,已进入数据受限时代!小哥亲述大模型修bug血泪史;还有一个重磅开源消息

整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)刚刚,奥特曼亲自预热的那期播客,完整版视频终于上线啦! ! !
4/11/2025 1:41:19 PM
伊风