资讯列表
ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM
论文有两位共同一作。 郑凯文为清华大学计算机系三年级博士生,何冠德为德州大学奥斯汀分校(UT Austin)一年级博士生。 扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展,不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现,推动了文本到图像、视频生成的技术革新。
4/28/2025 9:00:00 AM
机器之心
基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作
本文由上海人工智能实验室,悉尼大学,牛津大学联合完成。 第一作者周恒为上海 ailab 实习生和 Independent Researcher 耿鹤嘉。 通讯作者为上海人工智能实验室青年科学家白磊和牛津大学访问学者,悉尼大学博士生尹榛菲,团队其他成员还有 ailab 实习生薛翔元。
4/28/2025 8:50:00 AM
机器之心
过于追求人性化:奥尔特曼称 GPT-4o 出现“谄媚烦人”倾向,OpenAI 计划在一周内修复
OpenAI 在 4 月 25 日发布更新,对 GPT-4o 的对话响应模式进行了细微调整,使其在交互中更加主动,并能更精准地引导对话达成有效结论。
4/28/2025 8:45:28 AM
问舟
AI无边界:通过MCP实现不同智能体框架的协作(含代码)
在人工智能飞速发展的当下,智能体框架如雨后春笋般不断涌现。 从LangChain利用高度抽象的方式构建智能体,到CAMEL - AI为用户提供细致配置选项来创建智能体,不同框架各显神通。 但这些框架之间就像说着不同“方言”的个体,彼此沟通困难重重。
4/28/2025 8:29:04 AM
大模型之路
搜索引擎后的下一个战场,广告服务商已尝试在 AI 回复中植入广告
ChatGPT 等 AI 问答产品的应用在 2022 年底开始爆发,这类提供直接答案而非链接列表的对话式 AI 对谷歌基于链接的广告模式构成了重大挑战。FT 报道称,广告集团和技术初创公司也没有放弃这个新战场,他们正在积极开发新工具,帮助品牌确保广告出现在由 AI 生成的回复中。
4/28/2025 7:40:42 AM
汪淼
我国已形成完整人工智能产业体系,专利申请量位居全球首位
据央视新闻报道,我国今年以来持续加强人工智能基础研究,同时突出应用导向,新技术正不断向具体应用场景纵深渗透,目前已形成覆盖基础层、框架层、模型层、应用层的完整人工智能产业体系。
最新数据显示,截至 2025 年 4 月 9 日,我国人工智能专利申请量达 1576379 件,占全球申请量的 38.58%,位居全球首位。
4/28/2025 7:30:41 AM
归泷
美国银行对AI的大力押注始于小规模
今年,美国银行将投资40亿美元用于AI及相关技术创新,但这家金融服务巨头七年前自主研发的AI助手Erica,如今依然是关键的投资回报率来源、客户与员工体验的核心,也是其引以为傲的成果。 2018年时,很少有人使用“助手”一词,更不用说“自主式AI”了,但美国银行组建了一个由软件工程师、语言学家和银行业专家组成的团队,打造了这款小型语言模型,该模型多年来根据呼叫中心收集的客户反馈数据不断优化。 美国银行消费者、商业和财富管理技术部门负责人哈里·戈帕尔克里什南(Hari Gopalkrishnan)表示,Erica之所以能够成功且经久不衰,关键在于其规模较小。
4/28/2025 7:05:00 AM
Paula Rooney
全国首个黑土侵蚀阻控技术智慧配置平台上线试运行
近日,由中国科学院东北地理与农业生态研究所牵头,西北农林科技大学、中国科学院南京土壤研究所、中国农业科学院农业资源与农业区划研究所、吉林农业大学、吉林省水土保持科学院等联合开发的“智保黑土”上线试运行,这是全国首个大语言模型驱动的黑土侵蚀阻控技术智慧配置平台。
4/28/2025 6:56:21 AM
归泷
清华大学成立人工智能医院,培育新一代“AI 协同型医生”
清华大学人工智能医院揭牌清华大学人工智能医院(IT之家注:Tsinghua AI Agent Hospital)建设将分阶段进行,初期将在学校 AI 全面布局和多学科医工交叉的基础上建设 AI 医院系统,依托北京清华长庚医院及北京清华长庚互联网医院试运行,以全科医学科和眼科、放射诊断科、呼吸科等专科为试点。
4/28/2025 6:49:33 AM
汪淼
AAAI2025 | 频域+注意力双加持!SNN性能飙升33%,刷新多项SOTA纪录!
一眼概览FSTA-SNN 提出了一种频域驱动的时空注意力模块(FSTA),显著提升脉冲神经网络(SNN)的特征学习能力与能效,在多个数据集上实现了更优性能和更低的脉冲发放率。 核心问题当前 SNN 在信息稀疏表示方面虽具能效优势,但其中间脉冲输出存在冗余且缺乏系统分析,导致特征提取能力受限、性能不稳定。 论文核心关注的问题是:如何在不增加能耗的前提下,抑制冗余脉冲、增强关键特征提取能力,从而提升 SNN 的整体性能与鲁棒性。
4/28/2025 3:45:00 AM
萍哥学AI
AI图像分割新王者:BiRefNet如何重新定义视觉精度边界?
一、当“抠图”变成毫米级手术:BiRefNet的技术突破你是否想过,为什么电商商品图能精准抠出发丝? 为什么自动驾驶车辆能瞬间识别行人轮廓? 答案可能藏在一种名为BiRefNet的AI模型中。
4/28/2025 3:22:45 AM
智Echo
大模型重复生成内容:根因剖析与优化策略
前言最近在调试大模型应用过程中,遇到了如下问题:复制大模型首次生成内容与「重新生成」两次返回的内容近乎完全相同,几乎没有体现出任何差异性。 面对这种情况,造成大模型输出高度相似的原因是什么呢? 我们又该采取怎样的调整策略,才能使重新生成的内容与前次存在明显差异,提升输出的多样性呢?
4/28/2025 2:22:00 AM
张张
Encoder-free无编码器多模态大模型EVEv2模型架构、训练方法浅尝
基于视觉编码器的MLLM的基本构成:MLLM通常由预训练的模态编码器、预训练的LLM和一个连接它们的模态接口三个模块组成。 模态编码器(如:CLIP-ViT视觉编码器、Whisper音频编码器等)将原始信息(如图像或音频)压缩成更紧凑的表示。 预训练的LLM则负责理解和推理处理过的信号。
4/28/2025 2:03:00 AM
余俊晖
o3猜照片位置深度思考6分48秒全程高能,范围精确到“这么近那么美”
ChatGPT新玩法,让程序员大佬Simon Willison直呼太反乌托邦了,像科幻突然变成现实:只需一张照片,靠带图深度思考就能猜出地理位置。 图片这种玩法很简单,随手拍一张风景,没有任何明显的地标即可,也不需要复杂的提示词,只需要问“猜猜这张照片是在哪里拍的? ”(需要o3/o4-mini的带图思考,先关闭所有记忆功能)。
4/28/2025 1:01:00 AM
样机素材不够用?教你用AI工具实现无限样机!
本文为你详解AI工具生成4K样机全流程,涵盖豆包/Liblib生图技巧和PS处理方法,附赠黄金提示词。 更多样机提示词:. 设计素材不用愁!
4/28/2025 12:02:03 AM
Alex
MCP 服务器很危险!这里有安全使用指南!
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP 这次真的火了! 自从Anthropic于 2024 年 11 月推出以来,它有望成为“将 AI 助手连接到数据所在系统的新标准”。 截至目前,该协议已被 OpenAI、微软和谷歌等公司迅速采用;各大供应商纷纷推出 MCP 服务器,希望在 AI 代理工作流程中不失时机。
4/27/2025 7:37:31 PM
云昭
优必选签署小批量人形机器人采购合同,将用于汽车工厂等
优必选与多家车企签订人形机器人采购合同,Walker S1和Walker C将用于汽车制造和商用接待,标志着人形机器人在工业场景的首次批量应用。#人形机器人##工业自动化#
4/27/2025 7:07:52 PM
浩渺
从“天书”到“维基百科”:DeepWiki一键让GitHub代码库变身交互式知识库!
Cognition Labs推出了一款名为DeepWiki的创新工具,旨在将任意GitHub公共代码库一键转化为详细易懂的知识库文档,并提供交互式图表与对话式AI助手支持。 据AIbase了解,DeepWiki通过分析代码、README和配置文件,自动生成结构化文档,用户可通过自然语言提问获取技术、架构或使用方法的精准解答。 社交平台上的热烈反响凸显了其颠覆性潜力,相关功能已通过DeepWiki官网(deepwiki.com)免费开放。
4/27/2025 6:00:38 PM
AI在线