AI在线 AI在线

资讯列表

视觉语言模型安全升级,还不牺牲性能!技术解读一文看懂|淘天MMLab南大重大出品

模型安全和可靠性、系统整合和互操作性、用户交互和认证……当“多模态”“跨模态”成为不可阻挡的AI趋势时,多模态场景下的安全挑战尤其应当引发产学研各界的注意。 应对挑战,淘天集团未来生活实验室团队联手南京大学、重庆大学、港中文MMLab提出了一种全新的视觉语言模型(VLM)安全对齐方法,PSA-VLM(Progressive Safety Alignment for Vision-Language Models)。 PSA-VLM通过基于概念瓶颈模型(CBM)的架构创新,允许模型在生成答案时干预模型的中间层概念预测,从而优化大模型的最终回复,显著提升VLM在应对视觉安全风险方面的性能。
1/17/2025 1:30:00 PM
量子位

一觉醒来,在逆水寒里被AI娘包围了?豆包Kimi通义现身搅动江湖

前两天,在游戏论坛闲逛时,看见一个帖子说《逆水寒》手游更新了。 这个 AI 浓度超高的游戏最近多了几位各有特色的「AI 娘」,还多了一种名叫「AI 大模型竞技场」的新玩法。 作为一家专业的人工智能媒体,AI 竞技场我们熟呀。
1/17/2025 1:27:00 PM
机器之心

阶跃公开了自家新型注意力机制:KV缓存消耗直降93.7%,性能不减反增

随着当前大语言模型的广泛应用和推理时扩展的新范式的崛起,如何实现高效的大规模推理成为了一个巨大挑战。 特别是在语言模型的推理阶段,传统注意力机制中的键值缓存(KV Cache)会随着批处理大小和序列长度线性增长,俨然成为制约大语言模型规模化应用和推理时扩展的「内存杀手」。 虽然业界已有 MQA、GQA、MLA 等多种注意力机制变体试图解决这一问题,但这些方案要么难以在严格的显存限制下保持理想性能,要么在模型结构上引入额外复杂度,带来巨大的工程挑战和生态兼容性问题。
1/17/2025 1:20:00 PM
机器之心

2025 AAAI Fellow公布:港科大(广州)熊辉、华盛顿大学陈一昕等四位华人入选

AAAI(Association for the Advancement of Artificial Intelligence)是国际人工智能领域最权威的学术组织之一,Fellow 是该学会给予会员的最高荣誉,仅颁给对人工智能做出「非同寻常的卓越贡献者」,而且评价时间以十年计。 由于其评判极其严格,历届 AAAI Fellow 入选会士均为人工智能领域公认的著名学者,每年严格限制入选人数,因此被誉为国际人工智能领域的名人堂。 今天,AAAI 公布了 2025 年度的 Fellow 评选结果,共有 16 位 AI 学者入选,其中有 4 位华人学者。
1/17/2025 1:18:00 PM
机器之心

TPAMI-2024 | Uni-AdaFocus视频理解框架,让AI学会「划重点」,计算效率提升4-23倍!

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
1/17/2025 1:13:00 PM
机器之心

首个国产版AlphaFold3发布!大分子预测精度超车,在线平台即开即用,推理成本更是白菜价

来了,国内首个对标AlphaFold3的产品——HelixFold3,来自百度智能云与百度螺旋桨团队。 它在常规生物分子结构预测任务中实现了AlphaFold3媲美水平:尤其RNA分子和共价修饰场景中,精准度上持平或者实现了大幅超越。 △图注,蓝色为HelixFold3,黄色为AlphaFold3还有抗原-抗体结构预测任务中,成功率提升至80% ,感觉可以直接拿来研究抗体结合机制的水平。
1/17/2025 1:00:00 PM
量子位

看听读全都会的六边形战士MiniCPM,来啦

MiniCPM-o 2.6开源啦,该模型视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别。 图片简介MiniCPM-o 2.6是一个端侧多模态大模型,具有8B参数量。 它基于SigLip-400M、Whisper-medium-300M、ChatTTS-200M和Qwen2.5-7B构建,通过端到端的方式训练和推理。
1/17/2025 11:38:10 AM
哎呀AIYA

大模型时代,人机交互体验将被怎样重塑?

在科技持续演进、创新浪潮迭起的当下,人类与计算机的关系日益紧密,成为推动社会发展的关键力量。 自从世界上第一台计算机ENIAC被发明以来,人机交互就成为计算机科学非常重要的一个分支学科。 人机交互(Human-Computer Interaction,HCI)指的是人类和计算机之间的信息交换和互动的过程,目标是使这种交互尽可能直观、高效、满足需求。
1/17/2025 11:37:46 AM
Yu

OpenAI前CTO最隐秘AI创业:没名字没方向,挖走OpenAI高管,10位顶尖人才投奔

公司名字没有,产品方向未定。 OpenAI前CTO创业几个月,却已经有10位顶尖研究员和工程师投奔。 且分别来自OpenAI、谷歌、Anthropic这几个巨头。
1/17/2025 11:27:12 AM
量子位

对2025年AI的四个大胆预测

随着2024年的结束,我们可以回顾并认识到,AI已经取得了令人瞩目且开创性的进展。 按照当前的发展速度,几乎无法预测2025年AI将带来怎样的惊喜,但有几个趋势为企业描绘了一幅来年可期以及如何充分准备的动人画卷。 推理成本骤降过去一年,前沿模型的成本稳步下降。
1/17/2025 11:14:42 AM
Ben Dickson

2025年AAAI Fellow名单出炉!港科大(广州)熊辉等四位华人学者入选

2025年AAAI Fellow名单火热出炉! 其中四位华人学者获选。 每年,AAAI通过其Fellow计划表彰一批在人工智能领域做出重大、持续贡献的个人。
1/17/2025 11:07:28 AM
新智元

图像编辑大一统?多功能图像编辑框架Dedit:可基于图像、文本和掩码进行图像编辑

本文经AIGC Studio公众号授权转载,转载请联系出处。 今天给大家介绍一个基于图像和文本的编辑的框架D-Edit,它是第一个可以通过掩码编辑实现图像编辑的项目,近期已经在HuggingFace开放使用,并一度冲到了热门项目Top5。 使用 D-Edit 的编辑流程。
1/17/2025 10:30:00 AM
AIGC Studio

一键编辑一万张图片,Adobe发布新款AI工具

1月16日消息,据外媒报道,Adobe正在推出新的生成式AI工具,可以自动完成劳动密集型的生产任务,如编辑大量图像和翻译视频演示。 其中最引人注目的是“Firefly Bulk Create”应用程序,允许用户快速调整多达1万张图片的大小,或者一次点击就可以替换所有的背景,而不是逐个编辑每张图片。 该工具是通过结合Adobe为开发人员提供的几个基于firefly的API而创建的,目的是使缺乏技术编码经验的创意人员更容易使用它们。
1/17/2025 10:30:00 AM
Yu

斯坦福研究:ChatGPT性能,曾出现下降趋势

斯坦福大学和加州伯克利大学的研究人员在“哈佛数据科学评论”上,发布了一篇名为《ChatGPT行为随时间变化》的论文。 研究人员通过GPT-3.5、GPT-4(2023年3月和6月两个版本)模型在数学问题、代码生成、多跳知识密集问答、美国医学执照考试、多跳知识密集型问题回答等7项任务进行了深度研究,以查看ChatGPT随着时间推移其性能的变化趋势。 结果显示, GPT-3.5 GPT-4的性能和行为在3个月内出现了明显波动。
1/17/2025 10:26:19 AM
AIGC开放社区

引领图像编辑领域的新潮流!Edicho:实现跨图像一致编辑的新方法(港科&蚂蚁&斯坦福)

本文经AIGC Studio公众号授权转载,转载请联系出处。 在图像处理领域,如何实现跨图像的一致编辑一直是技术挑战。 传统方法往往局限于单张图像的编辑,难以保证多张图像间编辑效果的一致性。
1/17/2025 10:00:00 AM
AIGC Studio

真正实时地图更新!GS-LIVO:首个可部署在资源受限嵌入式系统上的实时高斯SLAM框架

本文经3D视觉之心公众号授权转载,转载请联系出处。 实时地图更新近年来,随着同步定位与建图(SLAM)技术的发展,出现了多种显式地图表示方法,包括稠密彩色点云、稀疏基于块的结构,以及基于网格或基于曲面元素(surfel)的重建。 这些形式通常与基于特征的方法或直接方法相结合,在无人机和移动机器人等平台上支持高效、实时操作。
1/17/2025 9:45:00 AM
3D视觉之心

啥是AI Agent!2025年值得推荐入坑AI Agent的五大工具框架!

在AI技术飞速发展的今天,AI Agent已经成为了一个热门的研究和应用领域。 无论是企业还是个人开发者,都希望能够借助AI Agent来提升工作效率、优化业务流程或创造全新的用户体验。 然而,从零开始构建一个AI Agent并非易事,幸运的是,市面上有许多优秀的框架可以帮助我们快速入坑。
1/17/2025 9:30:21 AM
狂师

《自然》重磅:微软推出MatterGen ,AI 颠覆材料设计

刚刚,顶尖学术期刊《自然》(Nature)刊发了一项具有里程碑意义的研究成果:微软研究院的研究团队成功开发了一种名为MatterGen的全新扩散生成模型。 MatterGen 的出现为材料科学的逆向设计开启了一个全新的篇章,它不仅能够生成覆盖整个元素周期表、稳定且多样的无机材料,而且能够通过微调,精确地控制所生成材料的化学成分、对称性以及包括磁性密度、力学性能、电子特性等在内的多种物理性质MatterGen的创新之处MatterGen之所以能够取得如此显著的突破,源于其在模型架构和训练方法上的多维度创新:1.  定制化的扩散过程: 针对晶体材料的特殊性,MatterGen引入了一套定制化的扩散过程,该过程可以独立地对原子类型、坐标和晶格进行扰动,并将其导向一个符合物理规律的随机分布。
1/17/2025 9:11:49 AM
AI寒武纪