AI在线 AI在线

AI

大模型何以擅长小样本学习?ICLR 2025这项研究给出详细分析

近年来,大语言模型(LLM)在人工智能领域取得了突破性进展,成为推动自然语言处理技术发展与通用人工智能实现的核心力量。 上下文学习能力(In-Context Learning, ICL)是 LLM 最显著且重要的能力之一,它允许 LLM 在给定包含输入输出示例的提示(prompt)后,直接生成新输入的输出,这一过程仅通过前向传播而无需调整模型权重。 这种能力使得 LLM 能够基于上下文中的示例快速理解并适应新任务,展现出强大的小样本学习和泛化能力。
4/27/2025 9:10:00 AM
机器之心

首个大模型全链路安全综述 !南洋理工新国立等发布LLM Safety全景图:从数据、训练到部署的全面梳理

随着人工智能技术迅猛发展,大模型(如GPT-4、文心一言等)正逐步渗透至社会生活的各个领域,从医疗、教育到金融、政务,其影响力与日俱增。 然而,技术的进步也伴随着潜在风险——大模型安全这一议题正成为全球科技界关注的焦点。 南洋理工大学、新加坡国立大学等全球40余所顶尖机构的67位学者联袂打造大模型全链路安全综述,综合梳理了843篇文章,系统的从全栈视角分析了大模型从出生到应用的全栈安全,涵盖数据准备→预训练→后训练→部署→商业化应用以及安全性评估等全部阶段。
4/27/2025 9:07:00 AM
量子位

GitHub版DeepResearch来了!覆盖所有代码库,模型架构可视化,背后贡献者也能扒 |免费

专为GitHub打造的免费百科全书来了——DeepWiki,覆盖全球所有GitHub存储库,无需注册即可食用。 最简单的触发模式,就是只需要把链接中「github」改为「deepwiki」字样,就可以生成项目专属的wiki百科页面。 整个页面模块清晰流畅,还有生成可视化架构图(对比GitHub项目主页是没有的),每个部分都有相关的资料来源,可以直接触达,开发者们查阅起来很方便。
4/27/2025 9:05:00 AM
量子位

具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

OpenAI 的 o1 系列模型、Deepseek-R1 带起了推理模型的研究热潮,但这些推理模型大多关注数学、代码等专业领域。 如何将这种深度推理模型扩展到智能体和具身领域,让机器人通过思考和推理来完成复杂具身交互等任务? 近期,来自浙江大学、中科院软件所和阿里巴巴的团队提出了 Embodied-Reasoner,让机器人或智能体拥有深度思考和交互决策能力,从而在真实物理世界完成环境探索、隐藏物体搜索、交互和搬运等长序列复杂任务。
4/27/2025 8:55:00 AM
机器之心

OpenAI、谷歌等一线大模型科学家公开课,斯坦福CS 25春季上新!

在斯坦福,有一门专门讲 Transformer 的课程,名叫 CS 25。 这门课曾经邀请过 Geoffrey Hinton、Andrej Karpathy 以及 OpenAI 的 Hyung Won Chung、Jason Wei 等一线大模型研究科学家担任讲师,在 AI 社区引起广泛关注。 最近,这门课又上新了。
4/27/2025 8:40:00 AM
机器之心

如何利用网络爬虫进行大规模LLM数据收集

大语言模型的 “智慧” 很大程度上依赖于其训练数据的质量和数量。 想要打造一个能够理解真实世界的模型,就必须获取来自真实世界的信息,而互联网无疑是海量数据的主要来源。 本文将深入探讨如何利用网络爬虫收集大规模、适用于 AI 训练的数据,为人工智能模型的训练筑牢坚实基础。
4/27/2025 4:05:00 AM
大模型之路

你的 MCP 调用正在成为系统的"后门",这个解决方案刻不容缓!

在人工智能快速发展的今天,大型语言模型 (LLM) 已成为提升工作效率的重要工具。 随着 MCP(Model Context Protocol)的出现,我们有了一种标准化的方式来与 AI 模型交互。 然而,当需要同时使用多个 MCP 资源服务器时,管理和使用这些服务不仅变得复杂,安全问题也越发严重。
4/27/2025 3:34:00 AM
PIG AI

深度研究 | 解构国内外代表性Agentic AI系统风险模型

Agentic AI正在走向现实应用。 这些拥有自主决策能力的AI系统也带来了全新的安全挑战。 与传统网络安全风险不同,Agentic AI系统面临着更为复杂、多维度的威胁态势,需要我们以创新的视角重新审视安全防护体系。
4/27/2025 3:10:00 AM

Flink结合AI的智能日志降噪系统设计与实现

安全日志管理是现代IT系统的关键环节,其规模和复杂性随系统复杂度提升而迅速增长。 Apache Flink作为领先的流处理框架,以其高吞吐、低延迟和强大的容错机制成为安全日志处理的理想选择。 然而,传统的日志管理方法在处理大规模多源异构安全日志时面临诸多挑战,包括实时性不足、静态规则过滤导致的误报/漏报、人工分类效率低下等问题。
4/27/2025 1:05:00 AM
demo1234567

理解 RAG 第四部分:检索增强生成评估框架

检索增强生成(RAG) 在扩展独立大型语言模型(LLM)的局限性和克服其诸多限制方面发挥了关键作用。 通过整合检索器,RAG 增强了响应的相关性和事实准确性:它只需实时利用外部知识源(例如矢量文档库),并在原始用户查询或提示中添加相关的上下文信息,然后将其传递给 LLM 进行输出生成。 对于那些深入 RAG 领域的人来说,一个自然而然的问题出现了:我们如何评估这些远非简单的系统?
4/27/2025 12:30:00 AM
晓晓

知识图谱火了?

知识图谱技术正在悄然升温。  这项技术虽然在AI创业赛道中出现频次最低,但近期却被频频提及。  从大型科技公司到创业企业,知识图谱已成为兵家必争之地。
4/27/2025 12:10:00 AM
大数据AI智能圈

CVPR2025 | 即插即用!清华国科大等推出视觉微调框架,仅需调整5%骨干网络参数

仅调整5%的骨干网络参数,就能超越全参数微调效果? 还是在实例分割、目标检测、旋转目标检测这样的经典视觉任务场景。 这是来自清华、国科大、上海交大、阿里巴巴的一项研究,相关论文已被CVPR2025接受。
4/26/2025 4:44:45 PM

中国成为全球人工智能专利最大拥有国,占比 60%

人民日报今天(4 月 26 日)发布博文,报道称在国务院新闻办举行的新闻发布会上,国家知识产权局局长申长雨表示,中国拥有的全球百强科技集群数量连续两年位居世界各国之首,已成为全球人工智能专利最大拥有国。
4/26/2025 3:35:45 PM
故渊

央视曝光不法分子利用 AI 伪造“非遗传承人形象”虚假宣传,高价销售低质产品

央视网曝光一起AI伪造非遗传承人形象虚假宣传案例。涉事企业通过电商平台销售“苗古金贴”产品,宣称由苗族非遗传承人研发,实则AI生成虚拟人物,证书违规颁发。产品代工贴牌成本仅2.5元/盒,却以59元高价销售。目前监管部门已介入。#AI诈骗# #虚假宣传#
4/26/2025 2:18:52 PM
漾仔

谷歌 DeepMind 推 QuestBench 基准,评估 AI 模型的推理“补漏”能力

谷歌 DeepMind 团队推出 QuestBench 新基准,通过约束满足问题(CSPs)框架,评估模型在推理任务中识别和获取缺失信息的能力。
4/26/2025 1:54:36 PM
故渊

谷歌升级 Music AI Sandbox:新增 Lyria 2 模型,音乐创作迈步新时代

谷歌 DeepMind 扩展其 Music AI Sandbox 平台,搭载最新的 Lyria 2 音乐生成模型,并向音乐人、词作者和制作人推出全新功能。
4/26/2025 10:29:23 AM
故渊

7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法

在大模型时代,视觉语言模型(Vision-Language Models, VLMs)正在从感知走向推理。 在诸如图像问答、图表理解、科学推理等任务中,VLM不再只需要「看见」和「描述」,而是要能「看懂」和「想清楚」。 然而,当前主流的推理能力提升方法普遍存在两个问题:1.
4/26/2025 9:25:00 AM
新智元

从分钟到秒级:Meta Space Llama 模型登陆国际空间站,刷新太空 AI 速度

Meta 公司昨日(4 月 25 日)发布公告,宣布携手 Booz Allen,已经在国际空间站(ISS)美国国家实验室部署 Space Llama,是基于开源 Llama 3.2 打造的定制 AI 模型。
4/26/2025 8:57:14 AM
故渊