AI在线 AI在线

资讯列表

GenAI红队:将LLM置于网络安全测试中的技巧和技术

译者 | 晶颜审校 | 重楼从头构建一个GenAI红队,或者让现有的红队适应新技术是一个复杂的过程,OWASP在其最新指南中帮助阐释了这一过程。 红队是测试和支持网络安全系统的一种有效方法,但它仍需适应技术的发展而不断完善。 近年来,生成式人工智能(GenAI)和大型语言模型(LLM)的爆炸式增长正迫使红队世界适应。
4/7/2025 8:33:49 AM
晶颜

DeepSeek前脚发新论文,奥特曼立马跟上:GPT-5就在几个月后啊

有点意思。 这不DeepSeek前脚刚刚上新了一篇关于推理时Scaling Law的论文嘛,引得大家纷纷联想是不是R2马上要来了。 然鹅……奥特曼这边却发了一条“变卦”的消息:计划改变:我们可能在几周之后先发布o3和o4-mini。
4/7/2025 8:15:00 AM
量子位

大模型除了聊天还能做什么?关于大模型的分类和应用

大模型技术发展到今天,其功能可以说是日新月异;并且很多企业已经在探索大模型的应用场景和技术实现;但是很多人到现在对大模型的了解仅仅只限于能聊个天,问个问题。 但实际上,大模型能够做的事要远比我们想象中的要多的多;因此,今天我们就从用户和技术两个角度来介绍一下大模型的应用。 关于大模型的分类和应用问题如果想弄清楚大模型是怎么使用的,首先要知道大模型的分类;不同类型的模型适合不同的应用场景,其功能和实现也各不相同。
4/7/2025 8:15:00 AM
DFires

英伟达GPU命名背后:是情怀,也是致敬伟人的智慧! 新智元 新智元 2025年04月05日 12:17

在上周结束的GTC大会上,老黄用两个多小时向我们介绍了英伟达过去一年的进展。 其中,最让人们关注就是「每年一更」的用于未来AI工厂的GPU芯片架构路线图。 2024年,Blackwell GPU发布;2025年上半年,Blackwell GPU已经全面发货;2025年下半年,推出Blackwell Ultra;2026年下半年,将重磅发布Vera Rubin;2027年下半年,推出Rubin Ultra;再往后,就是2028年上市的Feynman。
4/7/2025 8:07:00 AM
新智元

吉卜力风格 AI 图刷屏之际,消息称 OpenAI 正测试 GPT-4o 生图模型水印

消息人士也称,OpenAI近期确实开始尝试在免费账户生成的图片中加入水印。而只要订阅了 ChatGPT Plus,就可以保存没有水印的图像。
4/7/2025 8:00:33 AM
清源

实测700多张图!深度测评最懂设计的AI生图模型:Ideogram 3.0

大家好,我是言川。 最近 GPT-4o 发布的图像功能太炸裂了,整个圈子里都是 4o 生成的作品。 但我要告诉大家的是,就在 GPT-4o 图像功能发布的第二天,有一款图像模型也升级了。
4/7/2025 7:33:05 AM
言川Artie

Meta 新旗舰 AI 模型 Llama 4 Maverick 测试成绩遭质疑,被指针对性优化

Meta发布新旗舰AI模型Maverick,在LM Arena测试中排名第二,但被质疑测试版本与公开版本不一致,存在针对性优化。研究人员指出公开版与测试版行为差异明显,Meta暂未回应。#AI争议# #Meta新模型#
4/7/2025 7:27:44 AM
远洋

OpenAI新计划!几周后推出o3 和 o4-mini,几个月内推出 GPT-5!

就在刚刚,奥特曼发了一条推文宣布:计划有变! 他表示:我们最终将发布o3和o4-mini,可能在几周后,然后在几个月后推出GPT-5。 这有很多原因,但最令人兴奋的是,我们将能够使GPT-5 比我们最初设想的更好。
4/7/2025 7:18:48 AM

Dify+RAGFlow:1+1>2的混合架构,详细教程+实施案例

企业在落地 RAG 知识库时, Dify 和 RAGFlow 这两个开源框架应该选择哪个? 这也是我一直以来做RAG咨询时,经常被企业方问到的问题之一。 一般来说,如果需要处理特别复杂的文档和非结构化数据,RAGFlow 是优选。
4/7/2025 7:00:00 AM
韦东东

Llama 4开源王者归来!推理、编码打平DeepSeek V3但参数减一半,一张H100就能跑,还有巨兽2万亿参数模型!

编辑 | 李美涵出品 | 51CTO技术栈(微信号:blog51cto)深夜,Meta如期发布了全新的开源大型模型系列——Llama 4,并未出现任何“跳票”传闻中的推迟情况! 图片此次发布也标志着Meta与近来崛起的开源新王 DeepSeek 正面硬钢。 Meta官推更是表示:表示:“今天开启了原生多模态AI创新的新时代”。
4/7/2025 7:00:00 AM
李美涵

模态编码器|EVA改进之EVA-02

来自智源曹越团队在EVA的优化改进方面的工作EVA-02,项目地址::在CV领域,训练、调优和评估非常大的视觉模型需要大量的计算资源,限制了许多研究人员和开发者的参与。 因此,本研究主要目的是提供一种高效且性能强大的预训练方法,不仅能够在多种下游任务中展现出色的迁移学习能力,而且还能显著减少参数数量和计算成本。 01、模型架构EVA-02的基础是一个改进版的纯Transformer架构,该架构在原始ViT的基础上进行了若干重要的修改,以更好地适应大规模预训练任务的需求。
4/7/2025 6:30:00 AM
Goldma

模态编码器|CLIP技术改进之EVA-CLIP

上一篇看了EVA,趁热打铁,今天来看EVA-CLIP,同样是智源曹越团队的工作,主要研究主题是结合EVA改进CLIP。 研究动机:训练CLIP模型面临计算成本高和训练不稳定等挑战,尤其是在扩大模型规模时。 因此,这项工作的研究动机是提供一种高效且有效的解决方案,以促进更大规模CLIP模型的训练和发展。
4/7/2025 5:30:00 AM
Goldma

一文掌握 MCP 上下文协议:从理论到实践

MCP模型上下文协议(Model Context Protocol,简称 MCP)是一种开放标准,旨在标准化大型语言模型(LLM)与外部数据源和工具之间的交互方式。 由 Anthropic 于 2024 年 11 月推出,MCP 通过定义统一的接口,使 AI 应用能够安全、灵活地访问和操作本地及远程数据资源,提升模型的功能性和可扩展性。 图片Transports(传输层)在 MCP 协议中,传输层提供了客户端与服务器之间通信的基础,其负责处理消息的发送与接收的底层机制。
4/7/2025 5:01:00 AM
陈明勇

DeepSeek R1 vs OpenAI O3 vs Gemini 2 Pro—谁最适合做客服主管的AI

Deepseek在2025年1月颠覆了全球人工智能模型,但谷歌和OpenAI很快发布了Gemini2 Pro和O3。 这就产生了一个问题,应该使用哪种人工智能模型来进行客户服务? 为了评估这些模型在客户服务任务上的表现,我们必须更深入地了解它们在各种AI基准上的表现。
4/7/2025 5:00:00 AM
晓晓

模态编码器|EVA探索掩码视觉表征学习的极限

今天来看一篇经典的视觉表征学习的方法EVA,来自智源研究院发表在2023年CVPR的一篇工作。 项目地址::自然语言处理(NLP)领域通过扩展预训练语言模型(PLMs)取得了革命性的成功,作者希望将这种成功从语言领域转移到视觉领域,即扩展一个视觉中心的基础模型,以便于视觉和多模态下游任务。 另外,视觉模型预训练和扩展的方法主要依赖于监督或弱监督训练,需要数百万个(通常是不可公开访问的)标注数据。
4/7/2025 4:30:00 AM
Goldma

人工智能在物联网中的挑战和局限性

虽然人工智能在物联网中的集成提供了诸多好处,但也带来了一定的挑战和限制。 了解并解决这些问题对于确保人工智能在物联网系统中的成功部署和利用非常重要。 让我们探讨一些关键挑战:人工智能驱动的物联网系统中的安全和隐私问题人工智能驱动的物联网设备中连接性和数据交换的增加引发了安全和隐私问题。
4/7/2025 4:00:00 AM
chris han

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!

DeepSeek R2,果然近了。 最近,DeepSeek和清华的研究者发表的这篇论文,探讨了奖励模型的推理时Scaling方法。 图片论文地址:,强化学习(RL)已广泛应用于LLM的大规模后训练阶段。
4/7/2025 3:44:00 AM
新智元

模态编码器|CLIP详细解读

下面来详细了解一下多模态大模型模态编码器部分。 今天首先来看下CLIP,OpenAI发表在2021年ICML上的一篇工作。 项目地址::在自然语言处理(NLP)领域,通过大规模的文本数据预训练模型(如GPT-3)已经取得了显著的成果,但在计算机视觉领域,预训练模型仍然依赖于人工标注的图像数据集,严重影响了其在未见类别上的泛化性和可用性(需要用额外的有标注数据)。
4/7/2025 3:30:00 AM
Goldma