理论
用AI对抗AI:网络安全专家如何利用犯罪分子的工具来对付他们
一段时间以来,AI在网络安全领域一直发挥着作用。 如今,自主式AI正成为焦点。 基于预先设定的计划和目标,自主式AI能够做出选择,以优化结果,而无需开发者的干预。
Qwen-Agent:基于通义千问的智能体开发框架全面解析
最近逛 GitHub 时,看到了 Qwen 开源的专用 Agent 框架,Qwen-Agent 。 为开发者提供了强大的工具和灵活的接口,支持构建具备指令遵循、工具使用、规划、记忆等能力的智能体应用。 本文将深入解析 Qwen-Agent 的核心功能、安装配置、使用示例及常见问题,帮助开发者快速上手并高效开发。
SpringAI更新:废弃tools方法、正式支持DeepSeek!
AI 技术发展很快,同样 AI 配套的相关技术发展也很快。 这不今天刚打开 Spring AI 的官网就发现它又又又又更新了,而这次更新距离上次更新 M7 版本才不过半个月的时间,那这次 Spring AI 给我们带来了哪些惊喜呢? 一起来看。
“逆天”研究!Cursor 与 Windsurf 背后的核心算法机制曝光!网友惊呼:Cursor代码总出Bug的原因找到了
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)Vibe coding正火得一塌糊涂,但谁能想到,刚刚一位大佬已经把当红的AI编程神器Cursor和Windsurf背后的核心算法机制研究出来了! 今天凌晨,一位名为Nir Diamant的技术大牛发表了一篇高质量神文,可以说把Cursor和Windsurf的核心算法说得非常透彻,就像玩抖音的需要了解抖音推荐算法一样,正在Vibe Coding的我们,当然也得快速吃透跟自己对话的编程助手,究竟是怎样一个思维回路。 非常细节,值得各位收藏细读一番。
微软不松手,OpenAI 不回头
OpenAI走到了一个分水岭上,正试图把自己从一个设限的实验项目,转向一个可以在资本市场独立行走的企业体。 但它不能独行。 微软挡在前头,松不开手,也不愿撒手。
Poe 发布 AI 模型报告:GPT-4o 独占鳌头,Gemini 推理异军突起,快手可灵黑马搅局!
AI 模型市场,就像一场不停撤掉椅子的游戏,玩家们争抢着位置。 谁坐得稳,谁被挤下,数据在说话。 Poe 平台拿出了一份报告,打开一个窗口,让我们看看 2025 年 1 月到 5 月,这个市场的风云变幻。
字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA
5 月 13 日,火山引擎在上海搞了场 FORCE LINK AI 创新巡展,一股脑发布了 5 款模型和产品,包括豆包・视频生成模型 Seedance 1.0 lite、升级后的豆包 1.5・视觉深度思考模型,以及新版豆包・音乐模型。 同时,Data Agent 和 Trae 等产品也有了新进展。 其中,全场最吸睛的就是豆包 1.5・视觉深度思考模型(以下称 Seed 1.5-VL)。
首个,专攻点云上下文学习自适应采样!支持点级、提示级|CVPR 2025
3D点云处理(PCP)涉及多种任务,如分割、去噪、配准、重建等,传统方法通常是为每个任务设计专用模型,导致过程繁杂、成本高昂。 虽然多任务学习(MTL)能缓解模型数量问题,但在任务冲突、参数调优方面仍存在挑战。 近年来兴起的In-Context Learning(ICL,上下文学习)技术,是指大型语言模型在不进行显式参数更新的情况下,仅通过输入中的示例(即上下文信息)来完成新的任务。
ICML 2025 | 如何在合成文本数据时避免模型崩溃?
随着生成式人工智能技术的飞速发展,合成数据正日益成为大模型训练的重要组成部分。 未来的 GPT 系列语言模型不可避免地将依赖于由人工数据和合成数据混合构成的大规模语料。 然而,这一趋势也带来了严峻挑战:合成数据如果不加控制地使用,可能引发 “模型崩溃”(Model Collapse)问题。
Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型
Qwen3技术报告新鲜出炉,8款模型背后的关键技术被揭晓! 采用了双模式架构,一个模型同时支持推理和非推理任务,根据需要自动切换。 训练和微调过程采取分段式策略,逐步构建模型能力。
o3完爆人类医生,OpenAI基准直击AGI!
最强AI,已击败了人类医生。 就在刚刚,全球60个国家,262名执业医生共同上阵,联手OpenAI打造出「最具AGI标志性」的AI健康系统评估标准——HealthBench。 这个基准包含了5,000个基于现实场景的健康对话,每个对话都有医生定制的评分标准,来评估模型的响应。
我花了整整两周,深度体验了五款最火的 AI 工具,发现它们都有个致命的问题......
Hello,大家好,我是 Sunday。 2025 年都来了,AI 工具已经不再是什么 “黑科技” 拉,而是实打实落地到我们每一个前端人日常开发流程中的 真 -- 提效神器。 但问题也来了,目前市面上 AI 工具越来越多,宣传都很猛,那么真的能用的到底几个呢?
突发,美商务部叫停「AI扩散规则」藏杀机!英伟达市值再破3万亿
《AI扩散规则》生效前夜,特朗普政府正式叫停。 13日晚,美商务部工业和安全局(BIS)宣布,撤销拜登签署的《AI扩散规则》(即将在5月15日生效)。 图片与此同时,他们又出台了加强全球半导体出口管制的新措施,这些限制可谓是又准又狠。
3D人脸黑科技!Pixel3DMM:单张RGB图像秒变3D人脸,姿势表情精准还原,几何精度碾压竞品15%!
慕尼黑工业大学和伦敦大学学院提出了一款经过微调的 DINO ViT模型 Pixel3DMM,用于逐像素表面法线和 UV 坐标预测。 从上到下,下图展示了 FFHQ 输入图像、估计的表面法线、根据预测的 UV 坐标估计的二维顶点,以及针对上述两个线索的 FLAME 拟合结果。 使用Pixel3DMM 进行野外追踪。
谷歌开源基于物理模拟的气象模型,能预测暴雨、台风、大干旱
传统的通用循环模型(GCMs)在天气预报和气候模拟方面发挥了重要作用,但在处理特殊状态的小尺度时存在局限性,例如,处理云、辐射和降水等未完全解析的物理过程时会使用半经验性参数化,会导致模型在匹配历史数据时的调参过程仍然依靠手动设置,且GCMs自身存在许多持续的错误和偏见。 。 所以为了克服这些困难,谷歌提出了基于物理模拟的神经通用环流气象模型NeuralGCM,并已经开源提供给各大气象机构测试和使用。
ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式
该工作由通用人工智能研究院 × 北京大学联手打造。 第一作者郑欣悦为通用人工智能研究院研究员,共同一作为北京大学人工智能研究院博士生林昊苇,通讯作者为北京大学助理教授梁一韬和通用人工智能研究院研究员郑子隆。 开发能在开放世界中完成多样任务的通用智能体,是AI领域的核心挑战。
Poe:DeepSeek使用率下降50%,快手崛起、OpenAI暴涨
今天凌晨,全球著名大模型整合应用平台Poe发布了,2025年春季AI模型使用趋势报告。 结果显示,DeepSeek R1的使用率从2月中旬的峰值7%下降到了4月底的3%,整体使用率下降超过50%;OpenAI由于在GPT-4o推出新的文生图功能后,例如,吉卜力风格、仿真自拍等类型图片,实现病毒式增长使用率暴涨。 下面「AIGC开放社区」将从文本、视频、推理、图像和音频5大领域为大家解读这份报告。
首次!流匹配模型引入GRPO,GenEval几近满分,组合生图能力远超GPT-4o
本文由香港中文大学与快手可灵等团队联合完成。 第一作者为香港中文大学 MMLab 博士生刘杰,他的研究方向为强化学习和生成模型,曾获 ACL Outstanding Paper Award。 流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能,已成为图像生成(Stable Diffusion, Flux)和视频生成(可灵,WanX,Hunyuan)领域最先进模型的训练方法。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉