AI在线 AI在线

理论

终于把卷积神经网络算法搞懂了!!!

大家好,我是小寒今天给大家分享一个强大的算法模型,卷积神经网络算法卷积神经网络算法(CNN)是一种专门用于处理具有网格结构数据(如图像)的深度学习模型,广泛应用于图像分类、目标检测、语义分割等任务。 CNN 的核心思想是通过模拟生物视觉皮层处理视觉信息的方式,能够自动从图像中提取特征,从而进行分类、检测等任务。 卷积神经网络的基本组成CNN 主要包括卷积层、池化层和全连接层。
2/21/2025 8:29:07 AM
程序员小寒

如何使用Java设计一套多智能体系统

译者 | 核子可乐审校 | 重楼2025年将成为AI智能体之年。 在本文的场景中,AI智能体是一套能够利用AI通过一系列步骤实现目标的系统,且具备就结果进行推理及更正的能力。 在实践中,智能体遵循的步骤可总结成图表形式。
2/21/2025 8:17:13 AM
核子可乐

隐形AI风险浮现:安全专家呼吁该治理“影子AI”了

网安领导者和CISO发现,近年来大量影子AI应用程序已危及企业网络,有些甚至持续运行一年多。 这些应用并非典型的攻击手段,而是员工在无IT和安全监管的情况下私自创建的AI程序。 目的是实现从自动化报告到营销自动化、数据分析等多种功能。
2/21/2025 8:10:00 AM

企业为何纷纷转向小AI模型?

当科技巨头们还在比拼千亿参数时,一场静悄悄的AI效率革命正在改写商业规则,从医疗诊断到零售库存管理,企业开始用“小模型”解决“大问题”。 大型语言模型因其多功能性、广泛的领域知识和解决复杂多步骤问题的能力而广受欢迎。 相比之下,小型模型为企业提供了一种资源消耗更少的方式,能够利用定制化的专业知识完成特定任务。
2/21/2025 8:00:00 AM
Lindsey Wilkinson

借助AI工具和版本控制实现代码库改进与重构

译者 | 刘涛审校 | 重楼随着时间的推移,代码库有可能会变得混乱且难以管理。 造成这种状况的原因包括快速修复(quik fixes:指当开发者面临时间压力时,他们经常会采用快速修复的方式来解决问题,例如临时性解决方案、不完整的修复或缺乏整体考虑,这些均会导致代码出现问题)、过时的功能或者仅仅是没有充足的时间来清理代码。 当代码变得难以阅读或修改时,会拖慢开发进度,甚至可能引发错误。
2/21/2025 8:00:00 AM
刘涛

黑客如何利用快速工程技术操纵代理人工智能

“代理”人工智能时代已经到来,企业再也不能忽视其变革潜力。 人工智能代理独立运作,根据其编程做出决策并采取行动。 Gartner预测,到2028年,15% 的日常业务决策将完全由人工智能代理自主做出。
2/21/2025 7:04:33 AM
何威风

断交OpenAI后,人形机器人独角兽首秀:一个神经网络控制整个上身,能听懂人话可抓万物

与OpenAI断交之后,Figure首个成果出炉:Helix,一个端到端通用控制模型,它能让机器人像人一样感知、理解和行动。 只需自然语言提示,机器人就能拿起任何东西,哪怕是从没见过的东西,比如这个活泼的小仙人掌。 从官方放出的演示中可以看到,它在接收到人类的提示后,就会按照指令逐一拿起桌上的物品放进冰箱。
2/21/2025 6:05:54 AM

DeepSeek R1范式复现笔记

作者 | yulei自DeepSeek R1技术报告🐳开放以来,开源社区涌现了多种「复现」工作。 本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标,探索R1/R1-zero中强化学习步骤带来的模型效果提升,并尝试展望R1技术在未来模型训练与业务落地上的前景。 一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。
2/20/2025 3:32:28 PM
腾讯技术工程

DeepSeek创始人是谁?这个问题DeepSeek也整不会了!

梁文锋到底有多低调? 你问DeepSeek官网,连自家的产品都整不会“DeepSeek的创始人是谁”这个问题。 事情是这样的。
2/20/2025 2:54:56 PM

GPU 内存交换技术,知多少?

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的 GPU 内存交换机技术。 众所周知,LLMs 虽然在诸多任务中表现出色,但其庞大的模型体积和复杂的计算需求,使得高效利用 GPU 资源成为一大难题。 尤其是在高并发场景下,如何快速加载和卸载模型,避免 GPU 闲置,成为影响推理性能和成本的关键因素...一、GPU 设备资源调度的当前现状与困境随着AI 产业的持续落地,越来越多的公司开始将大型语言模型(LLMs)部署到生产环境,并确保能够大规模服务于用户。
2/20/2025 2:52:02 PM
架构驿站

ImageNet-D 详解:严格评估神经网络的鲁棒性

神经网络在零样本图像分类中取得了惊人的成就,但它们真的能“看”得有多好呢? 现有的用于评估这些模型鲁棒性的数据集仅限于网络上的图像或通过耗时且资源密集的手动收集创建的图像。 这使得系统评估这些模型在面对未见数据和真实世界条件(包括背景、纹理和材质的变化)时的泛化能力变得困难。
2/20/2025 2:44:06 PM
二旺

DeepSeek相关人士已辟谣:融资消息均为谣言 阿里股价微跌0.88%

出品 | 51CTO技术栈(微信号:blog51cto)针对外媒称“DeepSeek 首次考虑筹集外部资金”的消息,DeepSeek相关人士今天上午已经进行了辟谣——融资消息均为谣言。 (图1)但作为另一主角的阿里,尚无回应。 腾讯科技报道,阿里美股股价微跌0.88%。
2/20/2025 2:30:31 PM

超越炒作:四个应用实例揭示GenAI的实际奏效之处

如果说2023年是GenAI的初探之年,那么2024年无疑是它深入企业骨髓,展现真正实力的关键时期。 IBM在12月发布的一项针对2300名IT决策者的调查显示,47%的受访者已经见证了AI投资的回报,33%表示达到了收支平衡,仅有14%表示亏损。 更令人振奋的是,66%的公司计划增加对AI的投资,而计划减少投资的公司仅占5%。
2/20/2025 2:13:59 PM
Maria Korolov

小红书等给AI图像检测上难度!数据集均通过人类感知“图灵测试” | ICLR 2025

量:图像分辨率从720P到4K不等,提供了更高质量的图像数据,增加了检测模型的挑战性。 AIDE模型:多专家融合的检测框架在AI生成图像检测领域,现有的检测方法往往只能从单一角度进行分析,难以全面捕捉AI生成图像与真实图像之间的细微差异。 为了解决这一问题,研究者们提出了简单且有效的AIDE(AI-generated Image DEtector with Hybrid Features)模型,该模型通过融合多种专家模块,从低级像素统计和高级语义两个层面全面捕捉图像特征,实现了对AI生成图像的精准检测。
2/20/2025 1:50:00 PM
量子位

「开源类脑芯片」二代发布!支持反向传播突触学习规则和并行神经元计算

神经形态计算的研究主要基于脉冲神经网络(SNN)模型,这是一种生物启发的计算范式,旨在模拟大脑的信息处理机制。 具体而言,该领域的目标是通过融合神经生物学和计算神经科学的理论知识,构建能够实现类人智能的计算系统。 为了解决传统计算架构在处理大量数据时面临的效率瓶颈和高功耗问题,研究者们提出了基于人脑神经元结构的神经形态芯片,以显著提升计算效率和能效比。
2/20/2025 1:48:24 PM
新智元

法国核聚变重大突破,等离子体运行1337秒刷新世界纪录!全球核电时代一步之遥

创纪录的1,337秒! 2月12日,法国WEST托卡马克装置,成功实现了创纪录的等离子体持续时间——超过22分钟。 这比几周前中国EAST装置的1066秒提升了25%。
2/20/2025 1:46:19 PM
新智元

突发,Grok-3免费上线!答对9.11和9.9谁大,1分攻克MIT积分难题

世界首个20万块GPU(另有说法是10万)训出的Grok-3,官宣人人可用了! DeepSearch、Think两大模式,同时上线。 唯独遗憾的是,Big Brain还在雪藏。
2/20/2025 1:44:01 PM
新智元

Nature认证DeepSeek成科研工具全能者,国内高校如何借力大模型?

DeepSeek的风,也是飘到了科研领域——最新消息,同济大学通过百度智能云千帆大模型平台接入并调用DeepSeek-R1/V3系列模型;包括浙大、北大清华等知名高校也是纷纷出动,要么接入模型推出智能体,又或者出品干货课程、使用手册《从入门到精通》等等,几度都登上热搜。 Nature更是几度发文,因为DeepSeek开源低成本易部署等优势,科学家们纷纷涌向DeepSeek,这种模型已经是科研AI工具中的全能者。 感知到的是,大模型在科研探索中发挥的价值远比以往任何时候都深入。
2/20/2025 1:30:00 PM
量子位