神经网络
ImageNet-D 详解:严格评估神经网络的鲁棒性
神经网络在零样本图像分类中取得了惊人的成就,但它们真的能“看”得有多好呢? 现有的用于评估这些模型鲁棒性的数据集仅限于网络上的图像或通过耗时且资源密集的手动收集创建的图像。 这使得系统评估这些模型在面对未见数据和真实世界条件(包括背景、纹理和材质的变化)时的泛化能力变得困难。
2/20/2025 2:44:06 PM
二旺
再谈什么是神经网络,透过现象看本质
面对着网络上各种各样关于神经网络的内容,很多想学习神经网络的人都无从下手,包括作者自己;面对各种乱七八糟的概念,名词,很多人都被这些东西蒙住了眼睛。 所以,今天我们就抛开各种高大上的概念,从本质出发来学习什么网络;我们今天不讨论CNN,RNN,Transformer,LSTM等各种神经网络架构;只讨论什么是神经网络。 神经网络对神经网络有过了解的人应该都知道,神经网络就是仿生学的一种实现,使用的是数学模型模拟人类的大脑神经系统;具体的可以看一下上一篇文章——从一个简单的神经网络模型开始。
2/20/2025 8:10:00 AM
AI探索时代
Transformer 的三大优化技术!!
Transformer 是一种基于自注意力(Self-Attention)机制的深度学习模型,最早由 Vaswani 等人在 2017 年的论文《Attention Is All You Need》中提出。 与传统的循环神经网络(RNN)和长短期记忆网络(LSTM)不同,Transformer 丢弃了递归计算结构,而是通过自注意力机制并行处理输入序列,从而大大提高了计算效率。 Transformer 广泛用于自然语言处理(NLP)和计算机视觉(CV)领域,如机器翻译、文本生成、文本分类、目标检测等。
2/20/2025 12:28:59 AM
程序员小寒
从一个简单的神经网络模型开始
关于神经网络的文章写的也不少了,但一直没弄明白神经网络到底是怎么运作的;而现有的神经网络模型又太复杂,如Transformer,CNN,RNN,以及各种应用场景(NLP,CV,分类任务,回归任务等等);导致我们无法看到神经网络最本质的东西。 所以,今天我们就来从最简单的神经网络开始学起。 简单神经网络神经网络的基本原理很简单,那就是模仿由人类大脑神经元构成的神经网络;神经元结构如下图所示:上图是生物学中神经元的基本结构,神经元由树突和轴突以及细胞核组成;而不同神经元之间通过轴突进行连接;当然这些都是中学生物学的基础,就不多说了。
2/19/2025 6:00:00 PM
AI探索时代
新的训练范式可以防止机器学习模型学习虚假相关性
译者 | 李睿审校 | 重楼机器学习领域长期存在的问题之一是错误相关性的记忆。 例如:假设开发人员正在开发一个深度神经网络对陆地鸟类和海洋鸟类的图像进行分类。 他们使用数千张标记过的图像训练模型,这个模型在训练集和测试集上的表现都非常出色。
2/11/2025 8:11:56 AM
李睿
特征金字塔网络及变体【详解及代码实现】
在深度学习和计算机视觉领域,架构创新在推动技术进步中发挥了重要作用。 在这些创新中,特征金字塔网络(Feature Pyramid Networks, FPN)脱颖而出,成为革命性的基础构建模块,彻底改变了我们在神经网络中处理多尺度特征表示的方式。 本文将深入探讨FPN。
1/16/2025 12:30:00 PM
二旺
阿里达摩院提出开源AI图片上色模型DDColor:可以为黑白照片、人物、动漫风景等一键上色!
DDColor 可以为历史黑白老照片提供生动自然的着色。 它甚至可以对动漫游戏中的风景进行着色/重新着色,将您的动画风景转变为逼真的现实生活风格! 相关链接项目:github.com/piddnad/DDColorDemo:replicate.com/piddnad/ddcolor论文:arxiv.org/abs/2212.11613论文阅读摘要图像着色是一个具有挑战性的问题,由于 多模态不确定性和高病态性。
1/13/2025 9:17:41 AM
AIGC Studio
入门 Transformer:概念、代码与流程详解
引言论文《Attention is All You Need》(Vaswani等,2017)提出了Transformer架构,这一模型通过完全摒弃标准的循环神经网络(RNN)组件,彻底改变了自然语言处理(NLP)领域。 相反,它利用了一种称为“注意力”的机制,让模型在生成输出时决定如何关注输入的特定部分(如句子中的单词)。 在Transformer之前,基于RNN的模型(如LSTM)主导了NLP领域。
1/2/2025 3:40:23 PM
二旺
比人类神经元快10亿倍!港中文、中科院「超级大脑」:1秒识图3479万张
人工神经元,比人类大脑快10亿倍,将会是怎样的景象? 如今,这一科幻般的场景,早已成为了现实。 来自香港中文大学、中国科学院物理研究所等机构科学家,成功开发出了一种基于「激光」的人工神经元。
1/2/2025 1:30:00 PM
新智元
图像相似度估计 | 结合三元组损失的暹罗网络
在机器学习领域,确定图像之间的相似度在各种应用中至关重要,从检测重复项到面部识别。 解决这个问题的一个强大方法是使用暹罗网络结合三元组损失函数。 在本文中,我们将探索如何构建和训练暹罗网络以估计图像相似度,并通过一个来自GitHub仓库的实际示例进行说明。
12/31/2024 8:20:00 AM
二旺
基于CNN+PyTorch实现视觉检测分类
译者 | 朱先忠审校 | 重楼本文给出了一个使用CNN+PyTorch实现汽车电子行业视觉检测分类详尽的实战案例解析。 在本文中,我们开发了一个卷积神经网络(CNN),用于汽车电子行业的视觉检测分类任务。 在此过程中,我们深入研究了卷积层的概念和相关数学知识,并研究了CNN实际看到的内容以及图像的哪些部分导致它们做出决策。
12/16/2024 8:06:42 AM
朱先忠
时间序列模型的演变:人工智能引领新的预测时代
译者 | 布加迪审校 | 重楼我们正处于这样一个时代:大型基础模型(大规模通用神经网络以无监督的方式使用大量不同的数据进行预训练)彻底改变计算机视觉、自然语言处理以及最近的时间序列预测等领域。 这种模型通过实现零样本预测来重塑时间序列预测领域,允许使用新的、未见过的数据进行预测,无需针对每个数据集进行重新训练。 这一突破显著缩减了开发时间和成本,简化了为不同任务创建和微调模型的过程。
12/11/2024 8:17:30 AM
布加迪
字节&北大Nature子刊新成果:自旋本征态的高效精确求解
编辑 | ScienceAI近些年来 AI for Science 在众多领域取得重大成功。 其中,基于神经网络的量子变分蒙特卡洛方法 (NNVMC) 在量子化学领域展现出强大潜力,备受关注。 最近字节跳动研究部门 ByteDance Research 和北京大学团队在 NNVMC 框架中融入物理对称性,实现了量子激发态的高效精确求解。
12/6/2024 2:50:00 PM
ScienceAI
快速学会一个算法,卷积神经网络!!!
今天给大家分享一个强大的算法模型,卷积神经网络。 卷积神经网络(CNN)是一类专门用于处理具有网格结构数据(如图像)的深度学习模型,广泛应用于图像处理、计算机视觉等领域。 CNN 通过模仿生物视觉系统的结构,通过层级化的卷积和池化操作,自动从输入数据中提取特征并进行分类或回归。
12/4/2024 10:33:17 AM
程序员小寒
最大限度提高人工智能训练效率:选择合适的模型
译者 | 李睿审校 | 重楼快速准确地训练人工智能模型,对于建立对这些工作流工具的信任非常重要。 随着人工智能驱动的应用程序执行复杂任务的能力越来越强,数据科学家和机器学习工程师需要探索新方法。 要为特定用例开发最佳模型,利用合适的模型、数据集和部署可以简化人工智能开发过程并产生最佳结果。
12/3/2024 8:08:13 AM
李睿
终于把神经网络中的知识蒸馏搞懂了!!!
大家好,我是小寒今天给大家分享神经网络中的一个关键知识点,知识蒸馏知识蒸馏是一种模型压缩方法,用于将大型神经网络(教师模型)中的知识转移到较小的神经网络(学生模型)中。 这一技术能够在保持或接近原始模型性能的情况下,显著减小模型的体积,从而提升推理效率。 知识蒸馏在很多场景中非常有用,尤其是在计算资源有限或需要部署到边缘设备的应用中。
12/2/2024 1:10:04 AM
程序员小寒
科研党狂喜!AI预测神经学研究结论超过人类专家水平 | Nature子刊
LLM可以比科学家更准确地预测神经学的研究结果! 最近,来自伦敦大学学院、剑桥大学、牛津大学等机构的团队发布了一个神经学专用基准BrainBench,登上了Nature子刊《自然人类行为(Nature human behavior)》。 结果显示,经过该基准训练的LLM在预测神经科学结果的准确度方面高达81.4%,远超人类专家的63%。
11/29/2024 2:10:00 PM
量子位
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
周期性现象广泛存在,深刻影响着人类社会和自然科学。 作为最重要的基本特性之一,许多规律都显式或隐式地包含周期性,例如,天文学中的行星运动、气象学中的季节变化、生物学中的昼夜节律、经济学中的商业周期、物理学中的电磁波,以及数学运算和逻辑推理等。 因此,在许多任务和场景中,人们希望对周期进行建模,以便根据以往的经验进行推理。
11/26/2024 1:30:00 PM
新智元
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉