深度学习

字节要亲手打造AGI了！神秘“Seed Edge”项目被曝光，已设置5大研究方向，探索下一代AI技术，算力不用愁！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）中国大厂开始发力AGI了！据媒体报道，字节跳动 AGI 研究团队浮出水面，揭开了字节AGI的秘密布局！报道称：1 月下旬，字节正式设立代号为“Seed Edge”的研究项目，核心目标是做比预训练和大模型迭代更长期、更基础的 AGI 前沿研究。

1/23/2025 2:02:14 PM

伊风

终于把机器学习中的类别不平衡搞懂了！！

今天给大家分享机器学习中的一个关键概念，类别不平衡。类别不平衡指的是在分类问题中，不同类别的数据样本数量相差悬殊的情况。在机器学习和深度学习的应用中，类别不平衡是一个常见的问题，尤其是在一些实际场景中，某些类别的数据相对较少，而其他类别的数据较多。

1/20/2025 9:00:00 AM

程序员小寒

深度学习图像增强方法全总结！

一、什么是图像增强？图像增强是指通过一系列技术和方法对图像进行处理，以改善其视觉效果和特征表现。 1.

1/20/2025 8:00:00 AM

小喵学AI

使用 CNN 进行时间序列预测！！

1D 卷积层（One-Dimensional Convolutional Layer）是卷积神经网络（CNN）的基本组成部分，广泛应用于处理一维序列数据，如时间序列分析、自然语言处理、语音识别等。 1D 卷积层是深度学习中用于处理序列数据的重要工具。它通过滑动窗口方式提取局部特征，并在多个通道间整合信息。

1/14/2025 1:32:47 PM

程序员小寒

ETH&PICO开源MADPose：通过显式仿射校正单目深度预测的相对位姿估计方法

本文经3D视觉之心公众号授权转载，转载请联系出处。单目深度估计的关键局限和挑战近年来，基于深度学习的单目深度估计（Monocular Depth Estimation, MDE）能够从单张二维图像中提取出日益准确的三维信息。这些进展为利用三维先验丰富传统几何计算机视觉任务开辟了新的可能性。

1/14/2025 9:48:24 AM

3D视觉之心

YOLO 详解：基于深度学习的物体检测

引言本文介绍了YOLO（You Only Look Once），一种基于卷积神经网络（CNN）的物体检测模型。与依赖基于分类方法的传统物体检测模型不同，YOLO通过基于回归的方法直接推断边界框来预测物体位置。这种端到端的CNN模型以其卓越的处理速度和高预测精度脱颖而出，在这两方面都优于许多现有的物体检测架构。

1/13/2025 10:00:00 AM

二旺

PyTorch vs PyTorch Lightning 框架对比

在不断发展的深度学习领域，PyTorch 已经成为开发者和研究人员家喻户晓的名字。其动态计算图、灵活性以及广泛的社区支持使其成为构建从简单神经网络到复杂前沿模型的首选框架。然而，灵活性也带来了编写大量样板代码的责任——尤其是在训练循环、日志记录和分布式学习方面。

1/8/2025 8:30:38 AM

二旺

深度学习最佳 GPU，知多少？

众所周知，在深度学习领域，硬件选择的重要性不言而喻。随着机器学习模型复杂性的不断提升，对高效计算的需求也在指数级增长。图形处理单元（GPU，Graphics Processing Unit）凭借其强大的并行计算能力，成为应对深度学习挑战的理想硬件解决方案。

1/6/2025 5:00:00 AM

架构驿站

引言论文《Attention is All You Need》（Vaswani等，2017）提出了Transformer架构，这一模型通过完全摒弃标准的循环神经网络（RNN）组件，彻底改变了自然语言处理（NLP）领域。相反，它利用了一种称为“注意力”的机制，让模型在生成输出时决定如何关注输入的特定部分（如句子中的单词）。在Transformer之前，基于RNN的模型（如LSTM）主导了NLP领域。

1/2/2025 3:40:23 PM

二旺

多模态RAG技术：从语义抽取到VLM应用与规模化挑战

一、基于语义抽取的多模态 RAG多模态 RAG 的发展方向旨在构建一个高度集成的系统，能够无缝融合文本、图像和其它多媒体元素，为用户提供更丰富的信息交互体验。实现多模态 RAG 系统的三种主要技术路径如下：传统对象识别与解析（雕花路线）传统的多模态文档处理首先会运用图像识别技术，如 OCR（Optical Character Recognition，光学字符识别），从图像中抽取出文字、表格和图片等元素。之后，这些独立的对象会被进一步解析，转换成文本格式，以便于后续的信息检索与分析。

1/2/2025 8:36:25 AM

金海

LeCun：对人工智能末日的担忧被夸大了，Meta正在构建超级智能助手

AI末日将近？深度学习三巨头之一、被称为AI教父的Hinton教授在最新演讲中指出，技术的发展速度远远超出了他的预期，如果再不加以监管人类将会在10年内灭绝：不过，同为深度学习三巨头之一的LeCun教授则表示：夸大了。在最新采访中，LeCun表示，自己还是非常看好人工智能的未来的。

12/31/2024 7:05:00 AM

Pytorch 核心操作全总结！零基础必备！

在深度学习与人工智能领域，PyTorch已成为研究者与开发者手中的利剑，以其灵活高效的特性，不断推动着新技术的边界。对于每一位致力于掌握PyTorch精髓的学习者来说，深入了解其核心操作不仅是提升技能的关键，也是迈向高级应用与创新研究的必经之路。本文精心梳理了PyTorch的核心操作，这不仅是一份全面的技术指南，更是每一个PyTorch实践者的智慧锦囊，建议收藏！

12/31/2024 7:00:00 AM

小喵学AI

意念操控电脑，如手掌般精准！MIT脑机接口新技术登Nature子刊

编辑 | 2049想象一下，仅凭思维就能自如地操控电脑鼠标，就像健全人使用手部一样精准和流畅。这听起来像科幻片中的场景，但在加州理工学院（MIT）的最新研究中，这样的未来正在成为现实。研究人员开发出了一种名为「FENet」的突破性技术，让瘫痪患者能够更精准地用意念控制电脑设备。

12/30/2024 11:58:00 AM

ScienceAI

CMU等提出超实用「模型泛化性」指标，分布外准确率提升6% | ICML 2024 Oral

当前许多深度学习分类模型通常在大规模数据中训练以找到足以区分不同类别的特征。然而，这种方式不可避免地学到伪相关特征（Spurious Correlation），导致训练的分类器在分布偏移（Distribution Shift）下往往会失效。因此，如何在衡量一个训练好的模型的泛化性（Generalization）一直是一个关键问题。

12/26/2024 3:30:00 PM

新智元

新SOTA，浙大、中科院深度学习模型可靠、准确预测蛋白-配体，助力药物开发

编辑 | 萝卜皮准确预测蛋白质-配体相互作用对于理解细胞过程至关重要，目前仍面临着诸多挑战。中国科学院、浙江大学的研究人员提出了 SurfDock，这是一种深度学习方法，通过将蛋白质序列、三维结构图和表面级特征整合到等变架构中来解决这一挑战。 SurfDock 在非欧几里德流形上采用生成扩散模型，优化分子平移、旋转和扭转以生成可靠的结合姿势。

12/18/2024 2:24:00 PM

ScienceAI

机械系统也能自主学习！密歇根大学团队构建了全新数学框架，登上Nature Communications

编辑丨&受人脑复杂运作的启发，神经网络已经彻底改变了各个领域的生产研究现状。然而，考虑到基于计算机的神经网络需求的大量计算与极高能耗，特别是传统数字处理器的能源效率，机械神经网络的发展逐步被提上日程。在光学神经网络中，波-物质相互作用被用来实现机器学习，类似的思路也可以被用来建立机械神经网络（MNN）的学习框架。

12/11/2024 2:29:00 PM

ScienceAI

从方向导数到梯度：深度学习中的关键数学概念详解

方向导数作为标量量，表征了函数在特定方向上的变化率。其数学表示为 ∇ᵤf(x) 或 Dᵤf(x)。对于标量函数 f(x): Rⁿ → R，其梯度由函数的偏导数构成向量场。

12/9/2024 2:08:13 PM

Dr. Irene Markelic

精确属性控制，湖大、西电从头药物设计AI方法，登Nature子刊

编辑 | 萝卜皮深度生成模型在药物从头设计领域受到广泛关注。然而，针对新靶点合理设计配体分子仍然具有挑战性，特别是在控制生成分子的性质方面。在这里，受到 DNA 编码化合物库技术的启发，湖南大学和西安电子科技大学的研究人员提出了 DeepBlock，这是一种基于块（block）的配体生成深度学习方法，可根据目标蛋白质序列进行定制，同时实现精确的属性控制。

12/2/2024 2:59:00 PM

ScienceAI

资讯热榜

Bilibili开源动漫视频生成模型AniSora V3版，一键生成多种风格动漫视频镜头 Chai Discovery发布Chai- 2 模型：零样本抗体设计突破16-20%命中率 Chai-2震撼发布：AI驱动零样本抗体设计，药物研发提速百倍 xAI控制台新增Grok4及Grok4Code引用，标志着下一代AI模型即将发布 PerMAXity：AI驱动投资分析，自动生成综合财务报告 Cursor手机版震撼发布！随时随地编码，开发者迎来新自由 OpenAI四位华人学者集体被挖，还是Meta重金出手 Qwen-TTS新版发布新增支持生成三种中文方言

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌数据机器人大模型 Midjourney 用户智能开源微软 Meta GPT 学习图像技术 Gemini AI创作马斯克论文代码 Anthropic 英伟达算法 Stable Diffusion 芯片智能体训练开发者生成式腾讯蛋白质苹果 AI新词神经网络 3D 研究生成 Claude 机器学习 LLM 计算 Sora AI设计 AI for Science AI视频 GPU xAI 人形机器人百度华为搜索大语言模型场景 Agent 字节跳动预测深度学习伟达工具大型语言模型 Transformer RAG 视觉神器推荐模态 Copilot 亚马逊具身智能 LLaMA 文本算力驾驶 DeepMind

深度学习

字节要亲手打造AGI了！神秘“Seed Edge”项目被曝光，已设置5大研究方向，探索下一代AI技术，算力不用愁！

终于把机器学习中的类别不平衡搞懂了！！

深度学习图像增强方法全总结！

使用 CNN 进行时间序列预测！！

ETH&PICO开源MADPose：通过显式仿射校正单目深度预测的相对位姿估计方法

YOLO 详解：基于深度学习的物体检测

PyTorch vs PyTorch Lightning 框架对比

深度学习最佳 GPU，知多少？

入门 Transformer：概念、代码与流程详解

多模态RAG技术：从语义抽取到VLM应用与规模化挑战

LeCun：对人工智能末日的担忧被夸大了，Meta正在构建超级智能助手

Pytorch 核心操作全总结！零基础必备！

意念操控电脑，如手掌般精准！MIT脑机接口新技术登Nature子刊

CMU等提出超实用「模型泛化性」指标，分布外准确率提升6% | ICML 2024 Oral

新SOTA，浙大、中科院深度学习模型可靠、准确预测蛋白-配体，助力药物开发

机械系统也能自主学习！密歇根大学团队构建了全新数学框架，登上Nature Communications

从方向导数到梯度：深度学习中的关键数学概念详解

精确属性控制，湖大、西电从头药物设计AI方法，登Nature子刊