PyTorch

他「二本」出身，数学很差：最终成了PyTorch之父、Meta副总裁

如果你正有放弃的念头，你一定要读读这篇从未被公开分享过的故事，关于 PyTorch 创造者、Meta 前副总裁 Soumith Chintala 的故事。原文地址：・钦塔拉 (Soumith Chintala) 这个名字，但如果你比较了解人工智能领域，肯定知道 PyTorch。对于 AI 来说，它就像写文章用 Word，P 图用 Photoshop 一样，是最流行的开发工具。

11/15/2025 8:52:00 PM

机器之心

没有内斗，Meta也没能留住PyTorch之父

刚刚，PyTorch 之父 Soumith Chintala 宣布将于 11 月 17 日正式离开 Meta，结束他长达 11 年的职业旅程。「我不想一辈子都做 PyTorch，」他在告别信中写道，「我想重新开始，做一些小而未知的事。我不想背负那种『如果从未尝试 Meta 之外的事情，会不会后悔的』假设性遗憾。

11/7/2025 3:39:00 PM

机器之心

OpenAI、Claude、通义、智谱、月暗，甚至谷歌，为什么全选择Pytorch？早期论文成员爆料：LLM太笨重了，需要微型化

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）Pytorch 赢了。大家可能没注意到，现在每一款与你互动的Chatbot，背后运行的都是 PyTorch。可以说，它已经成为了主流LLM研发链路中事实上的标准。

10/31/2025 12:44:10 PM

云昭

PyTorch Monarch震撼发布！单控制器模型彻底简化分布式AI工作流程

Meta的PyTorch团队近日发布了Monarch，这是一个革命性的开源框架，专门用于简化跨多个GPU和机器的分布式AI工作流程。该系统的最大亮点是引入了单控制器模型，让开发者只需一个脚本就能协调整个集群的计算任务，大幅降低了大规模训练和强化学习任务的复杂度，同时保持标准PyTorch代码的编写方式不变。传统多控制器模式的终结Monarch彻底颠覆了传统的多控制器方法。

10/28/2025 9:07:38 AM

阿丸笔记

一文带你开启 SmartNotebook 的 GPU 支持（PyTorch 实测）

在数据科学与深度学习的日常工作中，GPU 已经成为不可或缺的计算加速工具。无论是训练大规模 Transformer 模型，还是运行复杂的图像处理与科学计算任务，GPU 都能显著提升性能。 SmartNotebook 作为一款类似 Hex.tech 的现代化 DataNotebook 平台，不仅支持在容器环境中快速部署，还可以通过简单的配置实现 GPU 加速，让用户在 DataNotebook 内即可运行深度学习任务。

8/29/2025 8:10:18 AM

新叔

分布式机器学习的五大流行框架

译者 | 布加迪审校 | 重楼使用这些框架可以优化内存和计算资源，扩展你的机器学习工作流程，加快流程速度并降低总体成本。分布式机器学习（DML）框架使你能够跨多台机器（使用 CPU、GPU 或 TPU）训练机器学习模型，从而大大缩短训练时间，同时高效处理原本内存无法容纳的大型复杂工作负载。此外，这些框架还允许你处理数据集、调整模型，甚至使用分布式计算资源来给模型提供服务。

6/30/2025 8:21:58 AM

布加迪

PyTorch 从 0 到 1：超详细的安装与入门实战指南

PyTorch 是一个由 Meta (Facebook) AI 研究实验室主导开发的开源机器学习库。它以其灵活性、易用性和强大的GPU加速功能而闻名，已成为学术界和工业界进行深度学习研究和应用开发的首选框架之一。 PyTorch 的两大核心特性：张量 (Tensor) 计算：类似于 NumPy 的多维数组，但提供了强大的 GPU 加速能力，使得大规模数值计算变得极其高效。

6/23/2025 10:20:00 AM

用户007

使用PyTorch和Hugging Face构建一个自动语音识别系统

译者 | 布加迪审校 | 重楼从语音助手到转录服务，自动语音识别（ASR）是许多应用中的一项关键技术。我们在本教程中旨在使用Hugging Face的预训练模型构建一条能够将语音转录为文本的ASR管道。我们将使用轻量级数据集来提高效率，并使用Wav2Vec2这种强大的语音识别自监督模型。

4/1/2025 9:31:34 AM

布加迪

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

在深度学习的背景下，NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性，导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格，2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群，实现对所有可用GPU资源的充分调度，不受制于供应商限制。

3/20/2025 11:22:12 AM

Rafał Siwek

PyTorch领军人物Horace He从Meta离职加入OpenAI前CTO创立的初创公司

近日，PyTorch 的核心开发者 Horace He 宣布从 Meta 离职，加入了由 OpenAI 前 CTO Mira Murati 创办的初创公司 Thinking Machines。 Horace He 在 Meta 工作了四年，在此期间，他为 PyTorch 贡献了大量心血。离职的消息不仅震惊了业界，也引发了对于 AI 未来发展的热议。

3/5/2025 2:19:00 PM

AI在线

PyTorch 灵魂人物 Horace He 从 Meta 出走，选择 OpenAI 前 CTO 初创公司

PyTorch 机器学习大神 Horace He 宣布，正是离职加入 OpenAI 前 CTO 初创 Thinking Machines。这位技术奇才，曾被 OpenAI、SSI、谷歌等顶级 AI 实验室争相邀请，最终选择了刚刚成立的初创。他的选择，不仅是个人职业生涯的转折，更是对 AI 未来发展方向的一次战略性押注。

3/5/2025 1:06:11 PM

汪淼

PyTorch内存优化的十种策略总结：在有限资源环境下高效训练模型

在大规模深度学习模型训练过程中，GPU内存容量往往成为制约因素，尤其是在训练大型语言模型(LLM)和视觉Transformer等现代架构时。由于大多数研究者和开发者无法使用配备海量GPU内存的高端计算集群，因此掌握有效的内存优化技术变得尤为关键。本文将系统性地介绍多种内存优化策略，这些技术组合应用可使模型训练的内存消耗降低近20倍，同时不会损害模型性能和预测准确率。

3/3/2025 10:42:50 AM

佚名

Sakana AI发布“AI CUDA工程师”：自动化优化CUDA内核，速度提升高达100倍

日本人工智能初创公司Sakana AI宣布推出“AI CUDA工程师”（AI CUDA Engineer），这一创新性的AI智能体系统旨在自动化生产高度优化的CUDA内核，显著提升机器学习操作的运行效率。根据X平台上的最新消息，该系统通过进化的大型语言模型(LLM)驱动代码优化技术，将常见PyTorch操作的运行速度提高了10至100倍，标志着AI技术在GPU性能优化领域的重大突破。 Sakana AI表示，CUDA内核作为GPU计算的核心，直接编写和优化通常需要深厚的专业知识和高技术门槛，而现有框架如PyTorch虽然使用便捷，但在性能上往往无法与手动优化的内核媲美。

2/21/2025 5:26:00 PM

AI在线

黑客利用 “损坏” pickle 文件在 HuggingFace 上传恶意 AI 模型

近日，网络安全研究人员发现，在知名机器学习平台 HuggingFace 上，有两个恶意的机器学习模型悄然上传。这些模型使用了一种新奇的技术，通过 “损坏” 的 pickle 文件成功规避了安全检测，令人担忧。 ReversingLabs 的研究员卡洛・赞基（Karlo Zanki）指出，从这些 PyTorch 格式的存档中提取的 pickle 文件开头，暗示了其中包含恶意的 Python 代码。

2/10/2025 11:11:00 AM

AI在线

机器学习的下一个前沿—量子扩展

译者 | 陈峻审校 | 重楼现如今，机器学习的速度比以往任何时候都快得多，也能够解决那些曾被认为完全无法解决的问题。将来，在量子计算潜力的驱动下，人工智能（AI）模型会越来越大、越来越强，甚至会超越我们对其训练的工具。说到模型训练，其计算和能源的消耗成本日趋高启。

1/21/2025 8:11:24 AM

陈峻

Torchtune：重塑大语言模型微调的新篇章

在当今的深度学习领域，大语言模型（LLMs）的微调已成为实现定制化模型功能的关键步骤。为了满足这一需求，Torchtune应运而生，它是一个专为PyTorch设计的库，旨在简化LLMs的编写、微调及实验过程。本文将详细介绍Torchtune的功能、特性、使用方法及其社区支持。

1/14/2025 10:56:14 AM

tune

PyTorch vs PyTorch Lightning 框架对比

在不断发展的深度学习领域，PyTorch 已经成为开发者和研究人员家喻户晓的名字。其动态计算图、灵活性以及广泛的社区支持使其成为构建从简单神经网络到复杂前沿模型的首选框架。然而，灵活性也带来了编写大量样板代码的责任——尤其是在训练循环、日志记录和分布式学习方面。

1/8/2025 8:30:38 AM

二旺

Pytorch 核心操作全总结！零基础必备！

在深度学习与人工智能领域，PyTorch已成为研究者与开发者手中的利剑，以其灵活高效的特性，不断推动着新技术的边界。对于每一位致力于掌握PyTorch精髓的学习者来说，深入了解其核心操作不仅是提升技能的关键，也是迈向高级应用与创新研究的必经之路。本文精心梳理了PyTorch的核心操作，这不仅是一份全面的技术指南，更是每一个PyTorch实践者的智慧锦囊，建议收藏！

12/31/2024 7:00:00 AM

小喵学AI

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind AI模型特斯拉场景深度学习亚马逊架构 Transformer MCP Copilot 编程视觉

PyTorch

他「二本」出身，数学很差：最终成了PyTorch之父、Meta副总裁

没有内斗，Meta也没能留住PyTorch之父

OpenAI、Claude、通义、智谱、月暗，甚至谷歌，为什么全选择Pytorch？早期论文成员爆料：LLM太笨重了，需要微型化

PyTorch Monarch震撼发布！单控制器模型彻底简化分布式AI工作流程

一文带你开启 SmartNotebook 的 GPU 支持（PyTorch 实测）

分布式机器学习的五大流行框架

PyTorch 从 0 到 1：超详细的安装与入门实战指南

使用PyTorch和Hugging Face构建一个自动语音识别系统

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

PyTorch领军人物Horace He从Meta离职 加入OpenAI前CTO创立的初创公司

PyTorch 灵魂人物 Horace He 从 Meta 出走，选择 OpenAI 前 CTO 初创公司

PyTorch内存优化的十种策略总结：在有限资源环境下高效训练模型

Sakana AI发布“AI CUDA工程师”：自动化优化CUDA内核，速度提升高达100倍

黑客利用 “损坏” pickle 文件在 HuggingFace 上传恶意 AI 模型

机器学习的下一个前沿—量子扩展

Torchtune：重塑大语言模型微调的新篇章

PyTorch vs PyTorch Lightning 框架对比

Pytorch 核心操作全总结！零基础必备！

PyTorch领军人物Horace He从Meta离职加入OpenAI前CTO创立的初创公司