PyTorch
OpenAI、Claude、通义、智谱、月暗,甚至谷歌,为什么全选择Pytorch?早期论文成员爆料:LLM太笨重了,需要微型化
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)Pytorch 赢了。 大家可能没注意到,现在每一款与你互动的Chatbot,背后运行的都是 PyTorch。 可以说,它已经成为了主流LLM研发链路中事实上的标准。
10/31/2025 12:44:10 PM
云昭
PyTorch Monarch震撼发布!单控制器模型彻底简化分布式AI工作流程
Meta的PyTorch团队近日发布了Monarch,这是一个革命性的开源框架,专门用于简化跨多个GPU和机器的分布式AI工作流程。 该系统的最大亮点是引入了单控制器模型,让开发者只需一个脚本就能协调整个集群的计算任务,大幅降低了大规模训练和强化学习任务的复杂度,同时保持标准PyTorch代码的编写方式不变。 传统多控制器模式的终结Monarch彻底颠覆了传统的多控制器方法。
10/28/2025 9:07:38 AM
阿丸笔记
一文带你开启 SmartNotebook 的 GPU 支持(PyTorch 实测)
在数据科学与深度学习的日常工作中,GPU 已经成为不可或缺的计算加速工具。 无论是训练大规模 Transformer 模型,还是运行复杂的图像处理与科学计算任务,GPU 都能显著提升性能。 SmartNotebook 作为一款类似 Hex.tech 的现代化 DataNotebook 平台,不仅支持在容器环境中快速部署,还可以通过简单的配置实现 GPU 加速,让用户在 DataNotebook 内即可运行深度学习任务。
8/29/2025 8:10:18 AM
新叔
分布式机器学习的五大流行框架
译者 | 布加迪审校 | 重楼使用这些框架可以优化内存和计算资源,扩展你的机器学习工作流程,加快流程速度并降低总体成本。 分布式机器学习(DML)框架使你能够跨多台机器(使用 CPU、GPU 或 TPU)训练机器学习模型,从而大大缩短训练时间,同时高效处理原本内存无法容纳的大型复杂工作负载。 此外,这些框架还允许你处理数据集、调整模型,甚至使用分布式计算资源来给模型提供服务。
6/30/2025 8:21:58 AM
布加迪
PyTorch 从 0 到 1:超详细的安装与入门实战指南
PyTorch 是一个由 Meta (Facebook) AI 研究实验室主导开发的开源机器学习库。 它以其灵活性、易用性和强大的GPU加速功能而闻名,已成为学术界和工业界进行深度学习研究和应用开发的首选框架之一。 PyTorch 的两大核心特性:张量 (Tensor) 计算:类似于 NumPy 的多维数组,但提供了强大的 GPU 加速能力,使得大规模数值计算变得极其高效。
6/23/2025 10:20:00 AM
用户007
使用PyTorch和Hugging Face构建一个自动语音识别系统
译者 | 布加迪审校 | 重楼从语音助手到转录服务,自动语音识别(ASR)是许多应用中的一项关键技术。 我们在本教程中旨在使用Hugging Face的预训练模型构建一条能够将语音转录为文本的ASR管道。 我们将使用轻量级数据集来提高效率,并使用Wav2Vec2这种强大的语音识别自监督模型。
4/1/2025 9:31:34 AM
布加迪
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
在深度学习的背景下,NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性,导致基础设施资源利用率显著降低。 随着模型规模不断扩大而预算约束日益严格,2-3年更换一次GPU的传统方式已不具可持续性。 但是Pytorch的最近几次的更新可以有效利用异构计算集群,实现对所有可用GPU资源的充分调度,不受制于供应商限制。
3/20/2025 11:22:12 AM
Rafał Siwek
PyTorch领军人物Horace He从Meta离职 加入OpenAI前CTO创立的初创公司
近日,PyTorch 的核心开发者 Horace He 宣布从 Meta 离职,加入了由 OpenAI 前 CTO Mira Murati 创办的初创公司 Thinking Machines。 Horace He 在 Meta 工作了四年,在此期间,他为 PyTorch 贡献了大量心血。 离职的消息不仅震惊了业界,也引发了对于 AI 未来发展的热议。
3/5/2025 2:19:00 PM
AI在线
PyTorch 灵魂人物 Horace He 从 Meta 出走,选择 OpenAI 前 CTO 初创公司
PyTorch 机器学习大神 Horace He 宣布,正是离职加入 OpenAI 前 CTO 初创 Thinking Machines。这位技术奇才,曾被 OpenAI、SSI、谷歌等顶级 AI 实验室争相邀请,最终选择了刚刚成立的初创。他的选择,不仅是个人职业生涯的转折,更是对 AI 未来发展方向的一次战略性押注。
3/5/2025 1:06:11 PM
汪淼
PyTorch内存优化的十种策略总结:在有限资源环境下高效训练模型
在大规模深度学习模型训练过程中,GPU内存容量往往成为制约因素,尤其是在训练大型语言模型(LLM)和视觉Transformer等现代架构时。 由于大多数研究者和开发者无法使用配备海量GPU内存的高端计算集群,因此掌握有效的内存优化技术变得尤为关键。 本文将系统性地介绍多种内存优化策略,这些技术组合应用可使模型训练的内存消耗降低近20倍,同时不会损害模型性能和预测准确率。
3/3/2025 10:42:50 AM
佚名
Sakana AI发布“AI CUDA工程师”:自动化优化CUDA内核,速度提升高达100倍
日本人工智能初创公司Sakana AI宣布推出“AI CUDA工程师”(AI CUDA Engineer),这一创新性的AI智能体系统旨在自动化生产高度优化的CUDA内核,显著提升机器学习操作的运行效率。 根据X平台上的最新消息,该系统通过进化的大型语言模型(LLM)驱动代码优化技术,将常见PyTorch操作的运行速度提高了10至100倍,标志着AI技术在GPU性能优化领域的重大突破。 Sakana AI表示,CUDA内核作为GPU计算的核心,直接编写和优化通常需要深厚的专业知识和高技术门槛,而现有框架如PyTorch虽然使用便捷,但在性能上往往无法与手动优化的内核媲美。
2/21/2025 5:26:00 PM
AI在线
黑客利用 “损坏” pickle 文件在 HuggingFace 上传恶意 AI 模型
近日,网络安全研究人员发现,在知名机器学习平台 HuggingFace 上,有两个恶意的机器学习模型悄然上传。 这些模型使用了一种新奇的技术,通过 “损坏” 的 pickle 文件成功规避了安全检测,令人担忧。 ReversingLabs 的研究员卡洛・赞基(Karlo Zanki)指出,从这些 PyTorch 格式的存档中提取的 pickle 文件开头,暗示了其中包含恶意的 Python 代码。
2/10/2025 11:11:00 AM
AI在线
机器学习的下一个前沿—量子扩展
译者 | 陈峻审校 | 重楼现如今,机器学习的速度比以往任何时候都快得多,也能够解决那些曾被认为完全无法解决的问题。 将来,在量子计算潜力的驱动下,人工智能(AI)模型会越来越大、越来越强,甚至会超越我们对其训练的工具。 说到模型训练,其计算和能源的消耗成本日趋高启。
1/21/2025 8:11:24 AM
陈峻
Torchtune:重塑大语言模型微调的新篇章
在当今的深度学习领域,大语言模型(LLMs)的微调已成为实现定制化模型功能的关键步骤。 为了满足这一需求,Torchtune应运而生,它是一个专为PyTorch设计的库,旨在简化LLMs的编写、微调及实验过程。 本文将详细介绍Torchtune的功能、特性、使用方法及其社区支持。
1/14/2025 10:56:14 AM
tune
PyTorch vs PyTorch Lightning 框架对比
在不断发展的深度学习领域,PyTorch 已经成为开发者和研究人员家喻户晓的名字。 其动态计算图、灵活性以及广泛的社区支持使其成为构建从简单神经网络到复杂前沿模型的首选框架。 然而,灵活性也带来了编写大量样板代码的责任——尤其是在训练循环、日志记录和分布式学习方面。
1/8/2025 8:30:38 AM
二旺
Pytorch 核心操作全总结!零基础必备!
在深度学习与人工智能领域,PyTorch已成为研究者与开发者手中的利剑,以其灵活高效的特性,不断推动着新技术的边界。 对于每一位致力于掌握PyTorch精髓的学习者来说,深入了解其核心操作不仅是提升技能的关键,也是迈向高级应用与创新研究的必经之路。 本文精心梳理了PyTorch的核心操作,这不仅是一份全面的技术指南,更是每一个PyTorch实践者的智慧锦囊,建议收藏!
12/31/2024 7:00:00 AM
小喵学AI
基于CNN+PyTorch实现视觉检测分类
译者 | 朱先忠审校 | 重楼本文给出了一个使用CNN+PyTorch实现汽车电子行业视觉检测分类详尽的实战案例解析。 在本文中,我们开发了一个卷积神经网络(CNN),用于汽车电子行业的视觉检测分类任务。 在此过程中,我们深入研究了卷积层的概念和相关数学知识,并研究了CNN实际看到的内容以及图像的哪些部分导致它们做出决策。
12/16/2024 8:06:42 AM
朱先忠
使用Pytorch构建视觉语言模型(VLM)
视觉语言模型(Vision Language Model,VLM)正在改变计算机对视觉和文本信息的理解与交互方式。 本文将介绍 VLM 的核心组件和实现细节,可以让你全面掌握这项前沿技术。 我们的目标是理解并实现能够通过指令微调来执行有用任务的视觉语言模型。
11/19/2024 1:17:38 PM
Achraf Abbaoui
资讯热榜
OpenAI 宣布印度用户可享受一年免费 ChatGPT Go 服务
软银豪掷225亿美元加码OpenAI,AI音乐与超级融资计划全面提速
全网刷屏的「电影感」三宫格图片,教你用AI快速生成!
LangChain V1.0 深度解析:手把手带你跑通全新智能体架构
LLM 应用评估综合指南(多轮对话系统、RAG、AI Agent)
Transformer 之父“叛逃”:我已经受够了 Transformer!警告:AI研究变得越来越窄,我们需要找到新的架构
中小企业AI落地的算力“最优解”:一台插电即用的Mac mini
红杉资本注资Rogo Technologies,AI 工具或将颠覆初级银行家角色
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
大模型
数据
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
腾讯
Stable Diffusion
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
研究
AI视频
生成
大语言模型
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
场景
深度学习
DeepMind
架构
生成式AI
编程
视觉
Transformer
预测
AI模型
伟达
亚马逊
MCP