Batch

Batch Size与Epoch：深度模型训练的“油门”与“里程表”

在深度学习的世界里，我们常常被各种华丽的网络架构和前沿的应用所吸引，却容易忽略那些看似基础却至关重要的训练参数。今天，我们要深入探讨的就是模型训练过程中的两个基础术语——Batch Size与Epoch。这两个术语不仅决定了模型的学习效率，还直接影响着模型的性能和最终效果。

10/29/2025 7:53:51 AM

Fairy Girl

深度学习中Batch Size对训练过程如何影响？

之前面试过程中被问到过两个问题：（1）深度学习中batch size的大小对训练过程的影响是什么样的？（2）有些时候不可避免地要用超大batch，比如人脸识别，可能每个batch要有几万甚至几十万张人脸图像，训练过程中超大batch有什么优缺点，如何尽可能地避免超大batch带来的负面影响？面试版回答在不考虑Batch Normalization的情况下（这种情况我们之后会在bn的文章里专门探讨），先给个自己当时回答的答案吧（相对来说学究一点）：(1) 不考虑bn的情况下，batch size的大小决定了深度学习训练过程中的完成每个epoch所需的时间和每次迭代(iteration)之间梯度的平滑程度。

6/13/2025 2:55:00 AM

grok

OpenAI 推出 Batch 批处理 API：半价折扣，24 小时内输出结果

感谢OpenAI 今天凌晨面向开发者推出 Batch 批处理 API，可在 24 小时内给出结果，并提供 API 半价折扣。新的 Batch API 适用于异步任务处理，如当开发者需要处理大量文本、图片、摘要时，就可以使用该 API，OpenAI 会在 24 小时内给出处理结果。这样 OpenAI 可以在非高峰期处理，节约服务器资源，并为开发者提供半价优惠，解锁更高的速率限制。新的 Batch API 支持使用以下模型：gpt-3.5-turbogpt-3.5-turbo-16kgpt-4gpt-4-32kgpt-

4/16/2024 2:39:32 PM

泓澄（实习）

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法苹果 AI for Science 腾讯 Agent Claude 芯片 Stable Diffusion 蛋白质具身智能 xAI 开发者生成式人形机器人神经网络机器学习 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具字节跳动华为 AGI 计算大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 亚马逊 AI模型特斯拉场景深度学习 Transformer 架构 MCP Copilot 编程视觉