深度学习
人工智能的“苦涩教训”:辛顿最清醒的警告
在人工智能的历史上,杰弗里·辛顿(Geoffrey Hinton)不仅是深度学习的奠基人,更像是一个时代的镜子。 他提出的“苦涩的教训(The Bitter Lesson)”,直到今天,依然是AI研究者绕不开的一记耳光——它提醒我们,聪明的人类往往高估了自己设计“聪明系统”的能力,而低估了计算和数据的力量。 这条教训,之所以“苦涩”,是因为它击中了人类的骄傲。
10/24/2025 11:00:58 AM
AI大模型应用开发
吴恩达执教的深度学习课程CS230秋季上新,新增GPT-5专题
「人工智能是新的电力。 」——吴恩达吴恩达 (Andrew Ng) 执教的斯坦福 CS230 深度学习旗舰课程已更新至 2025 秋季版,首讲视频现已公开! 课程采用翻转课堂模式,学生需提前观看 Coursera 上的 deeplearning.ai 专项课程视频(包括神经网络基础、超参数调优、结构化机器学习项目等模块),然后参加线下课程。
10/4/2025 2:34:00 PM
机器之心
机器人界的「Imagenet 时刻」,李飞飞团队官宣全球顶级具身智能挑战赛
在计算机视觉的历史上,Imagenet 挑战赛曾被誉为 AI 发展的分水岭,引爆了深度学习的浪潮。 那么,在具身智能与机器人领域,是否也会迎来类似的 “拐点时刻”? 李飞飞团队与斯坦福 AI 实验室正式官宣:首届 BEHAVIOR 挑战赛将登陆 NeurIPS 2025。
9/24/2025 11:24:42 AM
谷歌的 TPU 业务或将冲击 9000 亿美元市场,挑战英伟达
随着人工智能技术的不断发展,谷歌正加大对 AI 硬件市场的布局,特别是其自家研发的张量处理单元(TPU)。 近期,谷歌开始与一些小型云服务提供商,如 Fluidstack、Crusoe 和 CoreWeave 合作,推广其 TPU 产品。 这一举动意味着谷歌希望在英伟达的强大市场地位上开辟出一片新的天地。
9/9/2025 4:56:50 PM
AI在线
百度文心大模型X1.1发布:深度学习能力再升级
在9月9日举行的WAVE SUMMIT深度学习开发者大会上,百度首席技术官王海峰正式发布了文心大模型X1.1。 作为一款全新的深度思考模型,文心大模型X1.1在多个核心能力上取得了显著进步,尤其在事实性、指令遵循和智能体表现上均有大幅提升。 目前,个人用户已可通过文心一言官网和文小言APP体验该模型。
9/9/2025 12:41:14 PM
AI在线
WAVE SUMMIT深度学习开发者大会2025举行 文心大模型X1.1、飞桨框架v3.2、文心快码3.5S发布
9月9日,由深度学习技术及应用国家工程研究中心主办,百度飞桨、文心大模型联合承办的WAVE SUMMIT 深度学习开发者大会2025在京举行。 会上,百度重磅发布文心大模型X1.1,并公布文心和飞桨的一系列技术、产品、生态最新成果。 文心X1.1深度思考模型上线,多个基准测试达到SOTA会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有显著提升。
9/9/2025 11:57:47 AM
Yann LeCun最新纪录片首曝!传奇AI教父的双面人生,深度学习幕后40年
在AI的璀璨星空中,有一位传奇人物始终闪耀——Yann LeCun。 他不仅是深度学习的开创者之一,也是Meta的首席AI科学家。 当扎克伯格敲定28岁的Alexander Wang出任Meta的首席AI官后,所有人同时想到一个问题。
8/18/2025 9:12:00 AM
AI 预测点球方向准确率超人类守门员,高达 52%
AI在线 7 月 27 日消息,在足球比赛中,点球常常是决定比赛胜负的关键。 目前守门员在面对点球时,大多依赖于直觉来进行判断。 近日,西班牙拉斯帕尔马斯大学的研究人员通过深度学习模型,开发出的模型在预测点球方向上表现出了比人类守门员更高的准确率。
7/27/2025 2:47:41 PM
远洋
英伟达完成从游戏芯片商到AI巨头的战略转型
全球半导体巨头英伟达(NVIDIA)近日宣布在波士顿设立量子研究中心,标志着这家以游戏显卡起家的公司已完成向人工智能领导者的战略转型。 据公开资料显示,英伟达目前市值已突破万亿美元,成为推动AI技术发展的核心力量。 从游戏硬件到AI芯片的跨越英伟达成立于1993年,最初专注于为游戏行业提供图形处理器(GPU)。
6/23/2025 4:00:38 PM
AI在线
刚刚,Gemini 2.5系列模型更新,最新轻量版Flash-Lite竟能实时编写操作系统
刚刚,Gemini 系列模型迎来了一波更新:Gemini 2.5 Pro 稳定版发布且已全面可用,其与 6 月 5 日的预览版相比无变化。 Gemini 2.5 Flash 稳定版发布且已全面可用,其与 5 月 20 日的预览版相比无变化,但价格有更新。 新推出了 Gemini 2.5 Flash-Lite 并已开启预览。
6/18/2025 9:56:53 AM
机器之心
C#与AI联姻:零依赖!用Keras.NET训练深度学习模型实录
在C#中实现深度学习通常需要依赖复杂的框架,但通过Keras.NET,我们可以在零外部依赖的情况下训练强大的深度学习模型。 下面我将分享一个完整的实战案例,展示如何用C#和Keras.NET训练一个图像分类模型。 这个实现具有以下特点:零外部依赖:仅使用Keras.NET和Numpy.NET库,无需安装Python或其他深度学习框架完整的训练流程:包括模型构建、数据加载、训练、评估和保存卷积神经网络:使用现代CNN架构进行图像分类模型检查点:自动保存验证集表现最佳的模型灵活的配置:可调整图像尺寸、批次大小和训练轮数要运行此代码,你需要安装以下NuGet包:Keras.NETNumpy.NETSciSharp.TensorFlow.Redist在实际应用中,你需要替换LoadData方法中的模拟数据加载逻辑,使用真实的图像数据。
6/17/2025 7:28:51 AM
CONAN
深度学习中Batch Size对训练过程如何影响?
之前面试过程中被问到过两个问题:(1)深度学习中batch size的大小对训练过程的影响是什么样的? (2)有些时候不可避免地要用超大batch,比如人脸识别,可能每个batch要有几万甚至几十万张人脸图像,训练过程中超大batch有什么优缺点,如何尽可能地避免超大batch带来的负面影响? 面试版回答在不考虑Batch Normalization的情况下(这种情况我们之后会在bn的文章里专门探讨),先给个自己当时回答的答案吧(相对来说学究一点):(1) 不考虑bn的情况下,batch size的大小决定了深度学习训练过程中的完成每个epoch所需的时间和每次迭代(iteration)之间梯度的平滑程度。
6/13/2025 2:55:00 AM
grok
一文讲清楚大模型中六个关键词及原理:LLM、Transformer、Bert、预训练、微调FineTuning、机器学习
什么是大模型,相信每个人都能说上一个一二三点来。 比如:OpenAI、ChatGPT、DeepSeek、豆包、Manus等。 也知道大模型需要做训练与推理。
6/10/2025 1:00:00 AM
Zack之云原生
OpenAI久违发了篇「正经」论文:线性布局实现高效张量计算
OpenAI 发论文的频率是越来越低了。 如果你看到了一份来自 OpenAI 的新 PDF 文件,那多半也是新模型的系统卡或相关增补文件或基准测试,很少有新的研究论文。 至于原因嘛,让该公司自家的 ChatGPT 来说吧:「截至目前,OpenAI 在 2025 年在 arXiv 上公开发布的论文数量相对较少,可能反映了其对研究成果公开策略的谨慎态度,可能出于商业保密或安全考虑。
6/5/2025 11:49:59 AM
深度学习原来这么好懂?这篇大白话科普,让你轻松 get 新知识!
嘿,朋友们! 你是不是也经常在新闻、科技报道里看到“深度学习”这个词? 听起来是不是特别高大上,感觉像是只有顶尖科学家才能搞懂的神秘领域?
5/14/2025 8:25:00 AM
用户007
常用模型蒸馏方法:这 N 个核心,你都知道吗?(上)
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活、健壮的模型技术体系。 随着深度学习模型规模的爆炸式增长,它们在各种任务上展现出令人惊叹的性能。 然而,庞大的参数量和计算需求也带来了新的挑战:如何在资源受限的设备上高效部署这些模型?
5/13/2025 9:48:20 AM
Luga Lee
打破Transformer霸权!液态神经网络统治风电预测!
一眼概览该论文提出一种受生物神经系统启发的Liquid Neural Network(LNN)框架,首次将其应用于风电多时间尺度预测任务,并在多个数据集上显著优于LSTM、GRU等主流方法。 核心问题风电预测面临高度不确定性和非线性动态问题,传统深度学习方法如LSTM、GRU虽有成效,但缺乏解释性和泛化能力。 该研究致力于解决如何在多时间尺度、不同分辨率和变量数下,准确且透明地预测风电输出的问题。
5/9/2025 8:48:06 AM
萍哥学AI
一文详解深度学习中的标量、向量、矩阵、张量
在深度学习领域,标量、向量、矩阵和张量是不可或缺的基本概念。 它们不仅是数学工具,更是理解和构建神经网络的关键。 从简单的标量运算到复杂的张量处理,这些概念贯穿于数据表示、模型构建和算法优化的全过程。
4/27/2025 9:59:38 AM
Goldma
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
大模型
数据
Midjourney
开源
Meta
智能
微软
AI新词
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
腾讯
Claude
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
研究
AI视频
大语言模型
生成
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
场景
深度学习
架构
DeepMind
生成式AI
编程
视觉
Transformer
预测
AI模型
伟达
特斯拉
MCP