AI在线 AI在线

LSTM

被拒≠失败!这些高影响力论文都被顶会拒收过

近日,Waymo 发布了一篇深度博客,详细介绍了该公司的 AI 战略以及以 Waymo 基础模型为核心的整体 AI 方法。 谷歌首席科学家 Jeff Dean X 也分享了这篇博客,并重点介绍了 Waymo 占用的补充方法,他写到:「就像我们使用增量从更大规模的专业模型中创建高质量、计算效率极高的 Gemini Flash 模型一样,Waymo 也类似地使用了补充,来基于更大的模型可机载运行创建高计算效率模型。 」而在这条帖子的下方,Jeff Dean 再次回忆起了最初那篇论文的悲惨遭遇:被 NeurIPS 2014 拒收了。
12/11/2025 11:06:00 AM
机器之心

LSTM之父向何恺明开炮:我学生才是残差学习奠基人

鹭羽 发自 凹非寺. 量子位 | 公众号 QbitAI何恺明残差学习奠基人的身份,也被“挑战”了。 为什么要说“也”?
10/19/2025 10:49:10 PM
henry

终于把 LSTM 算法搞懂了!!!

今天给大家分享一个强大的算法模型,LSTMLSTM(长短期记忆网络)是一种特殊类型的循环神经网络(RNN),它能够有效地解决传统 RNN 在处理长序列时遇到的梯度消失和梯度爆炸问题。 LSTM 的核心思想是通过多个门控机制来控制信息的流动,这些门控机制可以选择性地保留或丢弃输入数据,从而帮助网络捕捉长时间跨度的依赖关系。 LSTM的工作原理LSTM 的核心思想是通过引入记忆单元来存储信息,并使用三个主要的门(输入门、遗忘门、输出门)来决定哪些信息应该保留,哪些信息应该遗忘,以及哪些信息应该更新。
12/3/2024 8:16:57 AM
程序员小寒

网传Ilya Sutskever的推荐清单火了,掌握当前AI 90%

随着生成式 AI 模型掀起新一轮 AI 浪潮,越来越多的行业迎来技术变革。许多行业从业者、基础科学研究者需要快速了解 AI 领域发展现状、掌握必要的基础知识。如果有一份「机器学习精炼秘笈」,你认为应该涵盖哪些知识?近日,一份网传 OpenAI 联合创始人兼首席科学家 Ilya Sutskever 整理的一份机器学习研究文章清单火了。网友称「Ilya 认为掌握了这些内容,你就了解了当前(人工智能领域) 90% 的重要内容。」推荐清单:,Ilya Sutskever 重点关注 transformer 架构、循环神经网络
5/9/2024 6:40:00 PM
机器之心

Nature子刊:科学家在类脑芯片上实现类似LSTM的功能,能效高1000倍

格拉茨技术大学的计算机科学家在 Nature 子刊上发表的一篇论文表明,他们找到了一种在神经形态芯片上模拟 LSTM 的方案,可以让类脑神经形态芯片上的 AI 算法能效提高约 1000 倍。随着智能手机的普及,手机游戏也越来越受欢迎。但视频游戏等程序会大量耗电耗能。与 GPU 等标准硬件相比,基于 spike 的神经形态芯片有望实现更节能的深度神经网络(DNN)。但这需要我们理解如何在基于 event 的稀疏触发机制(sparse firing regime)中模拟 DNN,否则神经形态芯片的节能优势就会丧失。比如
5/21/2022 4:43:00 PM
机器之心