LSTM

被拒≠失败！这些高影响力论文都被顶会拒收过

被拒≠失败！这些高影响力论文都被顶会拒收过

近日，Waymo 发布了一篇深度博客，详细介绍了该公司的 AI 战略以及以 Waymo 基础模型为核心的整体 AI 方法。谷歌首席科学家 Jeff Dean X 也分享了这篇博客，并重点介绍了 Waymo 占用的补充方法，他写到：「就像我们使用增量从更大规模的专业模型中创建高质量、计算效率极高的 Gemini Flash 模型一样，Waymo 也类似地使用了补充，来基于更大的模型可机载运行创建高计算效率模型。」而在这条帖子的下方，Jeff Dean 再次回忆起了最初那篇论文的悲惨遭遇：被 NeurIPS 2014 拒收了。

12/11/2025 11:06:00 AM 机器之心

LSTM之父向何恺明开炮：我学生才是残差学习奠基人

LSTM之父向何恺明开炮：我学生才是残差学习奠基人

鹭羽发自凹非寺. 量子位 | 公众号 QbitAI何恺明残差学习奠基人的身份，也被“挑战”了。为什么要说“也”？

10/19/2025 10:49:10 PM henry

终于把 LSTM 算法搞懂了！！！

终于把 LSTM 算法搞懂了！！！

今天给大家分享一个强大的算法模型，LSTMLSTM（长短期记忆网络）是一种特殊类型的循环神经网络（RNN），它能够有效地解决传统 RNN 在处理长序列时遇到的梯度消失和梯度爆炸问题。 LSTM 的核心思想是通过多个门控机制来控制信息的流动，这些门控机制可以选择性地保留或丢弃输入数据，从而帮助网络捕捉长时间跨度的依赖关系。 LSTM的工作原理LSTM 的核心思想是通过引入记忆单元来存储信息，并使用三个主要的门（输入门、遗忘门、输出门）来决定哪些信息应该保留，哪些信息应该遗忘，以及哪些信息应该更新。

12/3/2024 8:16:57 AM 程序员小寒

网传Ilya Sutskever的推荐清单火了，掌握当前AI 90%

网传Ilya Sutskever的推荐清单火了，掌握当前AI 90%

随着生成式 AI 模型掀起新一轮 AI 浪潮，越来越多的行业迎来技术变革。许多行业从业者、基础科学研究者需要快速了解 AI 领域发展现状、掌握必要的基础知识。如果有一份「机器学习精炼秘笈」，你认为应该涵盖哪些知识？近日，一份网传 OpenAI 联合创始人兼首席科学家 Ilya Sutskever 整理的一份机器学习研究文章清单火了。网友称「Ilya 认为掌握了这些内容，你就了解了当前（人工智能领域） 90% 的重要内容。」推荐清单：，Ilya Sutskever 重点关注 transformer 架构、循环神经网络

5/9/2024 6:40:00 PM 机器之心

Nature子刊：科学家在类脑芯片上实现类似LSTM的功能，能效高1000倍

Nature子刊：科学家在类脑芯片上实现类似LSTM的功能，能效高1000倍

格拉茨技术大学的计算机科学家在 Nature 子刊上发表的一篇论文表明，他们找到了一种在神经形态芯片上模拟 LSTM 的方案，可以让类脑神经形态芯片上的 AI 算法能效提高约 1000 倍。随着智能手机的普及，手机游戏也越来越受欢迎。但视频游戏等程序会大量耗电耗能。与 GPU 等标准硬件相比，基于 spike 的神经形态芯片有望实现更节能的深度神经网络（DNN）。但这需要我们理解如何在基于 event 的稀疏触发机制（sparse firing regime）中模拟 DNN，否则神经形态芯片的节能优势就会丧失。比如

5/21/2022 4:43:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉