梁文锋
DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖
在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次 ACL 2025 规模空前,总投稿量达到 8360 篇,相较于去年的 4407 篇几乎翻倍,竞争异常激烈。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了 11 倍。
8/1/2025 3:59:39 PM
DeepSeek 梁文锋入选《时代》周刊“2025 年全球最具影响力 100 人”
梁文锋出现在了“Pioneers(拓荒者)”分类中。企业家名人中,AMD CEO 苏姿丰、Meta CEO 马克・扎克伯格也成功上榜,不过均在“Titans(巨人、伟人)”分类中。
4/18/2025 10:36:04 PM
汪淼
DeepSeek 只有 160 名员工:新希望董事长刘永好透露与梁文锋交谈内容,称赞年轻人更懂新的科技
刘永好称:“DeepSeek 梁同学,这次开会我们又在一块吃饭,我就问他,我说你现在有多少员工,他说 160 个。我说你现在那么大的影响,做那么多事才 160 个?他说是。”
2/28/2025 2:37:46 PM
汪淼
为什么是梁文锋做出了DeepSeek?
这是2025年开年最火的科技明星,短短几天时间,梁文锋从小到大的种种过往都被展现在世人眼前,包括他来不及装修的新房以及在房子里睡觉用的帐篷,都成为了他独特个性的象征。 独特个性固然为人津津乐道,但并不是成功的关键,这个籍籍无名的大学生,在过去的十几年中所能倚靠的,只有他的思想和能力。 所有人都好奇这样一个问题,为什么是梁文锋做出了DeepSeek?
2/27/2025 5:28:00 PM
高允毅
梁文锋亲自挂名,DeepSeek 最新论文丢出注意力新机制,推理速度直线提升 11 倍
2 月 18 日,马斯克发布 Grok 3 的热度还没过去,梁文锋就作为 co-authors 带着 DeepSeek 研究团队杀了回来。 公布新研究的推文发布不到 3 个小时,就带来了三十多万的浏览量,火爆程度不逊 OpenAI。 而这次 DeepSeek 团队最新的研究论文更是重磅,论文中介绍了一种全新的,可用于超快速的长上下文训练与推理的注意力机制 —— NSA,值得一提的是,NSA 还具有与硬件对齐的特点,十足的硬件友好。
2/24/2025 2:14:00 PM
郑佳美
DeepSeek创始人是谁?这个问题DeepSeek也整不会了!
梁文锋到底有多低调? 你问DeepSeek官网,连自家的产品都整不会“DeepSeek的创始人是谁”这个问题。 事情是这样的。
2/20/2025 2:54:56 PM
硅基流动袁进辉否认拒绝 DeepSeek 梁文锋投资,但承认自己没有远见感到后悔
大模型云服务商硅基流动于 2024 年底完成亿元人民币 Pre-A 轮融资。本月早些时候,硅基流动上线 DeepSeek R1 & V3 企业级服务,提供专属实例、算力纳管、私有版 MaaS、基于华为昇腾 910B 的一体机四种企业级服务模式供客户选择。
2/20/2025 10:57:42 AM
汪淼
刚刚!DeepSeek梁文锋亲自挂名,公开新注意力架构NSA
DeepSeek 新论文来了! 相关消息刚刚发布到 𝕏 就吸引了大量用户点赞、转发、评论三连。 据介绍,DeepSeek 的这篇新论文提出了一种新的注意力机制 ——NSA。
2/18/2025 5:30:00 PM
机器之心
- 1
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用