论文

揭秘注意力机制真正起源！10年前3项研究几乎同时独立提出，背后故事细节被Karpathy晒邮件公开了

大模型的核心组件注意力机制，究竟如何诞生的？可能已经有人知道，它并非2017年Transformer开山论文《Attention is all you need》首创，而是来自2014年Bengio实验室的另一篇论文。现在，这项研究背后更多细节被公开了！

12/5/2024 9:00:00 AM

量子位

ICLR审稿集体搞抽象！评审结果写半句，还有的求ta也不审，网友：科研人自己的春晚

今天，ICLR 2025的discussion phase的ddl已经截止。回看过去14天的讨论过程，可太精彩了！各大平台上随手一翻就是作者们的吐槽大会，都在无语这届ICLR评审的各种奇葩乱象。

12/4/2024 2:50:00 PM

量子位

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文，明年顶会落户苏州

刚刚，EMNLP 2024最佳论文奖新鲜出炉！ 5篇中榜论文中，华人学者参与三篇，分别来自CMU、上海交通大学、中国科学院大学等机构。其中，Pretraining Data Detection for Large Language Models: A Divergence-based Calibration Method主要由中科院网络数据科学与技术重点实验、中国科学院大学的学者完成。

11/15/2024 2:00:00 PM

量子位

昆仑万维发布天工 AI 高级搜索功能，升级分析推理、金融 / 科研能力

感谢昆仑万维天工 AI 今日发布最新版本的 AI 高级搜索功能，迎来四个方面的升级：全面升级多层次分析推理能力升级的金融投资专业 AI 搜索升级的科研学术专业 AI 搜索针对文档 AI 阅读分析的智能优化全面升级多层次分析推理能力在处理复杂任务时，天工 AI 推理能力支持难题拆解自动规划主动扩展深度回答图文交织。智能搜索 Agent 把复杂的难题拆解为多个简单的问题，自动规划路径，一边思考一边执行。自研大模型搜索 Agent，面对用户输入的问题，能够模拟人的思考和推理过程，自动生成任务规划并逐步完成预设任务路径，并在每一步检查任务的执行情况，确保最终结果的准确性。

11/5/2024 11:10:25 AM

汪淼

AI 驱动的「科学搜索引擎」如何加速你的课题进度

编辑 | 白菜叶人工智能 (AI) 工具正在改变我们的工作方式。许多产品试图通过帮助研究人员整理大量文献来提高科学研究的效率。这些科学搜索引擎基于大型语言模型 (LLM)，旨在筛选现有研究论文并总结关键发现。

10/15/2024 3:49:00 PM

ScienceAI

顶会卷到中学：人大附中吴悠上榜 NeurIPS，入选高中赛道 Spotlight

NeurIPS 2024 放榜，人大附中有高中生一作入选。今年，NeurIPS 率先把 AI 顶会卷到了高中里，正式面向高中生征集论文，还为此专门设置了高中生赛道（High School Projects Track）。现在结果终于出炉，北京大学计算机学院的张铭教授分享了一则入围消息：人大附中吴悠，有一篇一作论文入选该赛道，还被选为了 Spotlight Project。论文题为《Vision-Braille：An End-to-End Tool for Chinese Braille Image-to-Text

9/29/2024 12:45:39 PM

汪淼

CoT能让模型推理能力无上限？田渊栋、LeCun下场反对：两层MLP还能模拟全世界呢

「这相当于在理论上，两层神经网络在理论上可以拟合任何数据，我们就盲目相信并应用在所有场景中。」大模型新范式 OpenAI o1 一经发布，如何「复刻」出 o1 便成为了 AI 圈最热的话题。由于 OpenAI 对技术细节守口如瓶，想从 AI 那里「套话」，让它复述完整的内部推理过程，多问几句，OpenAI 直接发邮件警告要撤销你的使用资格。想从技术报告中想找出点蛛丝马迹，也同样困难。于是，大家将目光转向了以往类似的研究成果，希望从中找到些线索。比如，Google Brain 推理团队创建者 Denny Zhou 立

9/19/2024 5:51:00 PM

机器之心

「AI Scientist」会给科学带来什么？AI for Science 热潮下的争议

编译 | KX8 月份，Transformer 作者创业公司 Sakana AI 宣布推出 AI Scientist，声称「首个用于自动化科学研究和开放式发现的 AI 系统！」当 Sakana AI 着手创建「AI Scientist」来处理整个科学过程时，他们并不知道他们能走多远。他们创建的系统真的能够生成有趣的假设、运行实验、评估结果并撰写论文吗？参与「AI Scientist」研究的不列颠哥伦比亚大学的博士后研究员 Cong Lu 说，他们最终得到的是一个 AI 工具，并认为它相当于一个早期的博士生。他说，它

9/16/2024 11:13:00 PM

ScienceAI

ACL 2024 大奖揭晓！全华人团队用 AI 破解 3000 年前甲骨文密码

一年一度 NLP （自然语言处理）顶会 ACL （国际计算语言学协会）揭晓了最终获奖论文。今年，共有 7 篇论文荣获最佳论文，时间检验奖颁给斯坦福 GloVe、康奈尔大学相似性度量。另外，还有最佳主题奖、最佳社会影响力奖、最佳资源奖、领域主席奖，以及杰出论文奖。ACL 2024 终于颁奖了！共有 7 篇最佳论文，35 篇杰出论文，还有时间检验奖、SAC 奖、最佳主题论文、最佳资源论文奖等一并公布。值得一提的是，7 篇最佳论文中，Deciphering Oracle Bone Language with Diffus

8/15/2024 12:53:25 PM

清源

Nature 曝惊人内幕：论文被天价卖出喂 AI，作者 0 收入

Nature 的一篇文章透露：你发过的 paper，很可能已经被拿去训练模型了！有的出版商靠卖数据，已经狂赚 2300 万美元。然而辛辛苦苦码论文的作者们，却拿不到一分钱，这合理吗？全球数据告急，怎么办？论文来凑！最近，Nature 的一篇文章向我们揭露了这样一个事实：连科研论文，都被薅去训 AI 了……据悉，很多学术出版商，已经向科技公司授权访问自家的论文，用来训练 AI 模型。一篇论文从酝酿 idea 到成稿，包含了多少作者日日夜夜的心血，如今很可能在不知情的情况下，就成为训 AI 的数据。这合理吗？更可气的是

8/15/2024 12:53:16 PM

汪淼

腾讯元宝治好了我的信息焦虑症。

作者：马蕊蕾林杰鑫编辑：林杰鑫最近翻相册的时候翻到3月份的一张图片，恍惚间发现从事AI之后自己的阅读量一直在暴涨。大模型重构了很多行业工作流中的思考角色，也导致在这个行业的人一直都有信息摄取焦虑症。因为各行各业搞研究的人脑洞大开。

8/15/2024 11:14:00 AM

马蕊蕾

首位“AI 科学家”问世：已独立生成 10 篇学术论文，还顺手搞了 AI 审稿人

史上首位“AI 科学家”，横空出世！一登场就一口气生成了十篇完整学术论文。▲ AI 生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码，到在 GPU 上执行实验并收集结果，最后完成论文撰写，一气呵成。全由这位“AI 科学家”自动搞定。每篇论文的成本约为 15 美元（约 107.62 元）。这就是第一个用于自动化科学研究和开放式发现的综合 AI 系统，The AI Scientist。来自 Transformer 作者之一 Llion Jones 的创业公司：Sakana AI。而且！这公司搞的事情

8/13/2024 1:50:21 PM

汪淼

DeepMind 研究成本大起底，一篇 ICML 论文烧掉 1290 万美元

【新智元导读】DeepMind 最近被 ICML 2024 接收的一篇论文，完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本，大概是 Llama 3 预训练的 15%，耗费资金可达 12.9M 美元。发一篇顶会论文，需要多少实验预算？最近，DeepMind 发表了一项研究，对 LLM 扩大规模时各种算法和架构细节，比如参数和优化器的选择，进行了广泛的实证调查。这篇论文已被 ICML 2024 接收。论文地址：页的论文涵盖了数以万计的模型，备选方案包括 3 种优化器、4 种参数化方案、几

8/3/2024 1:18:50 PM

清源

Nature：谷歌 AI 研究引用量登全球榜首，中国企业腾讯、阿里、华为前十

Nature 最近报道了一个新发布的 AI 行业数据库 PARAT，分析显示，在论文引用、专利申请等方面，美国和中国企业占据了主导地位。在 AI 领域，硅谷巨头 Alphabet（谷歌母公司）和微软的论文引用量最高，远超其他公司。不过，中国企业百度和腾讯在专利方面领先。这些结果来自新兴技术观察站（ETO）发布的 PARAT 数据库，该工具跟踪私营部门的 AI 相关活动，包括研究和专利的发表，以及人才指标，帮助我们洞见 AI 发展趋势。ETO 是隶属于安全与新兴技术中心（CSET），后者的总部设在乔治城大学外交学院，

8/2/2024 1:33:05 PM

汪淼

多所高校开始检测毕业论文“含 AI 量”，学生称自己原创论文被检出“AI 率”较高、无法过审

据澎湃新闻今日报道，今年有一些高校开始针对 2024 届毕业生发布有关生成式 AI 检测的通知，明确学生在进行毕业设计（论文）时，应严格遵守学术规范和学术道德，避免过度依赖智能生成内容，确保毕业设计（论文）的独立性和原创性。但是，报道提到多名学生的原创论文被检测为“AI”生成，且没有申诉途径，只能按照机器的运行逻辑修改。接受采访的学生都认为，AI 检测“某种程度上”确实可以防止学生用 AI 代写论文，但目前的 AI 检测功能尚不成熟。其中一名学生舒然（AI在线注：化名，下同）经过半个月的时间完成了两万三千字的论文初

7/22/2024 9:12:52 PM

清源

谷歌 DeepMind 被曝抄袭开源成果，论文还中了顶流会议

大模型圈再曝抄袭大瓜，这回，“被告”还是大名鼎鼎的谷歌 DeepMind。“原告”直接怒喷：他们就是把我们的技术报告洗了一遍！具体是这么个事儿：谷歌 DeepMind 一篇中了顶流新生代会议 CoLM 2024 的论文被挂了，瓜主直指其抄袭了一年前就挂在 arXiv 上的一项研究。开源的那种。两篇论文探讨的都是一种规范模型文本生成结构的方法。抓马的是，谷歌 DeepMind 这篇论文中确实明晃晃写着引用了“原告”的论文。然鹅，即便是标明了引用，“原告”的两位论文作者 Brandon T. Willard（布兰登）和

7/15/2024 2:06:20 PM

汪淼

AI 青年，执掌未来十年的钥匙，2024 WAIC·云帆奖得主揭晓

期待更多奋斗在 AI 第一线的青年先锋，积极思考如何将更通用的 AI 技术，更有效地应用到更广泛、更多元的实际生产生活场景中，使之成为真正推动社会和经济发展的引擎。7 月 5 日，在 2024 WAIC·云帆奖颁奖典礼暨人工智能青年先锋论坛上，举行了最新一届的「WAIC·云帆奖」颁奖典礼。2024 年 WAIC·云帆奖共收到来自全球的近 200 份有效报名和提名，最终遴选出 10 位璀璨明星和 15 位明日之星。他们中有来自海内外著名高校的青年教师及博士后研究员，AI 领先企业的技术负责人、也有参与创立了新一代 A

7/8/2024 1:32:00 PM

机器之心

CVPR 2024全部奖项公布！近万人线下参会，谷歌华人研究员获最佳论文奖

北京时间 6 月 20 日凌晨，在西雅图举办的国际计算机视觉顶会 CVPR 2024 正式公布了最佳论文等奖项。今年共有 10 篇论文获奖，其中 2 篇最佳论文，2 篇最佳学生论文，另外还有 2 篇最佳论文提名和 4 篇最佳学生论文提名。作为计算机视觉（CV）领域的顶级会议，CVPR 每年都会吸引大量研究机构和高校参会。据统计，今年共提交了 11532 份论文，2719 篇被接收，录用率为 23.6%。根据佐治亚理工学院对 CVPR 2024 录用数据的统计分析，从研究主题来看，论文数量最多的是图像和视频合成与生成

6/20/2024 2:56:00 PM

机器之心

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构深度拆解！这可能是全网最详细的AI视频创作教程

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质开发者具身智能 xAI 生成式神经网络机器学习 3D 人形机器人 AI视频 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程视觉预测