arXiv
研究人员揭示大模型并非真正推理,只是在 “找关系”
随着人工智能(AI)技术的飞速发展,越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。 近日,亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文,指出我们对这些 AI 模型的理解可能存在误区。 他们认为,这些模型实际上并不会进行真正的思考或推理,而仅仅是在寻找相关性。
5/30/2025 6:00:54 PM
AI在线
arXiv科研神器:Mistral OCR、Claude 3.7合体实现论文速读
还有人沉浸在阅读论文的苦恼吗? 面对 arXiv 上浩如烟海的学术论文,你是否也曾感到无从下手? 复杂的术语、冗长的段落、晦涩的图表,仿佛一道道高墙,将知识与理解隔离开来。
3/14/2025 11:51:00 AM
机器之心
arXiv和Hugging Face梦幻联动,一个按钮直达论文、模型、数据集
「这才是开放研究该有的样子。 」经常刷 arXiv 的同学,你有没有发现页面上多了个新功能? 这个新功能(图中的「Hugging Face」按钮)隐藏在「Code, Data, Media」选项卡下,选中之后就可以直达相关的 Hugging Face 论文、模型和数据集。
10/25/2024 1:26:00 PM
机器之心
Nature 曝惊人内幕:论文被天价卖出喂 AI,作者 0 收入
Nature 的一篇文章透露:你发过的 paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚 2300 万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗?全球数据告急,怎么办?论文来凑!最近,Nature 的一篇文章向我们揭露了这样一个事实:连科研论文,都被薅去训 AI 了……据悉,很多学术出版商,已经向科技公司授权访问自家的论文,用来训练 AI 模型。一篇论文从酝酿 idea 到成稿,包含了多少作者日日夜夜的心血,如今很可能在不知情的情况下,就成为训 AI 的数据。这合理吗?更可气的是
8/15/2024 12:53:16 PM
汪淼
arXiv论文可以发「弹幕」了,斯坦福alphaXiv讨论平台上线,LeCun点赞
干杯!当论文讨论细致到词句,是什么体验?最近,斯坦福大学的学生针对 arXiv 论文创建了一个开放讨论论坛 ——alphaXiv,可以直接在任何 arXiv 论文之上发布问题和评论。网站链接:,只需将任何 URL 中的 arXiv 更改为 alphaXiv 就可以直接在 alphaXiv 论坛上打开相应论文:可以精准定位到论文中的段落、句子:右侧讨论区,用户可以发表问题询问作者论文思路、细节,例如:也可以针对论文内容发表评论,例如:「给出至少一个数学问题及其解决方案作为示例会具有启发性。」用户还可以回应、点赞、反对
8/1/2024 2:47:00 PM
机器之心
早半年发arXiv,却被质疑抄袭:活在微软AutoGen阴影里的CAMEL
arXiv 不是同行评审期刊,所以发在 arXiv 上的论文不必被引用,这合理吗? 如果你对 AI 智能体感兴趣,那你一定知道微软的 AutoGen。它是一个用于构建 AI 智能体的开源编程框架,允许多个智能体通过聊天来解决任务。其间,LLM 智能体可以扮演多种角色,如程序员、设计师,或者各种角色的组合。在 GitHub 上,这个项目已经收获了 28k 的 star 量,论文还在 ICLR 2024 LLM Agent Workshop 上获得了最佳论文奖。不过,这篇论文的背后其实是存在争议的。2023 年 1
7/17/2024 3:18:00 PM
机器之心
你没有看过的全新版本,Transformer数学原理揭秘
近日,arxiv 上发布了一篇论文,对 Transformer 的数学原理进行全新解读,内容很长,知识很多,十二分建议阅读原文。2017 年,Vaswani 等人发表的 《Attention is all you need》成为神经网络架构发展的一个重要里程碑。这篇论文的核心贡献是自注意机制,这是 Transformers 区别于传统架构的创新之处,在其卓越的实用性能中发挥了重要作用。事实上,这一创新已成为计算机视觉和自然语言处理等领域人工智能进步的关键催化剂,同时在大语言模型的出现中也起到了关键作用。因此,了解
1/2/2024 3:05:00 PM
机器之心
arXiv大升级,论文网页版本直接看
很快就将扩展到所有论文。今年 10 月,著名预印版论文平台 arXiv 宣布获得 1000 万元捐款,现在版本大升级来了。本周四,arXiv 宣布了一项更新,正式加入论文 HTML 版本。消息一出,立刻引来了学界的欢呼,有人发现 arXiv 也已经准备好了暗黑模式:arXiv 是计算机科学、物理学、数学、生物学等学术领域常用论文预印本网站,创立于 1991 年。一直以来,arXiv 上论文的显示方式都以 pdf 格式为主,用户通常需要「下载 PDF(Download PDF)」来查看论文内容。现在,arXiv 宣布
12/25/2023 11:28:00 AM
机器之心
获1000万美元捐款,用于代码重构、上云,论文预印版平台arXiv「好起来了」
上云、代码重构一起来。对于节奏越来越快的学术研究领域而言,arXiv 是非常重要的论文预印版平台。和维基百科一样,它是个非营利性机构。当地时间本周四,康奈尔大学科技校区(Cornell Tech)宣布了 arXiv 获得巨额捐款的好消息。作为一个非营利数据库,arXiv 是所有人均可以免费访问的,长期以来一直依赖人们的捐赠。康奈尔科技校区宣布,西蒙斯基金会和美国国家科学基金会(NSF)已提供了总额超过 1000 万美元的赠款以支持 arXiv。据介绍,这笔资金将使这个拥有超过 200 万篇论文的研究存储库迁移到云端
10/20/2023 3:03:00 PM
机器之心
「arXiv就是毒瘤」ACL主席暴论被声讨,网友:我们换个顶会投吧
「arXiv 是个毒瘤,它以貌似实物出版的形式促进垃圾『科学』的传播,并一直在宣扬盲目跟风 + 任何超过 6 个月的内容都过时了的计算机科学文化。」
9/6/2023 2:18:00 PM
机器之心
探索大语言模型垂直化训练技术和应用-陈运文
内容来源:ChatGPT 及大模型专题研讨会 分享嘉宾:达观数据董事长兼CEO 陈运文博士分享主题:《探索大语言模型垂直化训练技术和应用》 转载自CSDN稿件本文整理自 3月11日 《ChatGPT 及大规模专题研讨会》上,达观数据董事长兼CEO 陈运文博士关于《探索大语言模型垂直化训练技术和应用》的分享,将介绍达观数据在大语言模型应用中的探索与思考。此次分享的主要内容分为 6 块,分别是:参数规模和数据规模的探索垂直领域适应预训练微调技术探索提示工程和垂直优化模型训练加速思路模型功能的垂直效能增强在探索大语言模型
3/23/2023 3:17:00 PM
达观数据
物理学家在arXiv上怒斥自然封面常温超导论文,被禁言6个月
在预印本平台上讨论学术问题也要文明、友好,这是 arXiv 刚刚给提交者上的一堂新课。
3/15/2022 2:30:00 PM
机器之心
- 1
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭“限流”
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
AI设计
Claude
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
Transformer
LLM
字节跳动
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构