理论
AI真的需要「像人类」那样思考吗?AlphaOne揭示属于大模型的「思考之道」
本文共同第一作者为张均瑜与董润沛,分别为伊利诺伊大学厄巴纳-香槟分校计算机科学研究生与博士生;该研究工作在伊利诺伊大学厄巴纳-香槟分校张欢教授与 Saurabh Gupta 教授,加州大学伯克利分校 Jitendra Malik 教授的指导下完成。 「The most effortful forms of slow thinking are those that require you to think fast.」 ——Daniel Kahneman,Thinking,Fast and Slow(2011)在思维节奏这件事上,人类早已形成一种独特而复杂的模式。 我们习惯让 AI 模仿人类思维方式:先依赖直觉快速反应(System 1),再慢慢进入逻辑推理(System 2);答题时先给出初步判断,再自我反思逐步修正……模仿人类的推理节奏,已经成为语言模型推理策略的默认路径。
6/24/2025 9:05:00 AM
28岁辍学生掌舵Meta超级AI!小扎掷千亿,与奥特曼密谋,新「王」登顶
19岁MIT辍学,24岁白手起家的亿万富翁,扎克伯格为他豪掷143亿美元,28岁掌管Meta新设立的「超级智能」部门。 这些标签哪一个都足够让人侧目,但汇聚在Alexandr Wang身上,却只是他AI「登月计划」的起点。 最近,这位Scale AI创始人宣布辞去CEO职位,正式加盟Meta,挑起打造超越人类智能AI的重任。
6/24/2025 9:04:21 AM
哈佛重磅预警!经济学家预言:全球AI失业潮2年来袭,世界经济大崩盘在即
AI接管全员工作,这个话题彻底火了。 甚至连哈佛商学院都做了一个Youtube视频,预警如果AI接管人类的所有工作时,将会发生什么。 在访谈中,弗吉尼亚大学经济学教授、领先的AI经济学家 Anton Korinek揭示了为何AGI可能在短短2-5年内实现。
6/24/2025 9:01:57 AM
无损减少80%激活值内存,提升5倍训练序列长度,仅需两行代码
本文的第一作者罗琪竣、第二作者李梦琦为香港中文大学(深圳)计算机科学博士生,本文在上海交通大学赵磊老师、香港中文大学(深圳)李肖老师的指导下完成。 长序列训练对于模型的长序列推理等能力至关重要。 随着序列长度增加,训练所需储存的激活值快速增加,占据训练的大部分内存。
6/24/2025 9:00:00 AM
我在哪?要去哪?要怎么去?字节跳动提出Astra双模型架构助力机器人自由导航
在当今科技飞速发展的时代,机器人在各个领域的应用越来越广泛,从工业生产到日常生活,都能看到它们的身影。 然而,现代机器人导航系统在多样化和复杂的室内环境中面临着诸多挑战,传统方法的局限性愈发明显。 一、传统导航瓶颈凸显,Astra 应势而生在复杂的真实世界中,移动机器人想要安全可靠地行走,必须解决三大挑战:我要去哪?
6/24/2025 8:57:43 AM
大型语言模型微调全攻略:从理论到实战的终极指南
译者|朱先忠审校|重楼微调是将预先在海量通用数据上训练好的大型语言模型,在更小、更具体的领域或任务数据集上进一步训练的过程。 其核心在于利用预训练模型获得的通用语言理解能力,通过特定数据进行针对性调整,使模型能深刻理解专业术语、领域规则和任务要求,从而生成更准确、更符合特定需求的输出。 引言想象你拥有一个像GPT-3或Llama 3这样强大的LLM,它已在互联网规模的文本上进行了预训练,能回答一般问题、创作文本、总结文章、翻译语言。
6/24/2025 8:52:54 AM
朱先忠
只训练数学,却在物理化学生物战胜o1!新强化学习算法带来显著性能提升,还缓解训练崩溃问题
只训练数学,却在物理化学生物战胜o1! 强化学习提升模型推理能力再添例证。 来自上海创智学院、上海AI Lab的MM-Eureka系列工作提出了新的强化学习算法CPGD(Clipped Policy Gradient Optimization with Policy Drift)——相比于传统GRPO、RLOO等算法显著缓解了训练不稳定(甚至崩溃)的问题,并带来显著性能提升。
6/24/2025 8:45:00 AM
CVPR 2025 Award Candidate | 英伟达等Difix3D+:用单步扩散模型修复 3D 重建伪影
在 3D 重建领域,无论是 NeRF 还是最新的 3D Gaussian Splatting(3DGS),在生成逼真新视角时仍面临一个核心难题:视角一旦偏离训练相机位置,图像就容易出现模糊、鬼影、几何错乱等伪影,严重影响实际应用。 为了解决这个问题,来自英伟达的研究团队联合提出了一种创新方案 —— Difix3D ,通过单步扩散模型对 3D 渲染结果进行 “图像修复”,显著提升新视角图像的质量和一致性。 该工作已被 CVPR 2025 接收,并入选 Best Paper Award 候选。
6/24/2025 8:40:00 AM
企业正在高薪招聘的11大热门AI岗位
各企业对工作场所中的AI持乐观态度,但AI的迅速普及也催生了对新人才的需求,以帮助设计、开发、实施和维护AI工具和服务。 AI的受欢迎程度不仅在科技行业迅速增长,而且在其他所有行业也同样如此,因为各企业正迅速采用这项技术以简化业务流程。 Foundry最近对高级IT专业人员进行的一项调查发现,预计到2025年底,AI支出将保持稳定,61%的企业表示他们计划增加支出,而只有1%的企业表示他们计划减少支出,总计有88%的企业表示,他们已经投资或计划投资于帮助内部构建AI能力的工具。
6/24/2025 7:00:00 AM
Sarah
模型合并 之 PMA 策略:大型语言模型预训练的 “加速引擎”
大家好,我是肆〇柒。 在 AI 领域,大型语言模型(LLM)在自然语言处理、智能问答系统和代码生成等众多任务中展现出卓越能力。 然而,这些模型的发展面临诸多挑战,包括预训练成本高昂、特定领域后训练效果有限、性能扩展预测不确定以及大规模训练不稳定等问题。
6/24/2025 3:00:00 AM
肆零柒
AI“黑科技”入侵医药行业,究竟藏着多少惊喜变革?
人工智能(AI)技术在医药行业的应用日益广泛且深入。 从特药药房的患者精细化管理到制药企业的数字化转型,AI技术正逐步改变着医药行业的运营模式和服务方式。 本文汇集了企业网D1net .
6/24/2025 1:30:00 AM
赵立京
超实用!SpringAI提示词的四种神级用法
提示词(Prompt)是输入给大模型(LLM)的文本指令,用于明确地告诉大模型你想要解决的问题或完成的任务,也是大语言模型理解用户需求并生成准确答案的基础。 因此 prompt 使用的好坏,直接决定了大模型生成结果的质量(是否符合预期)。 那问题来了,在 Spring AI/Spring AI Alibaba 如何用好提示词?
6/24/2025 12:00:00 AM
磊哥
奥特曼YC硬核访谈:走ChatGPT之路必死,世界差点没有OpenAI!
奥特曼YC创业学院访谈,终于放出了。 四十多分钟的访谈中,他回溯了打造OpenAI的艰难历程,首次透露了职业生涯至暗时刻,以及内部正在构建的GPT-5。 最令人印象深刻的是,他劝告所有人——不要开发类ChatGPT,这是OpenAI的护城河,要勇闯无人区。
6/23/2025 5:59:17 PM
对标Cursor!百度文心快码AI IDE上线,首创设计稿一键转代码、支持MCP
6月23日,百度AI开放日举行,百度智能代码助手文心快码迎来重大突破。 百度副总裁陈洋现场发布了文心快码独立AI原生开发环境工具——Comate AI IDE,是行业首个多模态、多智能体协同的AI IDE,首创设计稿一键转代码,开箱即用,为国内企业和开发者打造高效、智能、安全可靠的AI IDE。 目前,百度每天新增的代码中,文心快码生成的代码占比已超过43%。
6/23/2025 4:51:29 PM
AI时代的开源进化论:安全、成本与选择的破局之道
自ChatGPT横空出世引爆AI大模型热潮以来,科技界一场关于"开源"与"闭源"的辩论被推向新的高潮。 这场争论的源头可追溯至计算机文明的启蒙时代——1998年2月3日,自由软件运动活动家克里斯汀·彼得森(Christine Peterson)首次提出"Open Source"这一革命性术语,次日Linux创始人林纳斯·托瓦兹(Linus Torvalds)发布具有里程碑意义的GPL版权许可说明,正式为开源运动奠定法律基石。 在开源运动早期,埃里克·雷蒙德(Eric S.
6/23/2025 3:55:46 PM
真急了!AI落后、Siri彻底输给ChatGPT,拯救苹果全靠她?
苹果急了! 据彭博最新报道:苹果在今年接触过OpenAI前首席技术官Mira Murati,讨论了和Thinking Machines Lab交易的初步意向。 苹果与Thinking Machines Lab并没有进入到高级谈判阶段。
6/23/2025 3:19:11 PM
马斯克放大招:Robotaxi 真的来了!首批10辆开跑,千万网友围观,全网猜测:安全监控员干啥的?网友:不知道该怎么定义接管了
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)统一车费 4.20 美元、首发奥斯汀、仅10余辆车上线运行……马斯克的 Robotaxi 终于开跑了。 6月23日清晨,马斯克在 X 上官宣:特斯拉自动驾驶出租车服务正式在德州奥斯汀启动试点,每单统一收取 4.20 美元,用户可以通过 Tesla App 体验这一“未来交通”。 并在置顶的帖子上表示:向 @Tesla_AI 的软件和芯片设计团队表示超级祝贺,@Robotaxi 成功上线!
6/23/2025 12:27:01 PM
云昭
PyTorch 从 0 到 1:超详细的安装与入门实战指南
PyTorch 是一个由 Meta (Facebook) AI 研究实验室主导开发的开源机器学习库。 它以其灵活性、易用性和强大的GPU加速功能而闻名,已成为学术界和工业界进行深度学习研究和应用开发的首选框架之一。 PyTorch 的两大核心特性:张量 (Tensor) 计算:类似于 NumPy 的多维数组,但提供了强大的 GPU 加速能力,使得大规模数值计算变得极其高效。
6/23/2025 10:20:00 AM
用户007
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉