COAT

FP8训练新范式：减少40%显存占用，训练速度提高1.4倍

近期DeepSeek V3 引爆国内外的社交媒体，他们在训练中成功应用了 FP8 精度，显著降低了 GPU 内存使用和计算开销。这表明，FP8 量化技术在优化大型模型训练方面正发挥着越来越重要的作用。近期，来自伯克利，英伟达，MIT 和清华的研究者们提出了显存高效的 FP8 训练方法：COAT（Compressing Optimizer states and Activation for Memory-Efficient FP8 Training），致力于通过 FP8 量化来压缩优化器状态和激活值，从而提高内存利用率和训练速度。

3/7/2025 10:30:00 AM

机器之心

CoAT: 基于蒙特卡洛树搜索和关联记忆的大模型推理能力优化框架

研究者提出了一种新的关联思维链(Chain-of-Associated-Thoughts, CoAT)方法，该方法通过整合蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)和关联记忆机制来提升大语言模型(LLMs)的推理能力。区别于传统的单步推理方法，CoAT致力于增强LLM的结构化推理能力和自适应优化能力，实现动态知识整合。

2/13/2025 9:34:13 AM

佚名

NeurIPS 2024 | 用LLM探寻隐秘的因果世界

因果发现的现实挑战：稀缺的高级变量寻找并分析因果关系是科学研究中的重要一环，而现有的因果发现算法依赖由专家预先定义的高级变量。现实场景中的原始数据往往是图片、文本等高维非结构化数据，结构化的高级变量是十分稀缺的，导致现有的因果发现和学习算法难以用于至更广泛的数据。因此，香港浸会大学与MBZUAI、卡内基梅隆大学、香港中文大学、悉尼大学以及墨尔本大学合作发表论文《Discovery of the Hidden World with Large Language Models》，提出了一个名为 COAT 的新型框架，旨在利用大型语言模型和因果发现方法的优势，突破传统因果发现方法的局限性，更有效地在现实世界中定义高级变量、理解因果关系。

2/8/2025 4:56:00 PM

新闻助手

资讯热榜

全球高校 “猎杀” AI作业！学生如何应对 “人类化” 挑战？ AI 数据版权新纪元：Real Simple Licensing 协议引发行业关注 OpenAI 携手推出首部 AI 动画电影《Critterz》，2026 年全球上映 Gemini加密交易所IPO价格大幅上调，目标估值超30亿美元！万字解析！能提高10倍效率的多Agent系统：附智能海报项目实战！不到10天，国产「香蕉」突袭！一次7图逼真还原，合成大法惊呆歪果仁报道称：OpenAI 与博通合作开发自家 AI 芯片，明年开始量产 OpenAI进军韩国市场，携手三星与SK海力士共建AI未来！

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术图像 Gemini 智能体马斯克 AI新词 AI创作 Anthropic 英伟达论文训练代码算法 LLM Stable Diffusion 芯片腾讯蛋白质苹果 Claude 开发者 AI for Science Agent 生成式神经网络机器学习 3D xAI 研究生成人形机器人 AI视频百度计算工具 Sora GPU 大语言模型华为 RAG AI设计字节跳动具身智能搜索大型语言模型场景深度学习 AGI 视频生成预测视觉伟达架构 Transformer 神器推荐 DeepMind 亚马逊特斯拉编程 MCP