理论

Meta-CoT：通过元链式思考增强大型语言模型的推理能力

大型语言模型（LLMs）在处理复杂推理任务时面临挑战，这突显了其在模拟人类认知中的不足。尽管 LLMs 擅长生成连贯文本和解决简单问题，但在需要逻辑推理、迭代方法和结果验证的复杂任务（如高级数学问题和抽象问题解决）中，其能力有所欠缺。这种局限性源于 LLMs 的信息处理方式。

1/27/2025 12:03:11 PM Kaushik Rajan

微软等开源AIOpsLab，可构建自主云AI Agent

微软、加州大学伯克利分校、伊利诺伊大学等研究人员联合开源了，一个专用于云自动化运维的AI Agents——AIOpsLab。 AIOpsLab能模拟真实云服务环境中的复杂操作任务，实现故障的自动化检测、定位和解决问题。还具备高度的可观测性，能够收集和分析关键的遥测数据，确保对系统状态和应用环境的深入洞察。

1/27/2025 9:51:24 AM AIGC开放社区

在2025年初，浅浅聊一聊世界模型 World Models

Update 1月10日:感谢评论区补充world model在RL中的定义！感觉在RL中的定义，world model是针对一个具体子任务的模型，最近上述公司提到的World Model的尺度似乎更大、更加通用，更多从：Language Generation Model (ChatGPT)-Image Generation Model(StableDiffusion)-Video/3D Geneartion Model (二者各有侧重因此平级)-World Generation Model(同时具备时序和空间序建模)这么一个趋势。当然这个World似乎想要包容一切，于是也并不清晰到底是什么样的表征：是否是video sequence?

1/27/2025 9:37:33 AM 原野寻踪

单张照片生成3D头部模型！Adobe提出FaceLift，从单一人脸图像重建360度头部模型

本文经AIGC Studio公众号授权转载，转载请联系出处。 FaceLift是Adobe和加州大学默塞德分校推出的单图像到3D头部模型的转换技术,能从单一的人脸图像中重建出360度的头部模型。 FaceLift基于两阶段的流程实现:基于扩散的多视图生成模型从单张人脸图像生成一致的侧面和背面视图;生成的视图被输入到GS-LRM重建器中,产出详细的3D高斯表示。

1/27/2025 9:32:23 AM 量子位

鄂维南李航领衔造高级论文搜索Agent，召回率和精准性超谷歌学术等，磕盐党狂喜

中科院院士鄂维南、字节AI实验室总监李航领衔，推出高级论文搜索Agent。名为PaSa，两个Agent分别执行多轮搜索和判断论文是否满足查询要求的任务，模仿人类复杂学术搜索行为。现在就有Demo可玩。

1/27/2025 9:00:00 AM 量子位

用Ray观测和监控大语言模型工作负载

译者 | 布加迪审校 | 重楼前言GPT-4、PHI2、BERT和T5等大语言模型（LLM）的出现已彻底改变了自然语言处理，这些模型支持高端应用程序，包括聊天机器人、推荐系统和分析。然而，LLM中工作负载的规模和复杂性使得保证性能和可靠性成了一大挑战。在这种情况下，在使用Ray等框架部署工作负载的同时进行监控和观测显得非常必要。

1/27/2025 8:23:41 AM 布加迪

十大机器蜜蜂：机器蜜蜂能拯救地球上所有的植物吗？

译者 | 张哲刚审校 | 重楼作为一个几乎每天都要吃蜂蜜吐司的人，在过去的几年里，我一直非常关注全球蜜蜂种群持续减少这个话题。蜜蜂不仅仅是蜂蜜生产者，它们还是大自然中伟大的传粉者。尽管，就传粉者而言，它们并不是唯一，但是，据我所知，它们是唯一能够生产蜂蜜的传粉者。

1/27/2025 8:00:00 AM 张哲刚

MetaDiff：用扩散模型重塑元学习，攻克小样本学习瓶颈！

一眼概览MetaDiff 提出了一种基于条件扩散模型的创新元学习方法，通过将梯度下降优化建模为去噪过程，有效提升了小样本学习（FSL）的性能，显著减少了内循环优化中的内存负担和梯度消失风险。核心问题小样本学习的主要挑战在于：如何在训练数据有限的情况下快速适应新任务，而不引入过拟合或内存瓶颈。传统基于梯度的元学习方法需要计算内循环路径上的二阶导数，导致内存消耗高和梯度消失问题，从而影响性能。

1/27/2025 12:57:43 AM 萍哥学AI

2025年，更多AI，更多软件开发者面临的问题

组织准备好应对AI生成代码可能带来的繁琐工作、漏洞和开发者倦怠了吗？译自More AI, More Problems for Software Developers in 2025，作者 Jennifer Riggins。生成式AI创造了比以往任何时候都更多的代码。

1/27/2025 12:23:15 AM 岱军

从人工到自动化到AIOps再到ChatOps：大模型在运维领域的应用

一、引言在信息技术飞速发展的今天，运维工作已经从最初的人工操作，逐步演变为自动化、AIOps（人工智能运维）和ChatOps（通过聊天的方式去运维）。这些变革不仅提升了运维效率，还显著保障了系统的稳定性。特别是借助大模型，运维同学能够更加高效地完成工作，并应对复杂的运维挑战。

1/26/2025 3:35:01 PM 佟铁

MV-DUSt3R+: 只需2秒！Meta Reality Labs开源最新三维基座模型，多视图大场景重建

本文一作为唐正纲，目前为博士生，就读于伊利诺伊大学厄巴纳 - 香槟分校，本科毕业于北京大学。通讯作者是严志程，Meta Reality Labs 高级科研研究员 (Senior Staff Research Scientist)，主要研究方向包括三维基础模型，终端人工智能 (On-device AI) 和混合现实。近期，Fei-Fei Li 教授的 World Labs 和 Google 的 Genie 2 展示了 AI 从单图生成 3D 世界的能力。

1/26/2025 2:13:28 PM 机器之心

字节版Operator抢跑OpenAI? 直接免费开源，网友：怒省200美元！

一线大模型，正在全面进入智能体时代。 1 月 24 日凌晨 2 点，OpenAI 面向月供 200 美元的 ChatGPT Pro 用户发布了自家的 Computer Use 智能体：Operator。 OpenAI 甚至给 Operator 开设了单独的产品界面，将它视为与 ChatGPT、Sora 并列的关系，这也符合 Sam Altman、黄仁勋、扎克伯格等科技大佬对于「2025 年将是 AI 智能体之年」的趋势判断。

1/26/2025 2:07:34 PM 机器之心

胜过Transformer？谷歌推出新型AI模型架构Titans

自2017年推出以来，Transformer模型架构一直是人工智能的基础要素，推动了自然语言处理、机器翻译等领域的进步。不过，该模型在可扩展性、计算效率以及应对日益复杂任务等方面，仍面临着诸多挑战。而Titans模型架构的诞生，旨在通过整合受人类认知过程启发的机制来克服这些障碍，如记忆优先级和适应性注意力。

1/26/2025 1:20:49 PM Yu

顶级AI智能体不会社交，创业远不如人类！CMU等：最多完成24%任务

如今，基于大模型的智能体，已经能完成许多在几年前还无法想象的任务，进步的速度是如此之快，以至于有些人甚至声称，在接下来的几年内，大多数人类劳动可能都可以实现自动化。然而近日CMU、杜克大学等机构发表的一项研究却给这一期待泼了一盆凉水。智能体运营公司还不可行论文链接： Agent Company，与人类员工类似，智能体需要执行软件开发、项目管理、财务分析等典型的商业环境中的任务。

1/26/2025 1:07:50 PM 新智元

全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻

这些天，硅谷彻底处于中国公司带来的大地震余波中。全美都在恐慌：是否全球人工智能的中心已经转移到了中国？就在这当口，全球复现DeepSeek的一波狂潮也来了。

1/26/2025 1:03:35 PM 新智元

AI 重塑运维：基于 Spring AI 的 Docker 自然语言管理实践

MCP (Model Context Protocol) 是一个创新的开源协议，它的核心目标是彻底简化 AI 应用程序的开发流程。通过提供标准化的通信接口，MCP 在 AI 模型与应用程序上下文之间搭建了一座智能桥梁，让开发者能够更加高效地构建和部署 AI 驱动的应用。 MCP Docker 服务器使用指南图片在容器化技术日益普及的今天，Docker 的管理和运维工作往往需要掌握大量的命令和配置知识。

1/26/2025 12:34:46 PM 冷冷

太惨，一个月仅23个下载！盘点2024“理想丰满现实骨感”的大模型们！

整理 | 言征出品 | 51CTO技术栈（微信号：blog51cto）大型语言模型的竞争似乎正在结束，只有少数几个明显的赢家。其中，DeepSeek V3 已成为 2024 年的焦点，引领中国开源模型的发展。据 Hugging Face 称，DeepSeek V3 与 GPT-4 和 Claude 3.5 等闭源巨头正面交锋，上个月的下载量为 45,499 次，与Meta 的 Llama 3.1（491,629 次下载）和谷歌的 Gemma 2（377,651 次下载）并驾齐驱。

1/26/2025 11:38:54 AM 言征

Meta杨立昆引燃全民大讨论：美政府有些人被洗脑了，监管让开源变得像非法一样！Meta也犯过错！大模型不如猫，保质期就3年！

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）1月23日，在冬季达沃斯论坛的“辩论技术”环节，Meta公司副总裁兼首席人工智能科学家Yann Lecun、麻省理工学院媒体实验室主任 Dava Newman、Axios首席技术记者Ina Turpen Fried（主持人）就未来十年前沿科技进行了时长47分钟的“全民”大讨论，话题涵盖了LLM、智能体、消费机器人、脑机接口、跨物种、太空探索，也讨论了非常让Meta敏感的“技术作恶”、审查监管、开闭源之争。观众们更是抓住机会让两位嘉宾抖出了很多猛料。 Lecun表示，现在的大模型并没有达到预期效果，在很多方面都存在不足：“我认为当前 LLM范式的保质期相当短，可能只有3到5年。

1/26/2025 11:35:05 AM 言征

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

Meta-CoT：通过元链式思考增强大型语言模型的推理能力

微软等开源AIOpsLab，可构建自主云AI Agent

在2025年初，浅浅聊一聊世界模型 World Models

单张照片生成3D头部模型！Adobe提出FaceLift，从单一人脸图像重建360度头部模型

鄂维南李航领衔造高级论文搜索Agent，召回率和精准性超谷歌学术等，磕盐党狂喜

用Ray观测和监控大语言模型工作负载

十大机器蜜蜂：机器蜜蜂能拯救地球上所有的植物吗？

MetaDiff：用扩散模型重塑元学习，攻克小样本学习瓶颈！

2025年，更多AI，更多软件开发者面临的问题

从人工到自动化到AIOps再到ChatOps：大模型在运维领域的应用

MV-DUSt3R+: 只需2秒！Meta Reality Labs开源最新三维基座模型，多视图大场景重建

字节版Operator抢跑OpenAI? 直接免费开源， 网友：怒省200美元！

胜过Transformer？谷歌推出新型AI模型架构Titans

顶级AI智能体不会社交，创业远不如人类！CMU等：最多完成24%任务

全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻

AI 重塑运维：基于 Spring AI 的 Docker 自然语言管理实践

太惨，一个月仅23个下载！盘点2024“理想丰满现实骨感”的大模型们！

Meta杨立昆引燃全民大讨论：美政府有些人被洗脑了，监管让开源变得像非法一样！Meta也犯过错！大模型不如猫，保质期就3年！

字节版Operator抢跑OpenAI? 直接免费开源，网友：怒省200美元！