资讯列表

分类

标签

MiniMax推M2推理大模型：2300亿参数、100 token/s，专为智能Agent而生

在大模型竞赛从“拼参数”转向“拼效率”的关键节点，MiniMax于10月27日发布新一代开源推理模型M2，以精准的工程取舍，锚定智能Agent这一下一代AI应用的核心战场。 M2采用混合专家架构（Mixture-of-Experts， MoE），总参数量达2300亿，但每次推理仅激活100亿参数，实现高达每秒100个token的输出速度——这一性能指标使其在实时交互场景中具备显著优势。尤为关键的是，M2专为智能Agent设计，强化了在行为决策、多轮任务规划与环境交互中的推理连贯性与响应效率，为构建真正自主的AI智能体提供底层引擎。

10/28/2025 10:11:33 AM AI在线

AI 初创企业 Mercor 融资 3.5 亿美元，估值高达 100 亿美元

近日，AI 初创公司 Mercor 在其官网发布消息，成功完成了一轮融资，金额达到3.5亿美元。这轮融资的估值高达100亿美元，由著名投资机构 Felicis 领投，值得注意的是，Felicis 此前也曾参与了 Mercor 的 B 轮融资，投资额为1亿美元。此外，Benchmark、General Catalyst 以及新加入的投资方 Robinhood Ventures 也对本轮融资表示了支持。

10/28/2025 10:11:33 AM AI在线

马斯克推出Grokipedia：用AI重构百科全书，剑指维基百科的“宣传”与偏见

当信息过载与虚假叙事充斥网络，埃隆·马斯克选择用AI打造一座“更真实”的知识灯塔。近日，其旗下xAI公司在X平台正式上线全新众包百科项目——Grokipedia，宣称将借助人工智能技术，提供比维基百科更清晰、更客观、更少“宣传”的知识服务。 Grokipedia并非传统意义上的在线百科全书。

10/28/2025 10:11:32 AM AI在线

OpenAI 呼吁美国加大电力投资助力 AI 领域领跑中国

OpenAI 公司发表声明，敦促白宫显著增加电力产能的投资，以确保美国在人工智能（AI）领域能够继续领先中国。随着该公司计划推进一系列庞大的基础设施扩建项目，电力供应的紧张问题愈发凸显。 OpenAI 首席执行官萨姆・奥特曼在德克萨斯州阿比林的 “Stargate” 人工智能数据中心接受采访时指出，建设 AI 基础设施不仅需要强大的计算能力，更需要稳定且充足的电力供应。

10/28/2025 10:11:19 AM AI在线

美国能源部与 AMD 达成十亿合作共建超级计算机和AI项目

美国能源部长克里斯・赖特（Chris Wright）与超威半导体公司(AMD)首席执行官苏姿丰(Lisa Su)近日向媒体宣布，双方签署了一项价值10亿美元的合作协议，计划共同建设两台超级计算机。这两台计算机的目标是支持解决核能利用、癌症治疗及国家安全等多方面的重大科学挑战。赖特部长表示，这两台超级计算机将大大增强美国在复杂实验中所需的数据处理能力。

10/28/2025 10:11:16 AM AI在线

OpenAI GPT-5震撼升级心理健康响应，不当回答骤降65%

10/28/2025 10:11:13 AM AI在线

高通发布新一代 AI 芯片，挑战英伟达股价大涨 20%

高通公司正式发布了其新一代人工智能芯片 ——AI200和 AI250，这一举措旨在挑战市场领先者英伟达。此次发布会引起了广泛关注，公司的股价随之上涨超过20%。高通 AI200芯片是一款专为机架级 AI 推理设计的解决方案，其目标在于降低总体拥有成本（TCO）并提升性能。

10/28/2025 10:11:13 AM AI在线

中小企业AI落地的算力“最优解”：一台插电即用的Mac mini

今天来聊下中小企业大模型应用落地的一些市场观察。年初到现在，加起来聊过的两百来家企业中，约摸八九成都是年营收过亿，或者从规模上看，公司人数往往都在大几百人以上。在新技术应用的初期，预算相对充足的企业中先行先试，很符合一般规律。

10/28/2025 9:32:36 AM 韦东东

Thinking Machine新研究刷屏！结合RL+微调，小模型训练更具性价比

10/28/2025 9:32:17 AM 一水

AI已经开始自己设计算法，并且超越顶尖人类专家，人类还能做什么？

AI已经开始为自己设计算法，而且发现了比顶尖人类专家更优的算法。这不是科幻，而是正在发生的事实。刚刚，谷歌DeepMind团体的一篇论文登上Nature。

10/28/2025 9:27:04 AM

超越谷歌Banana，字节联合香港中文大学等高校开源最强图像编辑生成系统DreamOmni2

AI图像编辑与生成，正迎来一场体验革命。香港中文大学，香港科技大学，香港大学和字节跳动共同研发的系统DreamOmni2，实现图像编辑与生成领域最新SOTA。指令遵循能力全面领先，真正做到指哪打哪。

10/28/2025 9:25:04 AM

OpenAI 披露：每周有超过一百万人与 ChatGPT 倾诉自杀倾向

10 月 28 日消息，OpenAI 于当地时间周一发布了最新数据，揭示了大量 ChatGPT 用户在与人工智能聊天机器人交流时正面临心理健康问题。该公司表示，在任意一周内，约有 0.15% 的活跃用户会进行“包含明确自杀计划或意图迹象”的对话。鉴于 ChatGPT 每周活跃用户超过 8 亿人，这意味着每周有超过 100 万人向其倾诉自杀倾向。

10/28/2025 9:24:23 AM 远洋

开源即登榜！登顶全球前十AI编程智能体，UCL初创团队开源Prometheus

来自伦敦大学学院（UCL）的初创团队EuniAI开源发布了AI软件智能体Prometheus。该系统在SWE-bench Verified上取得71.2%的Pass@1成功率，成绩已被官方确认并合并至主榜单。令人瞩目的是，这一成果来自高校科研团队，却已与产业巨头同台竞技，展现出学术研发在AI工程领域的产业级突破。

10/28/2025 9:22:18 AM

Thinking Machine新研究刷屏！结合RL+微调优势，小模型训练更具性价比了

10/28/2025 9:21:02 AM

VaseVQA：考古领域实现专家级，诊断+补弱RL框架

古希腊陶器是考古学和艺术史的重要实物证据。研究者需要从单件陶器中提取多层信息：材质与工艺、形制类别、装饰主题、出土地与时间、甚至可能的作坊或画师。不过传统计算机视觉和通用多模态模型在这类高度专业化任务上常陷入两类困境：一是缺乏领域知识（模型在通用语料里几乎没接触过「雅典黑釉杯」或「红绘风格」这样的概念）；二是仅靠监督微调（SFT）容易学到「表层捷径」，在遇到组合性、推理性或少样本问题时就失效。

10/28/2025 9:19:50 AM

大模型在具身推理上「翻车」了？4496 道题全面揭示短板

祁煜，2023年本科毕业于北京大学信息科学技术学院。目前为美国Northeastern University在读博士生，研究方向为机器人与机器学习, 具身智能, 在 CVPR、ICML、CoRL 等顶级会议中发表过论文。具身智能是近年来非常火概念。

10/28/2025 9:16:38 AM

世界模型==VQA？机器人不用想象画面，预测语义就够了

众所周知，世界模型是一种让 AI「想象未来」的学习方法。它可以从大量数据中学习世界的运行规律，然后根据当前状态预测未来可能发生的事情。这种能力非常关键，因为如果 AI 能对未来做出合理预测，就能提前规划出更聪明、更稳健的行动策略。

10/28/2025 9:13:58 AM

刚刚，Thinking Machines Lab博客提出在策略蒸馏，Qwen被cue 38次

刚刚，不发论文、爱发博客的 Thinking Machines Lab （以下简称 TML）再次更新，发布了一篇题为《在策略蒸馏》的博客。在策略蒸馏（on-policy distillation）是一种将强化学习 (RL) 的纠错相关性与 SFT 的奖励密度相结合的训练方法。在将其用于数学推理和内部聊天助手时，TML 发现在策略蒸馏可以极低的成本超越其他方法。

10/28/2025 9:09:51 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

资讯列表

MiniMax推M2推理大模型：2300亿参数、100 token/s，专为智能Agent而生

AI 初创企业 Mercor 融资 3.5 亿美元，估值高达 100 亿美元

马斯克推出Grokipedia：用AI重构百科全书，剑指维基百科的“宣传”与偏见

OpenAI 呼吁美国加大电力投资 助力 AI 领域领跑中国

美国能源部与 AMD 达成十亿合作 共建超级计算机和AI项目

OpenAI GPT-5震撼升级心理健康响应，不当回答骤降65%

​高通发布新一代 AI 芯片，挑战英伟达股价大涨 20%

中小企业AI落地的算力“最优解”：一台插电即用的Mac mini

Thinking Machine新研究刷屏！结合RL+微调，小模型训练更具性价比

AI已经开始自己设计算法，并且超越顶尖人类专家，人类还能做什么？

超越谷歌Banana，字节联合香港中文大学等高校开源最强图像编辑生成系统DreamOmni2

OpenAI 披露：每周有超过一百万人与 ChatGPT 倾诉自杀倾向

开源即登榜！登顶全球前十AI编程智能体，UCL初创团队开源Prometheus

Thinking Machine新研究刷屏！结合RL+微调优势，小模型训练更具性价比了

VaseVQA：考古领域实现专家级，诊断+补弱RL框架

大模型在具身推理上「翻车」了？4496 道题全面揭示短板

世界模型==VQA？机器人不用想象画面，预测语义就够了

刚刚，Thinking Machines Lab博客提出在策略蒸馏，Qwen被cue 38次

OpenAI 呼吁美国加大电力投资助力 AI 领域领跑中国

美国能源部与 AMD 达成十亿合作共建超级计算机和AI项目

高通发布新一代 AI 芯片，挑战英伟达股价大涨 20%