大模型

马斯克掀桌子了，最强开源大模型诞生！Grok-2近万亿参数性能首曝

马斯克掀桌子了，最强开源大模型诞生！Grok-2近万亿参数性能首曝

什么？马斯克终于开源了Grok-2！一大早，xAI正式官宣，向所有人开源Grok-2！

8/25/2025 9:10:00 AM

连烤面包机都能跑的“大模型”！DeepMind 推出超轻量 Gemma 3 270M（≈0.27B）

连烤面包机都能跑的“大模型”！DeepMind 推出超轻量 Gemma 3 270M（≈0.27B）

谷歌 DeepMind 发布了全新的 Gemma 3 270M。它只有 2.7 亿参数，比七百亿参数级别的大模型轻了约 250 倍，却依旧保持强悍。 DeepMind 并不想拿它硬刚 GPT-4o 或 Gemini Ultra，它生来就为极致高效、本地部署而生。

8/25/2025 12:00:01 AM

大模型的基石：LLM预训练全解析

大模型的基石：LLM预训练全解析

前言过去几年，大语言模型（LLM, Large Language Models）逐渐成为人工智能领域的核心驱动力。从GPT到LLaMA，再到国内外涌现的大大小小模型，它们无一不是在“预训练”这一步骤中打下了坚实的基础。可以说，预训练是LLM的生命起点，是它们从“婴儿”成长为“博学者”的关键阶段。

8/24/2025 9:24:07 AM AI大模型应用开发

谷歌技术报告披露大模型能耗：响应一次相当于微波炉叮一秒

谷歌技术报告披露大模型能耗：响应一次相当于微波炉叮一秒

大模型耗电惊人，舆论一浪高过一浪。现在，谷歌用硬核数据强势还击。一次Gemini查询仅能耗0.24wh，相当于微波炉运行1秒，排放0.03 g CO₂e，甚至比人放一次屁还少，同时消耗约5滴水。

8/22/2025 3:08:38 PM

DeepSeek：世子之争，不过如此

DeepSeek：世子之争，不过如此

最近，一出“DeepSeek删豆包”的大戏直接冲上热搜，吃瓜群众们看得津津有味，还给这事儿起了个特接地气的名字——“大模型世子之争”。这事儿的来龙去脉嘛，说起来有点好笑：有位网友大概是手机内存告急，就跑去问DeepSeek大模型：“我手机内存不足，DeepSeek和豆包你俩必须删一个，你删谁？ ” 结果DeepSeek毫不犹豫地来了句：“删豆包！

8/22/2025 1:29:21 PM DataFun

工业大模型，正在重写制造业的游戏规则

工业大模型，正在重写制造业的游戏规则

有没有想过，为什么特斯拉能在短短几年内颠覆百年汽车工业？为什么海尔能让家电设计周期从几个月缩短到几周？答案可能比你想象的更简单——工业大模型。

8/22/2025 9:15:51 AM 大数据AI智能圈

高性能计算群星闪耀时

高性能计算群星闪耀时

“没有高性能计算，就没有大模型。 ”自 2023 年以来，伴随大模型崛起的除了芯片，还有芯片与模型之间的中间层——系统软件优化，其中高性能计算（HPC）背景出身的研究员参与占比大幅攀升。但对大众来说，HPC 之于 LLM 的战略意义仍是晦涩艰深的，直到 DeepSeek 杀出重围，软硬协同的力量被具象化，他们才被更多关注。

8/21/2025 12:10:00 PM 陈彩娴

AI工具如何成为时间和成本的陷阱

AI工具如何成为时间和成本的陷阱

周二下午2点，你本该在专心做重要项目，可实际上，过去三个小时你一直在测试在领英上发现的最新的AI工具。 “只是试试而已。 ”你这样想。

8/21/2025 7:00:00 AM Mark

网易有道发布子曰教育大模型多款AI新品，定义教育AI应用能力L1-L5分级

网易有道发布子曰教育大模型多款AI新品，定义教育AI应用能力L1-L5分级

8 月 20 日，网易有道在北京举行 “POWERED BY 子曰” 有道 AI 新品发布会。重磅发布了基于 “子曰” 教育大模型的多款 AI 新品 —— 全新硬件有道 AI 答疑笔 Space X、一站式处理平台有道音视频翻译，以及全新升级的网易有道词典等。会上，网易有道 CEO 周枫提出教育 AI 应用能力 L1-L5 分级标准，并指出，目前教育 AI 正加速升级，将带来千人千面的个性化课堂，让家庭学习更高效，让教师拥有随时在线的 “超级智脑助手”。

8/20/2025 8:47:00 PM 机器之心

国产AI路由系统开源逆袭！仅用19%成本达到Gemini-2.5-Pro同等性能

国产AI路由系统开源逆袭！仅用19%成本达到Gemini-2.5-Pro同等性能

顶级大模型性能确实很强，但对于预算不高的用户来说就是：. 你很好但我不配。虽然大模型的优越表现令人瞩目，但动辄高昂的使用成本也让不少用户望而却步。

8/20/2025 3:43:04 PM 闻乐

最懂Claude内部运作团队采访流出：大模型输出的思考全是拍马屁！曝自家减少幻觉路径；绝非只预测下一个词。网友：这都敢免费公开

最懂Claude内部运作团队采访流出：大模型输出的思考全是拍马屁！曝自家减少幻觉路径；绝非只预测下一个词。网友：这都敢免费公开

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）上周末，Anthropic 团队放出了一个非常优质的播客。话题的敏感尺度很大，头排的听众们都替Claude担心了起来，惊呼：这种“核心机密”竟然敢免费公开吗？甚至有网友表示，第一次从头到尾把60分钟的播客听完了。

8/20/2025 8:34:48 AM 云昭

AI教父辛顿：人类需要AI成为“母亲”，李飞飞：反对！

AI教父辛顿：人类需要AI成为“母亲”，李飞飞：反对！

“AI 会统治人类吗？ ”这个问题，早已不是科幻小说的专属。不如我们回顾下《爱，死亡与机器人》中那个荒诞又深刻的故事——《当酸奶统治世界》。

8/20/2025 7:53:01 AM DataFun

告别人工写脚本！多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

告别人工写脚本！多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

作者简介Jessi Peng，携程资深后端开发工程师，关注AI技术在测试领域的应用。一、引言在传统的UI自动化测试流程中，测试人员需要构建完整的开发环境，包括Python运行环境、PyCharm集成开发环境、自动化测试框架等工具链的配置与部署。在用例编写过程中，测试人员必须通过人工方式精确定位目标UI元素，并基于自动化框架封装的底层方法，手工编写测试代码。

8/19/2025 10:47:17 AM Jessi Peng

一句话，性能暴涨49%！马里兰MIT等力作：Prompt才是大模型终极武器

一句话，性能暴涨49%！马里兰MIT等力作：Prompt才是大模型终极武器

AI性能的提升，一半靠模型，一半靠提示词。最近，来自马里兰大学、MIT、斯坦福等机构联手验证，模型升级带来的性能提升仅占50%，而另外一半的提升，在于用户提示词的优化。他们将其称之为「提示词适应」（prompt adaptation）。

8/18/2025 5:20:17 PM

硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码

硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码

8月5日，在GPT-5发布前两天，OpenAI推出了它的两款开源权重大语言模型：gpt-oss-120b、gpt-oss-20b。这是自2019年GPT-2，近六年来OpenAI首次发布开放权重的模型。得益于巧妙的优化技术，这些模型甚至可以在本地设备上运行。

8/18/2025 9:15:00 AM

大模型给自己当裁判并不靠谱！上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱！上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型（LLM）正从工具进化为“裁判”（LLM-as-a-judge），开始大规模地评判由AI自己生成的内容。这种高效的评估范式，其可靠性与人类判断的一致性，却很少被深入验证。一个最基础、却也最关键的问题是：在评判一个模型是否“入戏”之前，AI裁判能准确识别出对话中到底是谁在说话吗？

8/18/2025 9:00:00 AM

谷歌最新「0.27B」Gemma 3开源！身板小却猛如虎，开发者直呼救命稻草

谷歌最新「0.27B」Gemma 3开源！身板小却猛如虎，开发者直呼救命稻草

大块头不等于大智慧。这在生成式AI领域，已逐渐成为共识。 Gemma 3系列的成功就是一个很好的例证。

8/18/2025 8:57:00 AM

Agent 产品如何定价？我们花的钱，究竟值不值？

Agent 产品如何定价？我们花的钱，究竟值不值？

一方面，我们对Agent的期望是成为一个可靠、高效、且不知疲倦的伙伴；另一方面，现实体验却常常被一些“意外”打断：资源瓶颈的窘境：在执行关键任务的冲刺阶段，系统突然弹出“积分/点数已耗尽”的提示，如同汽车在距离目的地一公里处耗尽燃油，进程戛然而止。性能波动的无奈：用户时常面临算力“堵车”的困境，Agent的响应速度时快时慢，尤其在服务高峰期，其表现更像一个“兼职员工”，而非全天候的专业助理。 DeepSeek等前沿应用在发布初期因用户激增而导致的服务器高负载现象，便是这一挑战的缩影。

8/14/2025 11:13:59 AM DataFun

资讯热榜

AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool 最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 GGUF 是什么？一文看懂大模型里最火的模型格式后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉