AI在线 AI在线

大模型

马斯克掀桌子了,最强开源大模型诞生!Grok-2近万亿参数性能首曝

马斯克掀桌子了,最强开源大模型诞生!Grok-2近万亿参数性能首曝

什么? 马斯克终于开源了Grok-2! 一大早,xAI正式官宣,向所有人开源Grok-2!
8/25/2025 9:10:00 AM
连烤面包机都能跑的“大模型”!DeepMind 推出超轻量 Gemma 3 270M(≈0.27B)

连烤面包机都能跑的“大模型”!DeepMind 推出超轻量 Gemma 3 270M(≈0.27B)

谷歌 DeepMind 发布了全新的 Gemma 3 270M。 它只有 2.7 亿参数,比七百亿参数级别的大模型轻了约 250 倍,却依旧保持强悍。 DeepMind 并不想拿它硬刚 GPT-4o 或 Gemini Ultra,它生来就为极致高效、本地部署而生。
8/25/2025 12:00:01 AM
大模型的基石:LLM预训练全解析

大模型的基石:LLM预训练全解析

前言过去几年,大语言模型(LLM, Large Language Models)逐渐成为人工智能领域的核心驱动力。 从GPT到LLaMA,再到国内外涌现的大大小小模型,它们无一不是在“预训练”这一步骤中打下了坚实的基础。 可以说,预训练是LLM的生命起点,是它们从“婴儿”成长为“博学者”的关键阶段。
8/24/2025 9:24:07 AM AI大模型应用开发
谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒

谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒

大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少,同时消耗约5滴水。
8/22/2025 3:08:38 PM
DeepSeek:世子之争,不过如此

DeepSeek:世子之争,不过如此

最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
8/22/2025 1:29:21 PM DataFun
工业大模型,正在重写制造业的游戏规则

工业大模型,正在重写制造业的游戏规则

有没有想过,为什么特斯拉能在短短几年内颠覆百年汽车工业? 为什么海尔能让家电设计周期从几个月缩短到几周?  答案可能比你想象的更简单——工业大模型。
8/22/2025 9:15:51 AM 大数据AI智能圈
高性能计算群星闪耀时

高性能计算群星闪耀时

“没有高性能计算,就没有大模型。 ”自 2023 年以来,伴随大模型崛起的除了芯片,还有芯片与模型之间的中间层——系统软件优化,其中高性能计算(HPC)背景出身的研究员参与占比大幅攀升。 但对大众来说,HPC 之于 LLM 的战略意义仍是晦涩艰深的,直到 DeepSeek 杀出重围,软硬协同的力量被具象化,他们才被更多关注。
8/21/2025 12:10:00 PM 陈彩娴
AI工具如何成为时间和成本的陷阱

AI工具如何成为时间和成本的陷阱

周二下午2点,你本该在专心做重要项目,可实际上,过去三个小时你一直在测试在领英上发现的最新的AI工具。 “只是试试而已。 ”你这样想。
8/21/2025 7:00:00 AM Mark
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级

网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级

8 月 20 日,网易有道在北京举行 “POWERED BY 子曰” 有道 AI 新品发布会。 重磅发布了基于 “子曰” 教育大模型的多款 AI 新品 —— 全新硬件有道 AI 答疑笔 Space X、一站式处理平台有道音视频翻译,以及全新升级的网易有道词典等。 会上,网易有道 CEO 周枫提出教育 AI 应用能力 L1-L5 分级标准,并指出,目前教育 AI 正加速升级,将带来千人千面的个性化课堂,让家庭学习更高效,让教师拥有随时在线的 “超级智脑助手”。
8/20/2025 8:47:00 PM 机器之心
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能

国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能

顶级大模型性能确实很强,但对于预算不高的用户来说就是:. 你很好但我不配。 虽然大模型的优越表现令人瞩目,但动辄高昂的使用成本也让不少用户望而却步。
8/20/2025 3:43:04 PM 闻乐
最懂Claude内部运作团队采访流出:大模型输出的思考全是拍马屁!曝自家减少幻觉路径;绝非只预测下一个词。网友:这都敢免费公开

最懂Claude内部运作团队采访流出:大模型输出的思考全是拍马屁!曝自家减少幻觉路径;绝非只预测下一个词。网友:这都敢免费公开

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周末,Anthropic 团队放出了一个非常优质的播客。 话题的敏感尺度很大,头排的听众们都替Claude担心了起来,惊呼:这种“核心机密”竟然敢免费公开吗? 甚至有网友表示,第一次从头到尾把60分钟的播客听完了。
8/20/2025 8:34:48 AM 云昭
AI教父辛顿:人类需要AI成为“母亲”,李飞飞:反对!

AI教父辛顿:人类需要AI成为“母亲”,李飞飞:反对!

“AI 会统治人类吗? ”这个问题,早已不是科幻小说的专属。 不如我们回顾下《爱,死亡与机器人》中那个荒诞又深刻的故事——《当酸奶统治世界》。
8/20/2025 7:53:01 AM DataFun
告别人工写脚本!多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

告别人工写脚本!多模态大模型驱动携程UI自动化测试迈入“描述即生成”阶段

作者简介Jessi Peng,携程资深后端开发工程师,关注AI技术在测试领域的应用。 一、引言    在传统的UI自动化测试流程中,测试人员需要构建完整的开发环境,包括Python运行环境、PyCharm集成开发环境、自动化测试框架等工具链的配置与部署。 在用例编写过程中,测试人员必须通过人工方式精确定位目标UI元素,并基于自动化框架封装的底层方法,手工编写测试代码。
8/19/2025 10:47:17 AM Jessi Peng
一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器

一句话,性能暴涨49%!马里兰MIT等力作:Prompt才是大模型终极武器

AI性能的提升,一半靠模型,一半靠提示词。 最近,来自马里兰大学、MIT、斯坦福等机构联手验证,模型升级带来的性能提升仅占50%,而另外一半的提升,在于用户提示词的优化。 他们将其称之为「提示词适应」(prompt adaptation)。
8/18/2025 5:20:17 PM
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

8月5日,在GPT-5发布前两天,OpenAI推出了它的两款开源权重大语言模型:gpt-oss-120b、gpt-oss-20b。 这是自2019年GPT-2,近六年来OpenAI首次发布开放权重的模型。 得益于巧妙的优化技术,这些模型甚至可以在本地设备上运行。
8/18/2025 9:15:00 AM
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。 这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。 一个最基础、却也最关键的问题是:在评判一个模型是否“入戏”之前,AI裁判能准确识别出对话中到底是谁在说话吗?
8/18/2025 9:00:00 AM
谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草

谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草

大块头不等于大智慧。 这在生成式AI领域,已逐渐成为共识。 Gemma 3系列的成功就是一个很好的例证。
8/18/2025 8:57:00 AM
Agent 产品如何定价?我们花的钱,究竟值不值?

Agent 产品如何定价?我们花的钱,究竟值不值?

一方面,我们对Agent的期望是成为一个可靠、高效、且不知疲倦的伙伴;另一方面,现实体验却常常被一些“意外”打断:资源瓶颈的窘境:在执行关键任务的冲刺阶段,系统突然弹出“积分/点数已耗尽”的提示,如同汽车在距离目的地一公里处耗尽燃油,进程戛然而止。 性能波动的无奈:用户时常面临算力“堵车”的困境,Agent的响应速度时快时慢,尤其在服务高峰期,其表现更像一个“兼职员工”,而非全天候的专业助理。 DeepSeek等前沿应用在发布初期因用户激增而导致的服务器高负载现象,便是这一挑战的缩影。
8/14/2025 11:13:59 AM DataFun