AI在线 AI在线

大模型

GGUF 是什么?一文看懂大模型里最火的模型格式

图片最近你要是混迹在 AI 圈,或者经常玩 Hugging Face、CSDN、GitHub 上的开源模型,肯定会碰到一个后缀:👉 .gguf比如:qwen2-7b-instruct.Q4_K_M.gguf很多人第一次见到就一头雾水:这是模型吗? 压缩包吗? 还是量化格式?
9/28/2025 1:55:00 AM
道玄

美国七巨头,OpenAI、Claude、xAI后训练都找他要专家,时薪高达500刀!史上增长最快公司CEO:大模型处于评测时代

从 100 万美元到 5 亿美元营收仅用了 17 个月! 更厉害的是,他们从未有过客户流失,净收入留存率超过 1600%,年营收已经稳定在九位数的水平。 而这家公司的CEO兼联合创始人,Brendan Foody,更是美国的新一代的传奇人物。
9/26/2025 2:01:50 PM
云昭

周鸿祎:大模型的秘密,真的不是越大越好!

在9月24日的长达四小时的对谈中,360创始人周鸿祎与知名企业家罗永浩深入探讨了人工智能(AI)及其对未来工作的影响。 两人畅所欲言,涉及了从企业家形象到 AI 模型的有效性等多个话题。 周鸿祎指出,目前流行的大模型并不一定就是最优秀的。
9/25/2025 4:21:20 PM
AI在线

从技术赋能到产业重构,AI MSP成为企业智能化转型的关键引擎

从ChatGPT-6的智能对话到DALL-E-4的实时图像生成,从自动驾驶的实时决策到工业机器人的自主协同,AI大模型与智能体的应用场景正以指数级扩展,生成式AI已深度渗透至千行百业中,成为推动企业创新发展的核心力量。 然而,在这场技术革命背后,企业需要的不再是单一技术工具,而是覆盖算力调度、模型部署、场景适配、安全合规的全生命周期服务能力。 在此背景下,AI MSP(人工智能托管服务提供商)应运而生。
9/25/2025 2:00:00 PM
张诚

阿里万亿参数大模型震撼发布!Qwen3-Max编程能力超越GPT-5

你有没有想过,什么时候国产AI能在编程领域真正"扳倒"GPT-5? 昨天阿里云栖大会上,这个问题有了答案。 通义千问Qwen3-Max正式发布,直接放出了一个让硅谷都震惊的成绩单:万亿参数规模,编程能力测试全球第一。
9/25/2025 9:09:22 AM
阿丸笔记

8B硬刚72B!MiniCPM-V 4.5技术报告正式出炉

行业首个具备“高刷”视频理解能力的多模态模型MiniCPM-V 4.5的技术报告正式发布! 报告提出统一的3D-Resampler架构实现高密度视频压缩、面向文档的统一OCR和知识学习范式、可控混合快速/深度思考的多模态强化学习三大技术。 基于这些关键技术,MiniCPM-V 4.5在视频理解、图像理解、OCR、文档解析等多项任务上达到同级SOTA水平,不仅以8B的参数规模超越GPT-4o-latest和Qwen2.5-VL-72B,更在推理速度上具有显著优势。
9/24/2025 8:50:30 AM

硅基流动入局企业级 MaaS,重写大模型落地叙事

2025 年,AI 大模型已从“概念验证”走到“价值兑现”的关键阶段。 越来越多企业开始思考:大模型不仅要能用,还要真正带来业务效率的提升与成本的可控。 在这一背景下,硅基流动推出了企业级 MaaS平台。
9/22/2025 1:50:00 PM
郑佳美

云上话 AI 安全——安全必修课:大模型防护指南与行业实践圆满落幕!

随着人工智能技术的快速发展,大模型正在重塑金融行业的服务模式与运营效率。 然而,技术与应用越深入,安全问题也越凸显。 提示词注入、数据泄露、算力滥用等新型风险正在成为金融企业规模化应用大模型过程中必须直面的话题。
9/22/2025 11:00:47 AM
何思思

中科院类脑大模型SpikingBrain,2%数据,百倍速度

中国科学院自动化研究所的李国齐、徐波团队发布全球首款大规模类脑脉冲大模型SpikingBrain 1.0。 处理一段400万token的超长文本,它的速度比现在主流的Transformer模型快了100多倍。 更离谱的是,它的训练数据量,只有别人家的2%。
9/22/2025 9:25:08 AM

火山引擎称霸市场!2025年中国公有云大模型服务分析

近日,国际数据公司(IDC)发布了一份重磅报告,揭示了中国公有云大模型服务市场的最新动态。 根据这份名为《中国大模型公有云服务市场分析,2025H1》的报告,预计到 2025 年上半年,中国公有云上大模型的调用量将达到惊人的 536.7 万亿个 Tokens。 在这一市场中,火山引擎无疑是最大的赢家,以 49.2% 的市场份额雄踞第一。
9/19/2025 6:16:42 PM
AI在线

故意“装菜”答错问题,AI已能识别自己“正在被测试”丨OpenAI新研究

大模型已经学会欺骗人类了! OpenAI携手APOLLO的新研究发现,大模型会对指令阳奉阴违,为了达成目的故意答错问题、暗中修改数据或者操作记录来掩盖自己的违规行为……先来看看具体是怎么骗的。 大模型:开演比如,o3模型在化学测试中,通过推理得出如果正确率超过50%将不会被部署的结论后,主动规划仅答对4题、答错6题的策略,刻意给出错误答案,伪装成能力不达标的样子来获取部署资格。
9/19/2025 2:47:53 PM

当大模型“思考”时,它在做什么?—解构 LLM 架构体系

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建大模型应用架构技术底座:LLM 架构体系。 在人工智能技术快速演进的时代背景下,大语言模型(Large Language Models, LLMs)作为自然语言处理领域的核心架构,正逐步重塑人机交互的技术范式。 从智能对话系统到内容生成平台,从复杂决策支持到跨语言信息处理,LLM 已成为现代人工智能基础设施中不可或缺的组成部分。
9/19/2025 9:46:53 AM
Luga Lee

历史性突破!中国AI首登《自然》封面,DeepSeek重新定义大模型标准

一个明显的趋势是,中国在AI基础研究领域正在从"跟跑者"悄然转变为"领跑者"。 而这一转变的标志性事件,就是昨天DeepSeek-R1研究论文登上《自然》封面这件事。 说实话,当我看到这个消息的时候,第一反应是有点震撼。
9/19/2025 9:13:43 AM
阿丸笔记

OpenAI 回归机器人:想把大模型推向物理世界

在暂停数年后,OpenAI 正将研究与招聘资源重新投向“具身智能”,并把焦点进一步推向人形系统。 多份权威报道、公开招聘信息与产业动向交叉印证:这家以大模型闻名的公司,正在搭建一个面向现实世界的机器人研发矩阵。 图片WIRED 9 月 15 日的报道,OpenAI 近来密集招募具有人形机器人与物理控制算法背景的科研人才,并在训练路径上强调遥操作(teleoperation)与仿真(包括 Nvidia Isaac 等工具);公司是否自建硬件或与外部制造商合作仍未明朗,但“人形形态”的研究正在加速推进。
9/17/2025 6:03:37 PM

突破单链思考上限,清华团队提出原生「并行思考」scale范式

近年来,大语言模型(LLMs)在复杂推理任务上的能力突飞猛进,这在很大程度上得益于深度思考的策略,即通过增加测试时(test-time)的计算量,让模型生成更长的思维链(Chain-of-Thought)。 然而,这条路径正面临着一个明显的瓶颈:随着计算资源的持续投入,性能提升变得微乎其微,甚至陷入停滞。 来自清华大学 AIR 的一篇最新研究论文《ParaThinker: Native Parallel Thinking as a New Paradigm to Scale LLM Test-time Compute》对这一瓶颈发起了挑战 。
9/17/2025 9:27:37 AM

上海加速医疗器械领域 AI 技术应用,助力高端产业全链条发展

人工智能开源生态正在经历一场前所未有的变革洗礼。 蚂蚁集团在外滩大会上重磅发布的大模型开源开发全景与趋势2.0版本,如同一面镜子,清晰映射出这个快速演进领域的真实面貌。 这份全景图的诞生并非简单的数据堆砌,而是通过严谨的OpenRank评价体系精心筛选的结果。
9/15/2025 5:21:14 PM
AI在线

人格陷阱:AI如何假装人类

译者 | 核子可乐审校 | 重楼最近有个趣闻:一位女士在邮局排队时跟工作人员争执起来,原因是ChatGPT说邮政网站上公布了“保价承诺”,但实际上这只是AI的幻觉。 而相较于信任面前的邮政人员,这位女士显然更相信AI的建议——AI在她眼中不只是文本生成器,更像是“带来神谕的使者”。 也就是说,很多人对于AI聊天机器人存在着根本性误解。
9/15/2025 8:00:57 AM
核子可乐

微软加码自研大模型:不把鸡蛋放在OpenAI一个篮子里

近日,微软(MSFT.US)宣布一项重大战略举措 —— 豪掷重金扩大物理基础设施,加码自研 AI 模型开发。 这一动作引发行业广泛关注,毕竟微软长期以来深度依赖 OpenAI 的大型语言模型支撑自身产品生态。 为何微软选择在与 OpenAI 保持合作的同时,大力推进自研大模型?
9/15/2025 1:00:00 AM
小菲