AI在线 AI在线

资讯列表

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。 当然,细节上仍有不少演进。
8/7/2025 9:40:00 PM
机器之心

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。 当然,细节上仍有不少演进。
8/7/2025 9:40:00 PM
机器之心

让AI读懂「言外之意」:AI4SG团队发布首个心理健康污名语料库,破解隐性偏见识别难题

论文第一作者 Han Meng 是新加坡国立大学博士生,从事心理学构建的计算方法研究。 通讯作者 Yi-Chieh Lee 是新加坡国立大学助理教授,在对话式人工智能、人机交互和心理健康技术领域开展研究工作。 共同作者 Renwen Zhang 是南洋理工大学助理教授,专注于计算传播学研究,为本研究提供了传播学视角。
8/7/2025 9:27:00 PM
机器之心

宝马大牛跳槽小米,前电车设计负责人,将向原下属汇报

小米又从宝马招来一员大将。 宝马电车设计负责人凯兰格(Kai Langer)近日官宣,自己已加盟小米汽车。 这是半年时间里,小米从宝马招募的第六员大将,凯兰格和此前的老同事们一样,在官宣消息中对小米一顿猛夸,称其是具有颠覆性的科技巨头。
8/7/2025 8:07:39 PM
一凡

全球最大AI模型聚合平台诞生!不争冠军只做擂台

2023年,当整个AI行业都在为“最强大模型”争得头破血流时,亚马逊云科技却洞察到一个关键事实:. AI的价值不在于谁的模型最强大,而在于能否为不同场景选择最适合的模型。 在2023年亚马逊云科技(AWS)正式提出“Choice Matters”(选择大于一切)战略,认为AI的未来不是某个单一模型的胜利,而是多个模型根据各自优势协同工作。
8/7/2025 5:53:15 PM
梦晨

AI生死局仅存6位玩家!Claude之父:大模型天生就有“搞钱”冲动!做了CC才能懂模型如何进化!即使AI停滞,产品还要再做十年

出品 | 51CTO技术栈(微信号:blog51cto)说起来,今天已经立秋了,但 AI 圈的这个“盛夏”显然还没结束。 这几天,几大巨头接连出招,行业硝烟味渐浓。 明天大概率还有GPT-5要出来炸场。
8/7/2025 5:01:36 PM
伊风

沃尔沃也卖不动了:销量连续5个月下滑,全球裁员7%没止住亏损

曾经躺赚到手软的豪华品牌,如今也得勒紧裤腰过日子。 沃尔沃公布最新一个月的销售数据,依然没能挽回今年以来的颓势。 销量一跌再跌,7月全球交付4.93万辆,同比减少14%,已经连续5个月下滑,跌到今年冰点。
8/7/2025 4:44:20 PM
杰西卡

Grok 辣味模式失控!输入“庆祝”输出“脱衣”

马斯克旗下AI工具Grok又因为负面新闻上热搜了。 这一次,它在毫无明确指令的情况下,自动生成了歌手泰勒·斯威夫特的裸照。 事件发生在Grok最新的功能“Grok Imagine”刚刚上线之后。
8/7/2025 4:27:28 PM

24 帧·720p·无限交互!谷歌 Genie 3 开启“造梦引擎 2.0”

昨天,Google Deepmind推出新一代AI系统Genie 3,能够根据简单文本生成实时互动的3D虚拟世界。 这一模型不仅能构建世界,还能让用户以每秒24帧、720p分辨率的画质在其中自由探索。 与传统视频生成不同,Genie 3采用自回归方式逐帧生成画面,每一帧都会参考多达一分钟内的环境细节。
8/7/2025 4:25:28 PM

刚刚,小红书开源了多模态大模型dots.vlm1,性能直追SOTA!

最近的AI圈只能说是神仙打架,太卷了。 OpenAI终于发了开源模型,Claude从Opus 4升级到4.1,谷歌推出生成游戏世界的Genie 3引发社区热议。 国产模型这边,就在前几天,HuggingFace上排在最前面的10个开源模型还都来自国内。
8/7/2025 4:24:19 PM
新智元

刚刚,GPT-5内测抢先泄露!推理强到离谱,智商被曝140超越人类天才

就在明天,GPT-5总算要靴子落地了。 周五凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano将同时推出。 全网用户都可以立即通过API和ChatGPT访问这三个模型。
8/7/2025 4:21:27 PM

一夜颠覆Sora神话,H200单卡5秒出片!全华人团队开源AI引爆视频圈

单块H200,5秒即生一个5秒视频。 最近,UCSD、UC伯克利、MBZUAI三大机构联手,祭出FastWan系视频生成模型。 论文地址:「稀疏蒸馏」全新的训练方案,实现了高效生成,让视频去噪速度实现70倍飙升。
8/7/2025 4:18:35 PM

谷歌开源DeepPolisher,基因组组装错误率减半,Jeff Dean:令人振奋!

编辑丨coisini精确的基因组组装(Genome assembly)是生物学研究的基石,但即便是最高质量的组装仍会残留构建技术导致的错误。 人类基因组包含 30 亿个核苷酸,即使微小的错误率也会导致错误总量惊人,进而削弱基因组数据的应用价值。 碱基层面的错误通常需要通过额外的抛光(polishing)步骤来修正 —— 该步骤利用与初版组装比对后的测序读段来识别必要的编辑。
8/7/2025 3:17:00 PM
ScienceAI

OpenAI重磅发布gpt-oss系列开源大模型:媲美 GPT-4o

不论你是独立开发者、企业还是研究机构,现在都可以免费拥有一款与 GPT-4o 接近实力的语言模型。 开源但不“阉割”:媲美 GPT-4o,运行成本极低OpenAI 在这次发布中非常有诚意:gpt-oss-120b:在核心推理任务上已接近 GPT-4o-mini,支持 128k 上下文,单卡 80GB GPU 可跑。 gpt-oss-20b:性能对标 GPT-3.5(o3-mini),仅需 16GB 显存,可部署于消费级设备、本地推理、离线使用等场景。
8/7/2025 2:05:40 PM
AI大模型应用开发

GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强

疑似GPT-5发布的预告才刚刚发出,内测体验已抢先释出。 推理能力首次超越人类,碾压所有大模型。 这来自一位网友的实测结果,他让所有模型开启推理模式做了10道题,只有GPT-5只错了一题,比人类的正确率还高。
8/7/2025 1:57:38 PM

奥特曼出新招防挖角!员工期权变钞票,按5000亿美元估值兑现

被挖怕了! 保密员工名字还不够,奥特曼为“防挖”又出新招——. 开启新一期员工期权兑现计划,按照5000亿美元的估值来兑现。
8/7/2025 12:52:48 PM
闻乐

您猜怎么着?Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了

明天,Grok 对阵 OpenAI 的 o3。 谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛! 在昨天的比赛中,Gemini 2.5 Pro、o4-mini、Grok 4 和 o3 均以 4-0 的战绩分别击败 Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash 和 Kimi k2,晋级半决赛。
8/7/2025 11:11:00 AM
机器之心

人大高瓴-华为诺亚:大语言模型智能体记忆机制的系列研究

本系列工作第一作者张泽宇,中国人民大学博士生,研究方向为大语言模型智能体的记忆机制和个性化;谭浩然,中国人民大学硕士生,研究方向为大语言模型智能体。 陈旭,中国人民大学预聘副教授,研究方向包括大语言模型,信息检索等。 近期,基于大语言模型的智能体(LLM-based agent)在学术界和工业界中引起了广泛关注。
8/7/2025 11:06:00 AM
机器之心