模型
Attention Sink产生的起点?清华&美团首次揭秘MoE LLM中的超级专家机制
稀疏激活的混合专家模型(MoE)通过动态路由和稀疏激活机制,极大提升了大语言模型(LLM)的学习能力,展现出显著的潜力。 基于这一架构,涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。 然而,随着模型参数的迅速膨胀,如何高效部署和推理成了新的挑战。
8/12/2025 8:55:00 AM
机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
8 月 11 日,在世界机器人大会上,阿里达摩院宣布开源自研的 VLA 模型 RynnVLA-001-7B、世界理解模型 RynnEC、以及机器人上下文协议 RynnRCP ,推动数据、模型和机器人的兼容适配,打通具身智能开发全流程。 开源链接:机器人上下文协议 RynnRCP - 语言 - 动作模型 RynnVLA-001 RynnEC ,但仍面临开发流程碎片化,数据、模型与机器人本体适配难等重大挑战。 达摩院将 MCP(Model Context Protocol)理念引入具身智能,首次提出并开源了 RCP(Robotics Context Protocol)协议以推动不同的数据、模型与本体之间的对接适配。
8/11/2025 6:09:37 PM
让OpenAI只领先5天,百川发布推理新模型,掀翻医疗垂域开源天花板
刚刚,全球最强开源医疗模型发布,来自中国。 百川开源最新医疗推理大模型Baichuan-M2-32B,在OpenAI发布的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。 不仅以小博大,而且领先除GPT5以外所有的开源闭源前沿模型。
8/11/2025 6:01:12 PM
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
OpenAI在最新的开源模型gpt-oss上采用的MXFP4数据类型,直接让推理成本暴降75%! 更惊人的是,MXFP4在把内存占用降为同规模BF16模型的四分之一的同时,还把生成token的速度提升了整整4倍。 换句话说,这一操作直接把1200亿参数的大模型塞进80GB显存的显卡,哪怕是只有16GB显存的显卡也能跑200亿参数的版本。
8/11/2025 6:00:38 PM
智谱终于发布GLM-4.5技术报告,从预训练到后训练,细节大公开
就在上个月底,智谱放出重磅炸弹 —— 开源新一代旗舰模型 GLM-4.5 以及轻量版 GLM-4.5-Air。 其不仅首次突破性地在单个模型中实现了推理、编码和智能体能力的原生融合,还在 12 项全球公认的硬核测试中取得了全球第三的综合成绩。 这个成绩在所有国产模型和开源模型中均排名第一!
8/11/2025 5:58:44 PM
AI IDE用不起了!神人开发者分享顶级白嫖攻略,免费AI榨出付费级生产力,立省200刀月费!网友:掌管免费模型的神!
编辑 | 伊风当你还在给 Claude Code 充着 200 美元月费时,有位开发者已经靠着极限白嫖,提前解锁了「永久免费编程」。 更狂的是,他还直言——你很可能花了冤枉钱,效果还不如他用零成本模型写出来的代码。 这份神级薅羊毛攻略一经发布,就被网友奉为 AI 免费模型界的终极 BOSS。
8/11/2025 1:00:33 PM
伊风
AI正在掏空大脑,思想沦为残废!未来只分AI的「主人」和「奴隶」
全世界都为AI疯狂。 短短两年内,近10亿人开始用OpenAI的产品。 这正是硅谷的经典套路:把产品做得足够出色,把价格降得足够低廉,让我们彻底上瘾,然后再琢磨如何赚取数十亿美元。
8/11/2025 9:25:00 AM
OpenAI惊人自曝:GPT-5真「降智」了!但重现「神之一手」,剑指代码王座
GPT-5发布72小时后,一张IQ测试结果震惊了全网。 在门萨IQ测试中,GPT-5拿下了118分,离线测试70分;GPT-5 Thinking则分别获得了85分和57分。 这一结果,创OpenAI模型家族IQ测试有史以来的最低纪录。
8/11/2025 9:22:00 AM
刚刚,谷歌摊牌:Genie 3让你1秒「进入」名画,人人可造交互世界!
谷歌摊牌了,彻底不装了! 他们前几天刚刚发布的Genie 3世界模型,正在疯狂展示AI的超能力。 它不只是能从文本中生成交互式的AI空间世界,还能操控图像和视频。
8/11/2025 9:21:00 AM
突破40年Dijkstra算法瓶颈,清华教授等颠覆教科书!斩获STOC最佳论文
计算机科学的重大成果! 清华大学教授刷新最短路径算法认知,或将改写计算机算法教科书。 在计算机科学中,一个经典问题是寻找网络中每个点的最短路径,而Dijkstra算法是此问题的最经典解决方法。
8/11/2025 9:18:00 AM
内幕曝光:OpenAI模型坦承不会第六题,三人俩月拿下IMO金牌!
OpenAI的ChatGPT真能拿到国际奥数IMO金牌? 还是OpenAI的自嗨? 背后到底有何隐情?
8/11/2025 8:57:00 AM
奥特曼曝惊世预言:2035年GPT-8治愈癌症!人类将为算力爆发三战
GPT-5发布后,毫无意外又在全网掀起轩然大波。 「还我GPT-4o」的呼声,如海啸一般在全网掀起! 甚至连Karpathy都同意,GPT-5确实有些令人失望了终于,在铺天盖地的骂声中,奥特曼火速承认错误,表示会立刻让GPT-4o回归!
8/11/2025 8:57:00 AM
AI「解码」古罗马,重现千年铭文真相!DeepMind新模型再登Nature
Aeneas原本是古希腊神话中流浪英雄。 出现在7月24日Nature主刊的Aeneas则是一个多模态生成式神经网络,它能帮助历史学家更好地解读、归属和修复残缺文本。 想象考古学家在欧洲发现了一块刻有古代文字的铭文,文本残缺不全、部分文字被风化或被故意破坏。
8/11/2025 8:54:00 AM
本科必学Dijkstra算法被超越!清华段然团队打破图灵奖得主证明的普遍最优性
本科经典算法Dijkstra,被清华团队超越了! 这个被用来解决最短路径问题的经典算法,去年才被图灵奖得主Tarjan团队证明具有普遍最优性。 但现在,来自清华的段然团队将这一格局彻底打破——运行速度比任何Dijkstra及其改进算法都快,关键是它彻底解决了困扰研究人员四十多年来的“排序障碍”。
8/11/2025 8:49:00 AM
史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”
有史规模最大的开源科学推理后训练数据集来了! 上海创智学院、上海交通大学(GAIR Lab)发布MegaScience。 该数据集包含约125万条问答对及其参考答案,广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域,旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。
8/11/2025 8:46:00 AM
实测谷歌AI故事书,我实现漫画和绘本自由了
谷歌Gemini又双叒叕出新工具了,只需要30s左右,就能让AI帮你生成一篇10页的故事书,还是免费的。 并且支持中文,生成的内容也相当有趣。 这一次带来的是能够一键生成故事书的StoryBook:只需描述你想要的故事,如果喜欢的话还可以添加文件和图片,Gemni将会创造一本独特的10页故事书。
8/11/2025 8:45:00 AM
代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI
最强开源深度研究模型来了。 MiroMind ODR(Open Deep Research),来自代季峰加盟陈天桥的技术首秀。 首先,它做到了性能最强,GAIA测试结果更是达到了82.4分,超过了一众开源闭源模型,其中包括Manus、OpenAI的DeepResearch。
8/11/2025 8:43:00 AM
3B模型性能小钢炮,“AI下半场应该训练+验证两条腿跑步”丨上海AI Lab&澳门大学
当大模型把人类曾经的终极考题变成日常练习,AI的奔跑却悄悄瘸了腿——训练能力突飞猛进,验证答案的本事却成了拖后腿的短板。 为此,上海AI Lab和澳门大学联合发布通用答案验证模型CompassVerifier与评测集VerifierBench。 填补了Verifier领域没有建立验证-提升-验证的循环迭代体系的空白。
8/11/2025 8:35:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉