模型
GPT-5真身曝光,首测编程惊艳全网!一句话秒生游戏,OpenAI双雄备战AGI
GPT-5的发布前兆,愈发强烈了。 今早,一款神秘模型Horizon Alpha突然上线OpenRouter,各种榜单和测试席卷了全网。 Horizon Alpha模型的上下文为256K,响应极速,非常擅长创意写作。
8/1/2025 2:40:45 PM
VLM与扩散模型深度整合,图像理解生成编辑三合一模型登场,权重数据训练流程全开源
VLM和扩散模型被整合到一起了。 ModelScope(魔搭)团队发布Nexus-Gen V2,一个同时支持图像理解、生成和编辑的统一模型,而且模型权重、训练流程和数据集全部开源。 这事儿有多重要?
8/1/2025 2:32:01 PM
吴恩达:中国将产生真正强大的AI公司,AGI更像营销而不是技术里程碑
刚刚吴恩达老师发了一篇推文,吴老师表达了对中国人工智能发展高度认可,并且认为虽然目前美国暂时领先,但中国的AI发展具有强大的可以超越美国的路径 ,吴老师还认为AGI更像是营销而不是技术突破,AGI没有终点线,中国半导体布局和开源人工智能最终将协同发展,再加上激烈的竞争环境,会产生真正强大的AI公司以下是吴老师推文原文转译:如今,中国已经有了一条在人工智能领域超越美国的路径。 尽管美国目前仍然领先,但中国在开放模型生态系统方面充满活力,并且在半导体设计和制造领域积极布局,已经展现出强大的发展势头。 初创企业的经验告诉我们,势头至关重要:即使现在公司规模较小,只要保持高速增长,几年后就可能变成无法阻挡的力量。
8/1/2025 9:30:00 AM
神经驱动的图像编辑:结合脑机接口与扩散模型的创新方法
传统的图像编辑需要用户具备专业的技术知识和大量的手动操作能力。 近年来,虽然生成模型的发展使得基于指令的图像编辑变得更加高效,但这些方法仍然依赖于用户输入大量的文本提示、视觉参考或物理操作,在很大程度上限制了图像编辑的效率和可访问性。 为了突破这一瓶颈,研究人员开始探索利用脑机接口(BCI)技术来实现图像编辑。
8/1/2025 9:25:00 AM
阿里通义千问发布 Qwen3-Coder-Flash 模型,AI 智能体编程 / 操控浏览器等领域媲美 GPT-4.1 等领先闭源模型
AI在线 8 月 1 日消息,阿里通义千问 Qwen 昨日(7 月 31 日)发布公告,宣布推出 Qwen3-Coder-Flash(全称 Qwen3-Coder-30B-A3B-Instruct)模型,在保持出色的性能和效率基础上,改进智能体编码、智能体浏览器使用及其他基础编码任务性能。 官方介绍称该模型具备卓越的智能体能力,在智能体编程 (Agentic Coding)、浏览器使用 (AgenticBrowser-Use)、工具调用 (Tool Use) 等领域,超越当前顶级开源模型,仅略逊于顶配版 Qwen3-Coder-480B-A35B-Instruct, 及 ClaudeSonnet-4、GPT4.1 等领先闭源模型。 AI在线援引官方概述,该模型是因果语言模型,总参数量为 30.5B,激活参数为 3.3B,共有 48 层,专家数为 128 个,激活专家数为 8 个,上下文长度原生支持 262144 个 tokens,使用 Yarn 可扩展到 100 万个 tokens。
8/1/2025 6:55:19 AM
故渊
深度解析AI Agent:从概念、原理到构建模式,一文彻底搞懂!
随着大模型技术的飞速发展,一个重要的概念——Agent(也叫AI Agent)——应运而生,并迅速成为行业热点。 尽管这个词汇现在被频繁提及,但它究竟是什么? 它是如何运作的?
8/1/2025 2:43:00 AM
李木子
把指纹焊死在频率上:抗微调神经网络指纹的硬核方案来了
论文第一作者唐灵,张拳石老师课题组的博二学生。 今天要聊的是个硬核技术 —— 如何给神经网络刻上抹不掉的 "身份证"。 现在大模型抄袭纠纷不断,这事儿特别应景。
7/31/2025 9:42:57 AM
无需准确传感信号!轻松搞定「多段软体机械臂」复杂位姿与形状控制
软体机械臂由于其运动的非线性、时滞性与迟滞性而难以控制,而在多段软体机械臂(MSCA)内,其各段间的驱动、传感和运动的耦合更增加了控制难度。 但同时,由于MSCA的各段可以相对独立地驱动,这类机械臂可以实现末端位姿控制、形状控制、控制过程中自动避障、实时交互等复杂控制任务。 意大利比萨圣安娜高等学院和洛桑联邦理工学院的研究人员提出了一种利用双向循环神经网络(biLSTM)对于MSCA构型的规划与控制的策略,该方法即使运用不准确的内部传感信号也能实现上述复杂任务。
7/31/2025 9:08:00 AM
炮轰黄仁勋,决裂奥特曼!1700亿美元估值背后,硅谷最不好惹的AI狂人
Dario Amodei这位AI圈最敢说的大佬,因为家庭变故,找到了人生方向。 作为Anthropic的CEO,他在2025年简直是「火力全开」,与行业对手、政府官员以及公众关于AI的看法展开了激烈交锋。 他预测AI可能很快会淘汰50%的入门级白领工作,还在《纽约时报》上抨击了为期十年的AI监管禁令。
7/31/2025 9:07:00 AM
阿里刚刚开源Qwen3新思考模型:Agent能力超强,支持100万上下文
今天凌晨,阿里巴巴开源了Qwen3家族最新模型Qwen3-30B-A3B-Thinking-2507。 2507与之前阿里开源的Qwen3-30B-A3B-Thinking和Qwen3-235B-A22B-Thinking相比,在Agent智能体、AIME25数学、LiveCodeBench编程、GPQA解决复杂能力等方面,性能全部实现大幅度提升。 同时,2507也超过了谷歌的最新小参数模型Gemini-2.5-Flash-Thinking。
7/31/2025 9:06:00 AM
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
听说了吗,GPT-5这两天那叫一个疯狂造势,奥特曼怕不是真有些急了(doge)。 但有一说一,回顾上半年最火AI事件,GPT-4o带来的“吉卜力”风暴,还是热度TOP。 △数据来自微信指数不仅由“万物皆可吉卜力”为始,GPT-4o生图功能被网友们疯玩至今,更重要的是,还引发了更深的技术思考:AIGC的范式,已经被悄然改变。
7/31/2025 8:45:00 AM
现代LLM架构设计一览:从DeepSeek-V3到Kimi K2
主要内容现代LLM架构的演进主要围绕以下几个核心目标:提高推理效率:通过GQA、MLA、滑动窗口注意力、MoE等技术减少内存占用和计算量。 增强训练稳定性:通过归一化层(如RMSNorm)的放置和QK-Norm等技术优化训练过程。 优化模型容量与性能:通过MoE实现更大参数量和知识吸收能力,同时保持推理效率。
7/31/2025 1:00:00 AM
常华Andy
全球首次,「AI记忆」开源落地!MIRIX同步上线APP
还记得第一次用 GPT 写邮件的惊喜吗? 却也一定遇到过今天的 AI「忘性」——聊得再深入,窗口一关,历史烟消云散。 因此,研究人员认为:从「对话」到「记忆」,将是AI进化的必经之路。
7/30/2025 9:15:00 AM
科学能力太强,这个多模态推理「六边形战士」被严重低估!Intern-S1开源登顶
在人声鼎沸的WAIC 2025上,一款堪称「全能高手 科学明星」合体的大模型,由于在科学方面太优秀,反倒显得低调——但它的能力却无法被忽视。 它能精准解析分子结构、看懂地震波图、推演化学反应路径……7月26日,上海人工智能实验室(上海AI实验室)发布并开源「书生」科学多模态大模型Intern-S1。 它不仅多模态能力全球开源第一,文本能力比肩国内外一流模型,科学能力全模态达到国际领先。
7/30/2025 9:05:00 AM
狂拿大模型明星订单,一家清华系HPC-AI Infra公司浮出水面
不靠囤算力,拿下数家大模型明星公司订单。 93年创始人掌舵的清华系计算创业公司,有点出其不意。 2023上半年,百模大战开启,模型预训练需求空前爆发,在算力焦虑下,囤积算力成为一种趋同性动作,更充裕的算力几乎就等于金额更高的订单。
7/30/2025 8:47:00 AM
自回归模型杀回图像生成!实现像素级精准控制,比Diffusion更高效可控
当下的AI图像生成领域,Diffusion模型无疑是绝对的王者,但在精准控制上却常常“心有余而力不足”。 在精确视觉控制、平衡多模态输入以及高昂的训练成本方面仍面临挑战。 有没有一种更高效、控制更精准的范式?
7/30/2025 1:00:00 AM
抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025
在人工智能模型规模持续扩大的今天,数据集蒸馏(Dataset Distillation,DD)方法能够通过使用更少的数据,达到接近完整数据的训练效果,提升模型训练效率,降低训练成本。 但是,通过数据集蒸馏训练的模型,要在安全性要求比较高的任务中(如医疗诊断、自动驾驶),实现不受干扰并保持性能效果,还有一定难度。 来自北京航空航天大学、上海人工智能实验室和英国利物浦大学的研究团队,提出了名为ROME的新方法,这是首次将信息瓶颈理论引入数据集蒸馏任务。
7/29/2025 9:10:00 AM
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用