AI
全新MoE架构!阿里开源Qwen3-Next,训练成本直降九成
大语言模型(LLM),正在进入 Next Level。 周五凌晨,阿里通义团队正式发布、开源了下一代基础模型架构 Qwen3-Next。 总参数 80B 的模型仅激活 3B ,性能就可媲美千问 3 旗舰版 235B 模型,也超越了 Gemini-2.5-Flash-Thinking,实现了模型计算效率的重大突破。
9/12/2025 10:02:21 AM
文心X1.1事实性暴涨35%25!国产AI首次正面硬刚GPT-5
有朋友问我,最近AI圈有没有什么重磅消息。 我想了想,可能是百度刚发布的文心X1.1,这个模型有点不一样。 说实话,国产AI模型这几年虽然发展很快,但在核心能力上要说能正面挑战GPT这样的国际顶级模型,我一直持保留态度。
9/12/2025 9:21:58 AM
阿丸笔记
超越90%城市规划师!清华、MIT等提出人机协作新范式 | Nature子刊
面对日益复杂的城市系统和多元化的社会需求,传统城市规划方法正遭遇瓶颈。 如今,人工智能(AI)正为这个古老而重要的领域带来颠覆性的革新。 近日,由清华大学电子工程系城市科学与计算研究中心、建筑学院与麻省理工学院(MIT)感知城市实验室、美国东北大学等顶尖机构的学者组成的跨学科团队,在国际前沿期刊《自然·计算科学》上发表观点文章,首次系统性地提出了一个由大语言模型(LLM)驱动的智能城市规划框架。
9/12/2025 9:12:00 AM
ChatGPT支持MCP了!一句Prompt即可全自动化
ChatGPT终于加上了众望所归的MCP支持! 今天,OpenAI正式官宣ChatGPT的MCP功能上线。 目前仅Plus和Pro用户可用。
9/12/2025 9:12:00 AM
攻克AI过度思考难题!美团新研究让通过“可验证”过程奖励激活LRM的高效推理
LRM通过简单却有效的RLVR范式,培养了强大的CoT推理能力,但伴随而来的冗长的输出内容,不仅显著增加推理开销,还会影响服务的吞吐量,这种消磨用户耐心的现象被称为“过度思考”问题。 针对这一缺陷,来自美团等机构的研究团队提出可验证的过程奖励机制(VSRM),鼓励CoT中的“有效步骤”,惩戒“无效步骤”,最大限度保持性能的同时,实现高效推理。 通过在数学任务上的实验显示,在多个常用benchmark上,VSRM加持的后训练使得不同尺度的模型实现了输出长度的大幅缩减,甚至在部分情况下提升了模型表现。
9/12/2025 9:05:00 AM
国产类脑大模型适配国产沐曦GPU!长序列推理提速超百倍,仅用2%数据匹敌主流模型
超长序列推理时的巨大开销如何降低? 中国科学院自动化所李国齐、徐波团队发布的类脑脉冲大模型SpikingBrain (瞬悉)-1.0提出了新思路。 SpikingBrain借鉴大脑信息处理机制,具有线性/近线性复杂度,在超长序列上具有显著速度优势。
9/12/2025 9:03:00 AM
交互扩展时代来临:创智复旦字节重磅发布AgentGym-RL,昇腾加持,开创智能体训练新范式
强化学习之父、2024 年 ACM 图灵奖得主 Richard Sutton 曾指出,人工智能正在迈入「经验时代」—— 在这个时代,真正的智能不再仅仅依赖大量标注数据的监督学习,而是来源于在真实环境中主动探索、不断积累经验的能力。 正如人类通过实践理解世界、优化行为一样,智能体也必须在交互中积累经验、改进策略,才能掌握长期决策的能力。 无独有偶,特斯拉前 AI 负责人,OpenAI 联合创始人 Andrej Karpathy 进一步指出,环境的多样性与真实性,是智能体获得泛化能力、应对复杂任务的关键前提。
9/11/2025 1:46:59 PM
成立7个月首发声!百亿美金独角兽万字雄文:攻克LLM推理非确定性难题
Thinking Machines Lab终于放大招了! 刚刚,联合创始人、OpenAI前副总裁Lilian Weng透露:Thinking Machines的第一代旗舰产品名为「Connection Machine」(联结机)。 事情是这样的:今天,Thinking Machines开辟了研究博客专栏「Connectionism」(联结主义),发表了第一篇博客文章「Defeating Nondeterminism in LLM Inference」(击败LLM推理中的非确定性)。
9/11/2025 1:31:41 PM
新智元
王坚最新演讲曝光:开源正在进入资源时代,AI不能缺席太空,曝近期进展:三体计算星座分享太空!几年后太阳卫星;AI闭源是历史性错误
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)“只有把AI和算力送入太空,人类才有可能真正的走出地球! ”“开源已经进入了开放资源时代! ”“OpenAI闭源并不是一个策略性的错误,而是一个历史的选择。
9/11/2025 12:23:22 PM
云昭
美国参议员提出“SANDBOX 法案” 允许AI公司设定长达10年自我监管规则
近日,美国参议员特德・克鲁兹(Ted Cruz)提出了一项名为 “SANDBOX 法案” 的新立法。 这项法案旨在为人工智能(AI)公司提供一个 “监管沙箱”,让它们在较少的联邦监管下进行实验。 图源备注:图片由AI生成,图片授权服务商Midjourney根据该法案,AI 公司可以申请修改或豁免任何 “阻碍性规定”,以便更方便地测试和部署包含或使用至少一个 AI 系统的产品或服务。
9/11/2025 11:01:32 AM
AI在线
世界首富换人!81岁硅谷狂人4000亿身价碾压马斯克,33岁华裔才女逆袭
世界首富,一夜易主! 昨晚,甲骨文创始人Larry Ellison净资产暴增超1000亿,创有史以来单日最大财富增长纪录。 如今,他的身价高达3930亿美元,超越马斯克(3850亿美元),登顶全球首富。
9/11/2025 10:05:06 AM
李飞飞一年前究竟说了啥?怎么又火了
大语言模型的局限在哪里? AI教母李飞飞这样说:大自然中是没有语言存在的,你不会从天空中直接看到文字。 语言是一种纯粹的生成的信号。
9/11/2025 10:02:33 AM
微软与 OpenAI 战略转变,探索新合作伙伴关系
近期,微软与 OpenAI 的合作关系似乎正在发生变化,两者都在寻求更多的独立性。 根据《华尔街日报》的报道,OpenAI 已与甲骨文签署了一项计算资源的协议,交易额可能高达3000亿美元。 这一协议与 OpenAI 在七月份宣布的4.5吉瓦 Stargate 数据中心容量开发协议并无直接关系。
9/11/2025 9:56:30 AM
AI在线
AI代理8小时赚4500美元-程序员真的要失业了
一个明显的趋势是,AI正在从简单的代码补全工具,悄然进化成能够独立完成整个开发项目的"超级程序员"。 当我看到一个AI代理在8小时内完成Shopify扩展开发,并为客户节省了4500美元成本的消息时,说实话,第一反应是——这怎么可能? 但这确实发生了。
9/11/2025 9:19:46 AM
阿丸笔记
重磅!Thinking Machines开山之作:大模型输出随机的根本原因被揪出,并开源终结方案
要理解AI,先要理解它何以不确定,由OpenAI前CTO Mira Murati创办的Thinking Machines 开山之作来了,刚刚,Thinking Machines Lab 宣布正式上线技术研究博客:连接主义。 开篇就是万字技术雄文《击败LLM推理中的非确定性(Defeating Nondeterminism in LLM Inference)》。 为什么叫“连接主义”?
9/11/2025 9:04:00 AM
用 MarkItDown-MCP 让你的 AI 编程助手“通吃”各种文件!
大家好! 今天要跟大家聊一个超级实用的工具——MarkItDown-MCP! 如果你平时用 AI 编程助手(比如 Claude、Cursor 之类)写代码、查文档、处理数据,是不是经常遇到这样的烦恼:有些文件格式 AI 读不了,或者读起来效果不佳?
9/11/2025 4:00:00 AM
道玄
数据集质量正成为AI大模型的终极壁垒
"老板,我们的模型效果怎么还是这么差? "小李拿着测试报告,一脸无奈地走进了技术总监的办公室。 "数据质量怎么样?
9/11/2025 2:00:00 AM
大数据AI智能圈
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
芯片
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
具身智能
生成
百度
Sora
工具
GPU
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
架构
DeepMind
亚马逊
编程
特斯拉
视觉
Transformer
AI模型
预测
MCP