资讯列表
DeepSeek V3.1正式发布:长文档分析、代码理解能力大幅增强,R2仍需等待
8月19日晚间,DeepSeek 官方宣布线上模型版本已升级至 V3.1,最显著的改进是上下文长度拓展至 128K,相当于可处理 10万至13万汉字 的超长文本,适用于长文档分析、代码库理解及多轮对话场景。 用户现可通过官网、App 或微信小程序体验新版本,API 接口调用方式保持不变,开发者无需额外调整即可无缝切换。 此次升级并非大版本迭代,而是对 V3模型的优化。
8/19/2025 10:56:40 PM
AI在线
上海发布"AI+制造"实施方案,要求AI模型掌握物理规律和工业流程推理能力
上海市经济和信息化委员会联合相关部门正式发布《上海市加快推动"AI 制造"发展的实施方案》,该方案对人工智能在制造业的深度应用提出了具体的技术路径和发展目标。 根据实施方案,上海将重点推动基础模型在多个维度的技术突破。 在多模态算法创新方面,方案要求AI模型需要深度理解流体力学、电磁学、真空物理等基础物理规律,通过增强物理仿真能力来提升工业应用的准确性和可靠性。
8/19/2025 5:56:11 PM
AI在线
Firefox142上线:低调更新背后,本地AI扩展已悄然启航
Mozilla 今日正式推送 Firefox142.0版本至稳定发布通道,预计将于周二全面面向用户上线。 尽管此次更新未带来大规模功能革新,但其在底层支持与开发者工具方面的调整,或将引发关于浏览器扩展与本地 AI 集成的广泛讨论。 Firefox142属于八月例行主版本更新,重点在于稳定性优化与功能完善。
8/19/2025 5:56:09 PM
AI在线
突破Claude-4编程上限!自进化Agent框架拿下新SOTA,已开源
突破多步推理瓶颈,让Claude-3.7-Sonnet解题成功率暴增20.6%。 在SWE-Bench Verified上刷新开源框架SOTA! 中科院、清华大学、阶跃星辰等提出SE-Agent,一个创新的自进化(Self-Evolution)框架。
8/19/2025 5:38:07 PM
明敏
“现在读AI博士已经太晚了”
谷歌生成式AI团队创始成员竟然劝退AI博士? Jad Tarifi,这位在谷歌待了近十年、参与创立了谷歌第一个生成式AI团队的大佬,最近直接开炮:. 别为了赶AI这波热潮去读博士了,等你毕业,AI本身都可能被解决了。
8/19/2025 5:09:11 PM
梦晨
奥特曼:我承认GPT-5发布搞砸了
闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI奥特曼终于承认他搞砸了。 要说最近AI圈的大型翻车现场,GPT-5的发布绝对能排得上号。
8/19/2025 4:48:47 PM
闻乐
零跑最强半年报:Q2盈利1.63亿,月均销量冲刺7.6万台,年底上线城市NOA
零跑现在有多“爆”,可能连零跑自己都没意料到。 明明是车圈传统淡季,但今年的新势力销冠零跑汽车,披露的财报业绩已经“火”得一塌糊涂:. 上半年,公司首次净利润半年度转正,成为继理想之后,第二家实现半年度盈利的新势力;营收翻了一番不止,毛利增速更甚,稳定在两位数的毛利率,创公司历史新高。
8/19/2025 4:48:42 PM
杰西卡
医疗AI安全革命:全球首个医疗动态红队测试框架DAS,破解临床落地信任危机
作者 | 论文团队编辑 | ScienceAI近年来,以大型语言模型(LLMs)为代表的人工智能技术正以前所未有的速度发展,并在医疗健康领域展现出巨大的潜力。 从辅助疾病诊断到优化临床决策,LLMs 似乎正为我们描绘一幅智慧医疗的宏伟蓝图。 Med-Gemini 以及最新的 OpenAI 模型在各类医学资格考试中取得的优异成绩,更是点燃了人们对于其近期临床应用的热情。
8/19/2025 4:28:00 PM
ScienceAI
微软最新揭秘:「话痨实习生」AI助手,到底能帮人类做什么?
Copilot作为微软主推的AI对话工具,其积累了海量的用户数据。 而近日的一项研究,用到的数据来自24年微软Copilot对话,以及用户对AI回复是否点赞。 研究者将这些对话分类,发现用户使用AI助手频率最高的任务是获取信息,占比近40%。
8/19/2025 4:19:57 PM
新智元
16岁炒马斯克鱿鱼,SpaceX天才转投北大数学校友赵鹏麾下
16岁的天才小孩哥挥一挥衣袖,宣布从SpaceX离职了。 2年前,14岁的Kairan Quazi从圣克拉拉大学毕业,被马斯克pick,加入入职成功率仅有0.2%的SpaceX,成为Starlink部门最年轻的软件工程师——这是SpaceX工程密度最高的部门之一。 现在,智商超过180的Kairan转身离开,下一站:干金融,搞量化。
8/19/2025 4:17:49 PM
苹果Xcode即将原生集成Claude,开发者编程体验将迎来重大升级
继WWDC2025上宣布ChatGPT集成后,苹果正准备为Xcode开发环境引入Anthropic的Claude AI助手,为开发者提供更多AI编程选择。 据9to5Mac深入分析Xcode26beta7代码后发现,苹果已在新"智能"功能中多次提及对Anthropic账户的内置支持,特别是Claude Sonnet4.0和5月14日发布的Claude Opus4版本。 这表明虽然ChatGPT目前是唯一具有第一方Xcode集成的模型,但Claude的原生支持基础设施已经就位。
8/19/2025 4:16:12 PM
AI在线
英伟达开源9B参数小模型,比Qwen3快6倍
小模型也开始卷起来了! 在麻省理工学院衍生公司Liquid AI发布了一款小到可以装在智能手表上的新AI视觉模型,以及谷歌发布了一款可以在智能手机上运行的小型模型之后,英伟达也加入了这场浪潮,推出了自己的新型小型语言模型(SLM):Nemotron Nano v2。 这款9B的“小”模型在复杂推理基准测试上的准确率与Qwen3-8B相当或更高,速度快6倍。
8/19/2025 4:10:46 PM
首个3D动作游戏专用VLA模型,打黑神话&只狼超越人类玩家 | ICCV 2025
3B多模态大模型在动作角色扮演游戏的战斗任务中,成功率超越GPT-4o和人类玩家,淘天集团未来生活实验室团队提出了CombatVLA,已被ICCV 2025接收。 在复杂的三维环境中实现实时决策仍面临重大挑战,要求模型能在秒级时间尺度做出响应,具备高分辨率感知能力,并能够在动态条件下进行战术推理。 如下图所示,团队给出了CombatVLA推理得到的AoT解释、解析成Python代码的动作指令,以及执行这些动作后的帧序列。
8/19/2025 4:08:20 PM
GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史
一张基准对比图,彻底火遍了全网。 GPT-5发布近半个月,实际表现未达预期,不少人感慨:苦等OpenAI两年,就是这? 为此,Peter Gostev将GPT-4和GPT-5在数学、软件工程、问答等基准上,做了一个直观对比。
8/19/2025 4:05:27 PM
GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网
刚刚,OpenAI又离职一名华人大佬。 前OpenAI研究员Kevin Lu宣布加入AI新创Thinking Machines Lab。 Kevin Lu主导了GPT-4o mini的发布,并参与o*-mini、o3等模型工作。
8/19/2025 3:58:59 PM
凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”
henry 发自 凹非寺. 量子位 | 公众号 QbitAI用提示词就能点对点编辑图片? Qwen:没错,正是在下。
8/19/2025 3:56:06 PM
henry
MCP堆工具是大坑!开发者大佬:命令行的‘脆’让AI崩惨了!不如砍成一个代码执行器:7轮调用秒变1轮!网友:早该放弃黑箱工具了!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)你的 MCP,可能真用错了? MCP 常被视作大模型的“USB 接口”。 不少开发者第一反应就是:往里堆更多专用工具(grep、sed、tmux……),好像这样就能让 AI 更强大。
8/19/2025 3:19:56 PM
伊风
7年了,OpenAI官方给出五代GPT对比,网友却怀念起「狂野」初代
从2018年至今,GPT系列模型已经来到第五代,如果让你回忆第一次使用GPT-1时的感受,可能是一种新奇却略显笨拙的震撼,就像这样:当你问 GPT-1:麻醉状态下,你真的有意识吗? 它的回答很生硬,甚至有些胡言乱语:我没有。 你醒了。
8/19/2025 2:55:00 PM
机器之心