资讯列表
教多模态大模型学会“反思”和“复盘”,上交&上海AI Lab重磅发布MM-HELIX&AHPO,破解多模态复杂推理难题
多模态大模型表现越来越惊艳,但人们也时常困于它的“耿直”。 无论是生成代码、分析图表还是回答问题,诸多多模态大模型(MLLM)都倾向于给出一个“一步到位”的答案。 它们就像一个从不检查作业的“学霸”,虽然知识渊博,但一旦在复杂的、需要反复试错的问题上走错一步,就很难回头。
10/20/2025 9:02:00 AM
让模型“看视频写网页”,GPT-5仅得36.35分!上海AI Lab联合发布首个video2code基准
多模态大模型在根据静态截图生成网页代码(Image-to-Code)方面已展现出不俗能力,这让许多人对AI自动化前端开发充满期待。 然而,一个网页的真正价值远不止于其静态布局。 用户的点击、筛选、表单提交,乃至游戏中的每一步操作,都构成了其核心的交互功能。
10/20/2025 9:01:00 AM
企业云+AI融合的未来图景与应对策略
作者 | 孙杰审校 | 重楼引言:AI浪潮驱动云战略转型随着人工智能技术的迅猛发展,尤其是大模型应用的广泛落地,企业对云计算的需求已从基础设施的“资源上云”逐步转向业务与智能不断融合的“深度用云”。 据Canalys统计,2024年中国云服务总支出达400亿美元,同比增长13%,而DeepSeek于2025年初推出的高性能低成本大模型DeepSeek R1,更是进一步点燃了市场对“云 AI”融合的热情。 调研显示,已有33%的中国企业认识到,云与AI的深度融合能够推动产品与服务创新。
10/20/2025 9:00:00 AM
孙杰
马斯克发起编程人机大战!卡帕西说了不
拒绝世界首富是什么体验? 卡帕西:这事我熟! 刚刚,马斯克高调邀请卡帕西,与Grok 5来一场编程对决——就像当年的“卡斯帕罗夫大战深蓝”。
10/20/2025 9:00:00 AM
薛定谔亲外孙创业量子计算,老黄早早就成了股东
什么样的量子计算创业公司,一次能获得10亿美元的巨额融资? 而且就连年初还在给量子计算泼冷水的英伟达创始人黄仁勋,转头就成为了这家公司投资股东。 或许是因为这家公司的BP里,有一页是《我的爷爷薛定谔》(doge)。
10/20/2025 8:59:00 AM
训练成本暴降99%,35秒出1分钟高清视频!英伟达MIT等引爆视频AI革命
27帧每秒的实时视频生成、35秒合成1分钟高清视频——这不是遥远的未来,而是刚刚由英伟达联合MIT与港大团队带来的现实。 全新一代视频扩散模型SANA-Video横空出世,凭借革命性的线性DiT架构与恒定显存KV缓存机制,不仅速度超越所有同类模型,更以高达720p的分辨率与分钟级时长生成,重新定义了AI视频生成的效率极限。 SANA-Video不仅在速度和性能上表现出色,生成的图像质量也非常高。
10/20/2025 8:58:00 AM
数学界地震!GPT-5连破10道「百年悬案」,陶哲轩:AI革命才刚开始
科学研究,尤其是数学研究,真的要被AI彻底改变了。 两位数学研究人员,利用GPT-5,只用一个周末就解决了10个「百年悬案」级的埃尔德什难题。 埃尔德什难题,又名为Erdös problems,是数学家埃尔德什生前留下的大约1000多个问题,此前人类只解决了部分。
10/20/2025 8:57:00 AM
为何99%的企业AI集成尝试遭遇失败,又该如何成为那1%?
企业要确保面向未来,就不能仅仅把AI应用局限在聊天机器人或者部分任务自动化,更要让AI成为整个组织的基础技能。 据麦肯锡调查,仅有1%的企业领导者表示真正实现了AI成熟,并将这项新技术完全融入工作流程。 Gartner也做出预测,称到2027年底超40%的代理式AI项目将被取消。
10/20/2025 8:00:00 AM
核子可乐
自主式AI对SaaS及合作伙伴生态系统的影响
作为一名架构师,我深切体会到,在过去十年里,企业支持应用程序和数据生态系统间互操作性的能力,已成为实现差异化竞争和快速上市的关键主题。 行业渠道合作伙伴和SaaS原始设备制造商早已认识到这一点,并构建了跨其他合作伙伴网络和渠道的生态系统。 API的早期实现基于这样一种理念:将专有软件“黑盒”之外的功能和数据接口开放,以实现与其他异构系统的集成。
10/20/2025 7:00:00 AM
Dion
GPT-5 数学神话“塌房”:文献检索被当成原创突破。LeCun冷笑:被自家 GPT 傻子坑了吧
10月17日的晚上,AI世界一片喧嚣。 OpenAI研究员、前斯坦福数学家Mark Sellke发推,宣布GPT-5“找到了十个此前未解的Erdős问题的解”。 他列出十个编号,像在展示一场数学奇迹的战利品。
10/20/2025 2:00:00 AM
你骂AI越狠,它反而越聪明?
AI世界的Prompt技巧,真的在奇奇怪怪的地方,不断对历史进行call back。 更多提示词技巧:故事是这样的。 昨天照例在刷一些没那么硬核的论文,看看有没有好玩的。
10/20/2025 1:31:54 AM
数字生命卡兹克
Andrej Karpathy 最新访谈:强化学习是糟糕的,只是其他一切都更糟
最近,前特斯拉AI负责人、OpenAI早期成员 Andrej Karpathy 在接受播客节目 Dwarkesh Patel Show 采访时,系统反思了当下AI研究的方向。 原文地址:,“强化学习是糟糕的,只是其他一切都更糟。 ”Karpathy解释,强化学习的问题不在算法的复杂性,而在信息的稀缺性。
10/20/2025 1:00:00 AM
AI赋能的主动防御是如何从概念走向真实落地的?
AI赋能的主动防御无疑是未来企业网络安全的应对趋势,但对于大多数企业而言,AI赋能安全听起来不知从何下手。 是否需要一下子投入大量资金购买昂贵的AI平台? 还是可以从现有的安全工具开始升级?
10/20/2025 12:00:00 AM
礼貌=更不准?宾夕法尼大学新论文:对 AI 粗鲁点,提升 4% 准确率
据2025年9月发表于arXiv的论文《Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy》。 图片论文地址:arxiv.org/abs/2510.04950宾夕法尼亚州立大学的两位研究者提出了一个出人意料的发现:越有礼貌的提问,ChatGPT 的回答越不准确。 实验结果显示,当用户以“非常礼貌”的语气提问时,ChatGPT-4o 的平均准确率仅为 80.8%。
10/20/2025 12:00:00 AM
经济学诺奖得主的富二代人生:香奈儿老佛爷帮他写作业,AI时代反对向机器人征税
Jay 发自 凹非寺. 量子位 | 公众号 QbitAI诺贝尔奖,确实针对性很强啊。 就在今年陶哲轩都不得不在线为科研经费奔走,强调科研推动经济增长之时,诺奖用经济学奖给出了最佳辅助——.
10/19/2025 10:57:27 PM
henry
LSTM之父向何恺明开炮:我学生才是残差学习奠基人
鹭羽 发自 凹非寺. 量子位 | 公众号 QbitAI何恺明残差学习奠基人的身份,也被“挑战”了。 为什么要说“也”?
10/19/2025 10:49:10 PM
henry