AI在线 AI在线

理论

AI牛马实现“干中学”!上海AI Lab联合推出智能体自我进化新框架

在人工智能的广阔世界里,我们早已习惯了LLM智能体在各种任务中大放异彩。 但有没有那么一瞬间,你觉得这些AI“牛马”还是缺了点什么? 没错,它们缺少的是我们人类最宝贵的职场技能:经验的积累和持续的自我进化。
10/22/2025 9:00:00 AM

被H-1B签证折磨10年,前微软科学家用AI「掀桌」

一位前微软科学家正在用AI改造美国签证体系,让一个10万美元的「昂贵流程」变得透明而又简单。 专注移民科技的初创公司Casium,在H‑1B新政落地后迎来窗口期,获Maverick Ventures领投的500万美元种子轮。 Casium创始人Priyanka KulkarniCasium由前微软科学家Priyanka Kulkarni创办,多年在美国移民体系下生存的她和许多其他科技移民一样,经常体会到工作签证背后那份无形困扰与束缚。
10/22/2025 8:58:35 AM

AGI前夜重磅:RL突破模型「认知上限」,真·学习发生了!

在AI研究圈,一个核心争论是:强化学习(RL)是否能够赋予模型超越其基础模型(base model)的推理能力。 怀疑派观点:早在四月份,清华的黄高团队[arXiv:2504.13837]指出,尽管经过 RLVR 训练的模型在较小的采样值 (k)(例如 (k=1))时能优于其基础模型,但当采样数较大时,基础模型往往能取得相同或更好的 pass@k 表现。 他们通过覆盖率(coverage)和困惑度(perplexity)分析推断,模型的推理能力最终受限于基础模型的支持范围。
10/22/2025 8:56:05 AM

Embedding黑箱成为历史!这个新框架让模型“先解释,再学Embedding”

让模型先解释,再学Embedding! 来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员,最新推出可解释的生成式Embedding框架——GRACE。 过去几年,文本表征(Text Embedding)模型经历了从BERT到E5、GTE、LLM2Vec,Qwen-Embedding等不断演进的浪潮。
10/22/2025 8:39:31 AM

聊聊多模态训练数据创建的八个挑战

译者 | 核子可乐审校 | 重楼多模态AI能够处理图像、音频和文字等多种数据形式,亦可捕捉面部表情和周遭环境细节,让用户与AI的日常交互变得更加轻松自然、如同与好友聊天。 2023年,多模态AI市场规模就已达到12亿美元,预计自2024年至2032年期间复合年增长率将超过30%。 而显著增长的前提,离不开训练数据。
10/22/2025 8:00:00 AM
核子可乐

自主式AI安全漏洞来袭:确保企业无忧的七道防线

智能体是专为执行特定任务而设计的模型,可在指令下自主或半自主地运行,目前已在各企业中广泛应用(普华永道今年早些时候的一份报告显示,在所有接受调查的企业中,这一比例高达79%)。 但这些智能体也带来了新的安全风险。 当发生智能体安全漏洞事件时,企业可能会迅速解雇员工并归咎于他们,但却迟迟无法识别和修复导致漏洞出现的系统性故障。
10/22/2025 7:05:00 AM
Louis

AI导致全球大裁员?牛津大学研究员:别把AI当成替罪羊

人工智能正在影响现实世界,从科技企业到航空企业都出现了不同程度的裁员,许多员工陷入恐慌。 一些企业为了裁员,甚至将AI当成借口。 上个月,科技咨询公司埃森哲(Accenture)宣布裁员,无法率先掌握AI技术的员工被迫离开。
10/22/2025 2:00:00 AM
小刀

长生不老成真?哈佛AI数周破解「衰老密码」,人类寿命或迎重写

几千年来,人类都在追问:如何才能长生不老? 从炼丹术到现代实验室,答案始终模糊。 即便有了基因测序和大数据,研究者往往也要花上数年,才能在庞杂信号里筛出一丝线索。
10/22/2025 2:00:00 AM
新智元

从互联网泡沫到AI泡沫论:为何高盛说当前AI投资“未过热”?

2025下半年以来,AI 领域的热度持续攀升,美国企业在该领域的投资力度更是不断加大。 以 OpenAI 为例,即便尚未实现盈利,其已预定的算力投资规模就至少达到 1.5 万亿美元。 这股强劲的投资热潮,不禁让人联想到 2000 年代的互联网泡沫,引发了外界对 AI 投资是否过热的担忧。
10/22/2025 1:00:00 AM

蚂蚁万亿模型震撼开源!数学推理碾压GPT,国产AI首次问鼎奥数银牌

92.6分 vs 94.6分——当我看到蚂蚁集团刚发布的Ring-1T模型在AIME25测试中的成绩时,第一反应是有点不敢相信。 一个国产开源模型,居然能在数学推理上逼近GPT-5的水平? 更震撼的是,这个叫Ring-1T的模型在模拟IMO(国际数学奥林匹克)近十年真题的测试中,正确率达到了银牌选手平均水平的93%。
10/22/2025 12:00:00 AM
阿丸笔记

微软宣布:Windows 11 彻底转向“AI原生”!重写PC底层代码!网友:直接告诉我怎么禁用就行

编辑 | 听雨从记事本到 Excel,从任务栏到 Office,AI 已经无处不在——近日,微软正式宣布,Windows 11 正在向 AI 原生操作系统进化。 这一消息由微软副总裁Stefan Kinnestrand亲口阐述,其核心并非简单叠加Copilot功能,而是要对Windows进行根本性重塑。 Kinnestrand强调,未来的Windows 11将把AI模型、上下文理解能力及用户意图识别,提升为与任务栏、鼠标同等重要的“核心系统特性”。
10/21/2025 5:24:15 PM
听雨

现在是AI最糟糕的阶段!别让AI带头!华盛顿初创创始人警醒:要保持团队的锋利!AI会造成公地悲剧!自曝秘诀:用测试和文档驯服AI

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)“现在是AI最糟糕的阶段! ”如果你去翻看OpenAI、Anthropic这两家的Top10 token 消耗的玩家排行榜、无一例外都会发现,各种 Code 工具都会名列前茅。 如今各种AI Coding工具大行其道!
10/21/2025 3:37:12 PM
云昭

ChatGPT缔造者联手DeepMind大神,用AI攻坚高温超导,半个硅谷抢着投

在OpenAI缔造了ChatGPT的前研究副总裁,和谷歌DeepMind材料科学与化学研究的领导者,联手出走创业了! 他们的新公司Periodic Labs一亮相就拿下了3亿美元的种子轮融资,投资阵容星光熠熠,a16z领投,跟投方有DST、英伟达NVentures、Accel、Felicis等,以及杰夫·贝索斯、埃里克·施密特、杰夫·迪恩等科技大佬。 如此夸张的融资数字和投资人阵列,在初创公司中极为罕见,引发了业界的轰动。
10/21/2025 12:48:48 PM

长序列推理不再卡顿!北大华为KV缓存管理框架实现4.7倍推理加速

北大华为联手推出KV cache管理新方式,推理速度比前SOTA提升4.7倍! 大模型处理长序列时,KV cache的内存占用随序列长度线性增长,已成为制约模型部署的严峻瓶颈。 为此,来自北京大学与华为的研究团队联合提出了LouisKV——一个专为长输入、长输出等各类长序列场景设计的高效KV cache 检索框架。
10/21/2025 12:31:13 PM

ChatGPT千亿tokens,干掉麦肯锡5000名顾问

全球顶级咨询公司麦肯锡,居然收到了OpenAI最近给Tokens消耗大客户颁发的奖牌。 麦肯锡自己还怪自豪的,第一时间就把奖牌po到了领英上。 等等,好像哪里不对……但凡过遍脑子,都能察觉出“这份荣耀”有点不对味——你花百万美金买PPT的麦肯锡,竟然是ChatGPT的大客户?
10/21/2025 12:29:37 PM

ChatGPT也遭殃,亚马逊服务器故障,半个互联网都崩了

亚马逊一声咳嗽,半个互联网都地震了。 由于亚马逊AWS服务器宕机,大量互联网服务被迫中断,ChatGPT也被殃及。 故障发生在美国东部us-east-1区域,是AWS全球服务最核心的一块。
10/21/2025 12:27:41 PM

LISA:用审计经验驱动的智能体框架,破解智能合约逻辑漏洞检测难题

大家好,我是肆〇柒。 近期,由新加坡LISA智能体团队(Agent Lisa Team Singapore)的Izaiah Sun、Daniel Tan与Andy Deng联合发布的《LISA Technical Report: An Agentic Framework for Smart Contract Auditing》引发关注。 该报告提出了一种不依赖模型微调、而是从历史审计报告中提取“检测经验”的新型智能合约审计框架,为解决长期困扰行业的逻辑漏洞漏检问题提供了新思路。
10/21/2025 10:24:02 AM
肆零柒

美国拟减40%国际生,留学风向要变?Nature曝全球高校大洗牌

全球高校正在经历一场大洗牌! 如果把全球2.64亿大学生组成一个国家,它将是世界上人口第五大国。 而且,也是「人口增长最快的国家」之一。
10/21/2025 9:06:52 AM