理论
AI牛马实现“干中学”!上海AI Lab联合推出智能体自我进化新框架
在人工智能的广阔世界里,我们早已习惯了LLM智能体在各种任务中大放异彩。 但有没有那么一瞬间,你觉得这些AI“牛马”还是缺了点什么? 没错,它们缺少的是我们人类最宝贵的职场技能:经验的积累和持续的自我进化。
10/22/2025 9:00:00 AM
被H-1B签证折磨10年,前微软科学家用AI「掀桌」
一位前微软科学家正在用AI改造美国签证体系,让一个10万美元的「昂贵流程」变得透明而又简单。 专注移民科技的初创公司Casium,在H‑1B新政落地后迎来窗口期,获Maverick Ventures领投的500万美元种子轮。 Casium创始人Priyanka KulkarniCasium由前微软科学家Priyanka Kulkarni创办,多年在美国移民体系下生存的她和许多其他科技移民一样,经常体会到工作签证背后那份无形困扰与束缚。
10/22/2025 8:58:35 AM
AGI前夜重磅:RL突破模型「认知上限」,真·学习发生了!
在AI研究圈,一个核心争论是:强化学习(RL)是否能够赋予模型超越其基础模型(base model)的推理能力。 怀疑派观点:早在四月份,清华的黄高团队[arXiv:2504.13837]指出,尽管经过 RLVR 训练的模型在较小的采样值 (k)(例如 (k=1))时能优于其基础模型,但当采样数较大时,基础模型往往能取得相同或更好的 pass@k 表现。 他们通过覆盖率(coverage)和困惑度(perplexity)分析推断,模型的推理能力最终受限于基础模型的支持范围。
10/22/2025 8:56:05 AM
Embedding黑箱成为历史!这个新框架让模型“先解释,再学Embedding”
让模型先解释,再学Embedding! 来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员,最新推出可解释的生成式Embedding框架——GRACE。 过去几年,文本表征(Text Embedding)模型经历了从BERT到E5、GTE、LLM2Vec,Qwen-Embedding等不断演进的浪潮。
10/22/2025 8:39:31 AM
聊聊多模态训练数据创建的八个挑战
译者 | 核子可乐审校 | 重楼多模态AI能够处理图像、音频和文字等多种数据形式,亦可捕捉面部表情和周遭环境细节,让用户与AI的日常交互变得更加轻松自然、如同与好友聊天。 2023年,多模态AI市场规模就已达到12亿美元,预计自2024年至2032年期间复合年增长率将超过30%。 而显著增长的前提,离不开训练数据。
10/22/2025 8:00:00 AM
核子可乐
自主式AI安全漏洞来袭:确保企业无忧的七道防线
智能体是专为执行特定任务而设计的模型,可在指令下自主或半自主地运行,目前已在各企业中广泛应用(普华永道今年早些时候的一份报告显示,在所有接受调查的企业中,这一比例高达79%)。 但这些智能体也带来了新的安全风险。 当发生智能体安全漏洞事件时,企业可能会迅速解雇员工并归咎于他们,但却迟迟无法识别和修复导致漏洞出现的系统性故障。
10/22/2025 7:05:00 AM
Louis
AI导致全球大裁员?牛津大学研究员:别把AI当成替罪羊
人工智能正在影响现实世界,从科技企业到航空企业都出现了不同程度的裁员,许多员工陷入恐慌。 一些企业为了裁员,甚至将AI当成借口。 上个月,科技咨询公司埃森哲(Accenture)宣布裁员,无法率先掌握AI技术的员工被迫离开。
10/22/2025 2:00:00 AM
小刀
长生不老成真?哈佛AI数周破解「衰老密码」,人类寿命或迎重写
几千年来,人类都在追问:如何才能长生不老? 从炼丹术到现代实验室,答案始终模糊。 即便有了基因测序和大数据,研究者往往也要花上数年,才能在庞杂信号里筛出一丝线索。
10/22/2025 2:00:00 AM
新智元
从互联网泡沫到AI泡沫论:为何高盛说当前AI投资“未过热”?
2025下半年以来,AI 领域的热度持续攀升,美国企业在该领域的投资力度更是不断加大。 以 OpenAI 为例,即便尚未实现盈利,其已预定的算力投资规模就至少达到 1.5 万亿美元。 这股强劲的投资热潮,不禁让人联想到 2000 年代的互联网泡沫,引发了外界对 AI 投资是否过热的担忧。
10/22/2025 1:00:00 AM
蚂蚁万亿模型震撼开源!数学推理碾压GPT,国产AI首次问鼎奥数银牌
92.6分 vs 94.6分——当我看到蚂蚁集团刚发布的Ring-1T模型在AIME25测试中的成绩时,第一反应是有点不敢相信。 一个国产开源模型,居然能在数学推理上逼近GPT-5的水平? 更震撼的是,这个叫Ring-1T的模型在模拟IMO(国际数学奥林匹克)近十年真题的测试中,正确率达到了银牌选手平均水平的93%。
10/22/2025 12:00:00 AM
阿丸笔记
微软宣布:Windows 11 彻底转向“AI原生”!重写PC底层代码!网友:直接告诉我怎么禁用就行
编辑 | 听雨从记事本到 Excel,从任务栏到 Office,AI 已经无处不在——近日,微软正式宣布,Windows 11 正在向 AI 原生操作系统进化。 这一消息由微软副总裁Stefan Kinnestrand亲口阐述,其核心并非简单叠加Copilot功能,而是要对Windows进行根本性重塑。 Kinnestrand强调,未来的Windows 11将把AI模型、上下文理解能力及用户意图识别,提升为与任务栏、鼠标同等重要的“核心系统特性”。
10/21/2025 5:24:15 PM
听雨
现在是AI最糟糕的阶段!别让AI带头!华盛顿初创创始人警醒:要保持团队的锋利!AI会造成公地悲剧!自曝秘诀:用测试和文档驯服AI
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)“现在是AI最糟糕的阶段! ”如果你去翻看OpenAI、Anthropic这两家的Top10 token 消耗的玩家排行榜、无一例外都会发现,各种 Code 工具都会名列前茅。 如今各种AI Coding工具大行其道!
10/21/2025 3:37:12 PM
云昭
ChatGPT缔造者联手DeepMind大神,用AI攻坚高温超导,半个硅谷抢着投
在OpenAI缔造了ChatGPT的前研究副总裁,和谷歌DeepMind材料科学与化学研究的领导者,联手出走创业了! 他们的新公司Periodic Labs一亮相就拿下了3亿美元的种子轮融资,投资阵容星光熠熠,a16z领投,跟投方有DST、英伟达NVentures、Accel、Felicis等,以及杰夫·贝索斯、埃里克·施密特、杰夫·迪恩等科技大佬。 如此夸张的融资数字和投资人阵列,在初创公司中极为罕见,引发了业界的轰动。
10/21/2025 12:48:48 PM
长序列推理不再卡顿!北大华为KV缓存管理框架实现4.7倍推理加速
北大华为联手推出KV cache管理新方式,推理速度比前SOTA提升4.7倍! 大模型处理长序列时,KV cache的内存占用随序列长度线性增长,已成为制约模型部署的严峻瓶颈。 为此,来自北京大学与华为的研究团队联合提出了LouisKV——一个专为长输入、长输出等各类长序列场景设计的高效KV cache 检索框架。
10/21/2025 12:31:13 PM
ChatGPT千亿tokens,干掉麦肯锡5000名顾问
全球顶级咨询公司麦肯锡,居然收到了OpenAI最近给Tokens消耗大客户颁发的奖牌。 麦肯锡自己还怪自豪的,第一时间就把奖牌po到了领英上。 等等,好像哪里不对……但凡过遍脑子,都能察觉出“这份荣耀”有点不对味——你花百万美金买PPT的麦肯锡,竟然是ChatGPT的大客户?
10/21/2025 12:29:37 PM
ChatGPT也遭殃,亚马逊服务器故障,半个互联网都崩了
亚马逊一声咳嗽,半个互联网都地震了。 由于亚马逊AWS服务器宕机,大量互联网服务被迫中断,ChatGPT也被殃及。 故障发生在美国东部us-east-1区域,是AWS全球服务最核心的一块。
10/21/2025 12:27:41 PM
LISA:用审计经验驱动的智能体框架,破解智能合约逻辑漏洞检测难题
大家好,我是肆〇柒。 近期,由新加坡LISA智能体团队(Agent Lisa Team Singapore)的Izaiah Sun、Daniel Tan与Andy Deng联合发布的《LISA Technical Report: An Agentic Framework for Smart Contract Auditing》引发关注。 该报告提出了一种不依赖模型微调、而是从历史审计报告中提取“检测经验”的新型智能合约审计框架,为解决长期困扰行业的逻辑漏洞漏检问题提供了新思路。
10/21/2025 10:24:02 AM
肆零柒
美国拟减40%国际生,留学风向要变?Nature曝全球高校大洗牌
全球高校正在经历一场大洗牌! 如果把全球2.64亿大学生组成一个国家,它将是世界上人口第五大国。 而且,也是「人口增长最快的国家」之一。
10/21/2025 9:06:52 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉