AI在线 AI在线

理论

惊现狠人手搓Agent心经!LLM的Tool Use逻辑曝光!简单到爆炸:仅9行代码!网友直呼:难以相信!难点是LLM循环几次!

作者 | 云昭一款 Agent 究竟是怎样让大模型具备“Tool Use”,即工具调用的能力? 今天,有一位正在创建编码 Agent 的狠人出来曝光了这个算法逻辑。 这位狠人,名为 Philip Zeyliger,过去几个月,他和他的团队一直在开发一款名为“Sketch”的 AI 编程助手。
5/16/2025 6:29:19 PM
云昭

PDF文件长出「AI大脑」?网友惊呼:这操作太「黑科技」了!

技术宅太疯狂! 在PDF中,也能运行LLM。 从PDF里跑出AI大脑?
5/16/2025 4:35:03 PM

微软老员工48岁生日被裁,妻子发帖怒斥算法裁人!全球大血洗6000人

微软6000人血色大裁员,余波还在震荡。 从消息曝出到今天,三天内,这6000个人已经从单纯的数字,浮现成了一个个有血有肉的人物故事,不断冲击着我们的神经。 一位妻子沉痛地发帖说:我的丈夫,一位25年的微软老员工,因为被算法选中,在48岁当天被裁掉了。
5/16/2025 3:46:10 PM

AI 教父认错!Geoffrey Hinton改口:当年看走眼了,不该给放射科医生判“死缓”

最近,AI圈因为一个“旧闻新提”变得有意思。 主角是Geoffrey Hinton,AI教父级人物,图灵奖得主。 据科技媒体《the-decoder》报道,他在接受《纽约时报》采访时,坦诚自己当年对AI取代放射科医生的预测,有点“过于乐观”了。
5/16/2025 1:45:36 PM

火山引擎 veFuser:面向扩散模型的图像与视频生成推理服务框架

出品 | 51CTO技术栈(微信号:blog51cto)1.DiT 模型与推理挑战近年来,扩散模型(Diffusion Models)在生成式人工智能领域取得了突破性进展,尤其是在图像和视频生成方面表现卓越。 基于 Transformer 的扩散模型(DiT, Diffusion Transformer)因其强大的建模能力和高质量输出,成为学术界和工业界的研究热点。 DiT 模型通过逐步去噪的过程,从随机噪声生成逼真的图像或视频帧,结合 Transformer 架构的全局建模能力,能够捕捉复杂的语义特征和视觉细节,广泛应用于文本到图像、文本到视频、视频编辑等场景。
5/16/2025 1:18:37 PM

原因找到了!马斯克的Grok突然“失心疯”!不停发推“南非白种人灭绝”、“杀死布尔人”,官方回应来了:有员工擅自修改了系统提示词

编辑  | 云昭出品 | 51CTO技术栈(微信号:blog51cto)昨天其实发生了一件很“荒唐 滑稽”的事情,小编忍住没有报道。 但忽然发现不对劲,得报。 事情是这样的:5月15日,Grok自己疯狂输出有关“南非白人种族”的暴论。
5/16/2025 1:01:15 PM
云昭

DiffMoE:动态Token选择助力扩散模型性能飞跃,快手&清华团队打造视觉生成新标杆!

本文由清华大学和快手可灵团队共同完成。 第一作者是清华大学智能视觉实验室在读本科生史明磊。 在生成式 AI 领域,扩散模型(Diffusion Models)已成为图像生成任务的主流架构。
5/16/2025 11:03:48 AM

AI 神器!一键把 Vue3 源码解析成文档!

在开发过程中,开发者们常常需要深入理解各种开源项目的源码,以便更好地利用和学习。 然而,面对复杂的源码,往往感到无从下手。 最近,一款名为 DeepWiki 的 AI 工具为这一问题提供了全新的解决方案,它能够一键将 Vue3 源码转换为清晰易懂的文档。
5/16/2025 10:50:36 AM
小4子

预测性AI分析最大的障碍不是技术能力,而是组织勇气

我曾经问过一位零售CEO:"你希望知道昨天卖了多少货,还是明天会卖多少货? " 他笑着说:"当然是明天。 " 这就是预测性AI的核心价值 - 不仅了解过去,更要洞察未来。
5/16/2025 10:25:11 AM
大数据AI智能圈

ChatGPT的记忆机制被公开了

ChatGPT新版记忆功能居然被民间大佬逆向工程了! 能引用历史记录,甚至还能悄悄藏个人资料? 最近OpenAI推出了一项名为聊天历史记录的额外记忆功能,允许ChatGPT引用历史对话以进行个性化交互。
5/16/2025 10:17:54 AM

超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一!
5/16/2025 10:15:06 AM

向量存储瘦身术:智能问答系统的空间优化革命

在AI智能问答系统中,向量数据库的存储压力越来越大。 随着知识库规模扩大,如何高效压缩存储空间正在被大家所关注。 本文将介绍一种方案,实现节省知识库占用空间,避免数据量无限制的增长。
5/16/2025 10:01:31 AM
贝塔街的万事屋

超越OpenAI、ElevenLabs,MiniMax新一代语音模型屠榜!人格化语音时代来了

国产大模型进步的速度早已大大超出了人们的预期。 年初 DeepSeek-R1 爆火,以超低的成本实现了部分超越 OpenAI o1 的表现,一定程度上让人不再过度「迷信」国外大模型。 如今,在语音 AI 领域,国产大模型第一梯队的重量级选手 MiniMax 又抛下了一颗「重磅炸弹」。
5/16/2025 9:12:00 AM

阿里开源全能视频模型!生成编辑都精通,1.3B版本消费级显卡可跑

业界功能最全、消费级显卡可跑、而且还是开源的? 不卖关子了,这就是阿里最新开源的通义万相Wan2.1-VACE,号称当前业界功能最全的视频生成与编辑模型。 有多全呢?
5/16/2025 9:08:00 AM

个人开发者训400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署

打破科技巨头算力垄断,个人开发者联手也能训练超大规模AI模型? Nous Research宣布推出Psyche Network,可以将全球算力整合起来训练强大的人工智能。 Psyche是一个基于Deepseek的V3 MLA架构的去中心化训练网络,测试网首次启动时直接对40B参数LLM进行预训练,可以在单个H/DGX上训练,并在3090 GPU上运行。
5/16/2025 9:06:00 AM

梁文锋署名DeepSeek新论文:公开V3大模型降本方法

梁文锋亲自参与的DeepSeek最新论文,来了! 这一次,团队把DeepSeek-V3在训练和推理过程中,如何解决“硬件瓶颈”的方法公布了出来。 具体而言,DeepSeek-V3之所以可以只用2048块H800,就能达到超大规模集群(如数万块GPU)相当的训练效果,核心在于四项创新技术:内存优化多头潜在注意力(MLA)计算优化混合专家模型(MoE)与FP8低精度训练通信优化多层网络拓扑与低延迟设计推理加速多token预测(MTP)那么这四项优化具体又是如何起到作用的,我们继续往下看。
5/16/2025 9:02:00 AM

DeepSeek发布最新论文,5大杀手锏让大模型训练、推理暴涨

昨天,全球著名开源大模型平台DeepSeek在huggingface发布了,超强开源模型V3的论文。 主要从硬件架构和模型设计的双视角探讨如何在不牺牲性能的前提下实现更高效的大规模训练和推理以突破硬件瓶颈。 其中,DeepSeek-MoE和多头潜在注意力、FP8混合精度训练以及多标记预测等成为关键创新技术。
5/16/2025 8:58:09 AM

ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题

作者介绍:本文第一作者是丰田工业大学芝加哥 PhD 学生杨晨晓,研究兴趣是机器学习理论和大模型推理,在 ICML,NeurIPS,ICLR 等顶级会议上发表过论文。 本文提出一个交替「推理 - 擦除」的深度思考新范式 PENCIL,比传统 CoT 更高效地解决更复杂的推理任务。 理论上,我们证明 PENCIL 可用最优空间与最优时间下解决所有可计算问题,而这对于传统的 CoT 是不可能的!
5/16/2025 8:44:01 AM