AI在线 AI在线

理论

AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理

大语言模型(LLM)还能涌现什么能力? 这次开源模型Orpheus,直接让LLM涌现人类情感! 对此,Canopy Labs的开源开发者Elias表示Orpheus就像人类一样,已经拥有共情能力,能从文本中产生潜在的线索,比如叹息、欢笑和嗤笑。
4/16/2025 9:46:46 AM
新智元

黄仁勋5000亿豪赌:AI超算首次Made in USA!

英伟达周一抛出重磅消息,宣布将首次在美国制造AI超级计算机。 未来四年内,英伟达将通过与台积电、富士康、纬创资通、安靠(Amkor)和矽品(SPIL)的合作,在美国打造出价值5000亿美元的AI基础设施。 目前,位于亚利桑那州凤凰城的台积电工厂已经率先开工,开始生产Blackwell芯片。
4/16/2025 9:41:46 AM
新智元

永别了,GPT-4!

猝不及防地,GPT-4就这样退出历史舞台了。 4月10日,OpenAI正式宣布,即将从ChatGPT中移除两年前推出的GPT-4。 从4月30日起,GPT-4将被当前的默认模型GPT-4o完全取代。
4/16/2025 9:35:03 AM
新智元

GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的

不过两月,GPT-4.5正式出局,前浪把后浪拍在了沙滩上。 GPT-4.1家族的出世,以更强编码性能,百万token上下文,更具性价比的价格,直接击穿了4.5。 nano版的GPT-4.1性能足以媲美GPT-4o mini,而且速度更快,价格更便宜。
4/16/2025 9:30:16 AM
新智元

英伟达含量为零!华为密集模型性能比肩DeepSeek-R1,纯昇腾集群训练

密集模型的推理能力也能和DeepSeek-R1掰手腕了? 华为利用纯昇腾集群训练出的盘古Ultra,在数学竞赛、编程等推理任务当中,和R1打得有来有回。 关键是模型参数量只有135B,整个训练过程零英伟达含量,而且没有出现损失尖峰。
4/16/2025 8:50:00 AM
量子位

ICLR 2025时间检验奖颁给Adam之父!Bengio「注意力机制」摘亚军

刚刚,ICLR 2025时间检验奖公布! 斩获大奖的是,xAI工程师、Hinton高徒Jimmy Ba发表的Adam优化器。 获得亚军的是,Yoshua Bengio团队提出的「注意力机制」,为Transformer和大模型奠定了基础。
4/16/2025 8:30:00 AM
新智元

从黑箱到透明工厂:Anthropic用回路追踪技术给LLM装上思维监控屏​

译者 | 朱先忠审校 | 重楼引言多年来,基于Transformer的大型语言模型(LLM)在从简单的信息检索系统到能够进行编码、写作、开展研究的复杂智能体等一系列任务上取得了长足的进步。 然而,尽管这些模型功能强大,但它们在很大程度上仍然是黑匣子。 给定输入,它们可以完成任务,但我们缺乏直观的方法来理解任务的具体完成方式。
4/16/2025 8:05:00 AM
朱先忠

人工智能在科学发现中的崛起:AI 能否真正跳出思维定式?

译者 | 涂承烨审校 | 重楼人工智能(AI)正在快速发展,其应用已遍布到医疗、金融、教育和娱乐等行业,而最令人兴奋的领域之一便是科学研究。 AI 处理海量数据、识别复杂模式并做出预测的能力,正在加速科学发现的步伐。 这引发了一个有趣的问题:AI 能否像人类科学家一样跳出思维定式,提出真正新颖的想法?
4/16/2025 8:00:00 AM
涂承烨

软件包幻觉:LLM可能会向粗心的开发人员提供恶意代码

大型语言模型倾向于“虚构”不存在的代码包,这可能会成为一种新型供应链攻击的基础,这种攻击被赛斯·拉森(Seth Larson,Python软件基金会的驻场安全开发人员)称为“slopsquatting”。 一种已知现象如今,许多软件开发人员使用大型语言模型(LLM)来辅助编程,然而,不幸的是,LLM在回答各种话题的问题时,会编造事实并自信地呈现出来,这一已知倾向也延伸到了编码领域。 这种情况已为人所知一段时间了。
4/16/2025 7:02:00 AM
Zeljka

隐藏在AI工作流程中的悄无声息的数据泄露

随着AI日益融入日常业务流程,数据泄露的风险也随之增加。 Prompt泄露并非罕见个例,而是员工使用大型语言模型时的自然结果。 CISO不能将其视为次要问题。
4/16/2025 7:00:00 AM
Mirko

探索AI+k8s:如何使用Deepseek大模型增强k8s-dashboard

一、导读 Kubernetes(简称K8s)的普及让开发和运维工作变得更加高效,但它的复杂性却让许多人在使用时面临挑战。 从网络配置到故障排查,每一步都需要深入的技术积累。 然而,随着人工智能技术的迅猛发展,借助智能工具,我们可以将许多复杂问题简单化。
4/16/2025 3:25:00 AM
冬子先生

视觉自回归生成理解编辑大一统!北大团队多模态新突破,训练数据代码全面开源

最近Google的Gemini Flash和OpenAI的GPT-4o等先进模型又一次推动了AI浪潮。 这些模型通过整合文本、图像、音频等多种数据形式,实现了更为自然和高效的生成和交互。 北京大学团队继VARGPT实现视觉理解与生成任务统一之后,再度推出了VARGPT-v1.1版本。
4/16/2025 2:55:00 AM

借助Spring AI,快速为AI Agent搭建API网关

本文教大家如何实现一个API网关,以便AI代理(AI Agents)能够访问REST API服务。 一、工具与 AI 代理:大语言模型的得力助手 工具或函数是大语言模型(LLM)用于从提示中识别函数调用的机制。 大语言模型擅长生成自然语言文本,这对人类而言十分友好,但机器需要的是特定答案,二者需求不同。
4/16/2025 1:00:00 AM

认识谷歌 A2A:将颠覆多智能体 AI 系统的协议

近日谷歌在 Cloud Next 25 大会上开源的 Agent2Agent(A2A)协议,无疑成为了该领域一颗耀眼的新星,引发了广泛关注和热议。 这一协议被寄予厚望,有望如同一把神奇的钥匙,开启多智能体 AI 系统高效协作的全新大门,彻底改变当前人工智能应用的格局。 多智能体系统协作之困多智能体系统由多个能够感知环境、自主做出决策并相互协作的智能代理构成,宛如一个庞大而复杂的智能网络。
4/16/2025 12:00:00 AM
大模型之路

今天的智谱,燃炸了!

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)今天的智谱非常了不起,一天内同步发生了三件大事! 每一件事都让界内十分提气! 第一件事,智谱成为了首家启动IPO的“大模型六小龙”公司;第二件事,改了全球域名:z.ai;第三件事,一口气发布且开源了六款模型。
4/15/2025 7:52:04 PM
云昭

地表最强,全面第一!可灵2.0多模态编辑震撼全场!开辟视频模型的“新语言”,Prompt的门槛被砍没了!

出品 | 51CTO技术栈(微信号:blog51cto)今天,可灵全系正式进入2.0时代了! 先来看看2.0动态质量、语义响应、画面美学等维度做了升级,直接看视频是最直观的: 要知道,可灵1.6表现已经相当能打,做到了文生图行业第一,文生视频行业第二的水平。 图片根据发布会介绍,可灵AI全球用户规模突破2200万,过去的10个月里,其月活用户量增长25倍,累计生成超过1.68亿个视频及3.44亿张图片。
4/15/2025 6:07:32 PM

聚焦人工智能-生物-工程交叉融合,一文综述即将到来的「技术创变」浪潮

编辑丨coisini当前,人工智能、机器学习、量子计算、纳米工程、CRISPR 基因编辑等未来塑造型技术正在崛起。 在合成生物技术、信息技术、纳米技术与工程技术的交汇处,涌现出「技术创变」浪潮。 近期一篇题为《The coming wave of confluent biosynthetic, bioinformational and bioengineering technologies》的研究综述聚焦芯片技术与合成生物信息工程融合的最新突破,探究了生物分子作为数字数据存储载体、芯片上细胞、混合半导体及下一代人工智能处理器的发展前景。
4/15/2025 2:55:00 PM
机器之心

30年悬案告破,平均曲率流的奇点真相曝光,揭晓「冰块融化」的数学秘密

一块冰块漂浮在水中,随着时间推移,它会逐渐融化成一个微小的冰粒,最终完全消失。 在这个过程中,冰块表面变得越来越光滑,所有不规则形状和锐利边缘都会逐渐消失。 对于你我来说,这是一个很常见的现象,而数学家们同样致力于理解这一现象,不过是更深奥的角度 —— 他们希望能够精确描述冰块表面或一座被侵蚀的沙堡的形状如何随时间演变。
4/15/2025 1:23:00 PM
机器之心