AI在线 AI在线

理论

Claude终于能Research了!打通谷歌全家桶,工作效率10倍提升

今天凌晨,Anthropic官方推出了两个重磅新功能:Research以及与Google Workspace集成。 Anthropic称Research功能是与Claude合作的新方式。 它能从多个角度分析问题,自动搜索信息,几分钟之内给出答案。
4/16/2025 1:51:29 PM
新智元

迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

论文标题:Towards Reasoning Era: A Survey of Long Chain-of-Thought for Reasoning Large Language Models论文主页:: 仓库:. 迈向推理时代  900 篇文献揭示长链思维(Long CoT)的前世今生近年来,大模型(Large Language Models, LLMs)在数学、编程等复杂任务上取得突破,OpenAI-o1、DeepSeek-R1 等推理大模型(Reasoning Large Language Models,RLLMs)表现尤为亮眼。 但它们为何如此强大呢?
4/16/2025 1:28:00 PM
机器之心

AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理

大语言模型(LLM)还能涌现什么能力? 这次开源模型Orpheus,直接让LLM涌现人类情感! 对此,Canopy Labs的开源开发者Elias表示Orpheus就像人类一样,已经拥有共情能力,能从文本中产生潜在的线索,比如叹息、欢笑和嗤笑。
4/16/2025 9:46:46 AM
新智元

黄仁勋5000亿豪赌:AI超算首次Made in USA!

英伟达周一抛出重磅消息,宣布将首次在美国制造AI超级计算机。 未来四年内,英伟达将通过与台积电、富士康、纬创资通、安靠(Amkor)和矽品(SPIL)的合作,在美国打造出价值5000亿美元的AI基础设施。 目前,位于亚利桑那州凤凰城的台积电工厂已经率先开工,开始生产Blackwell芯片。
4/16/2025 9:41:46 AM
新智元

永别了,GPT-4!

猝不及防地,GPT-4就这样退出历史舞台了。 4月10日,OpenAI正式宣布,即将从ChatGPT中移除两年前推出的GPT-4。 从4月30日起,GPT-4将被当前的默认模型GPT-4o完全取代。
4/16/2025 9:35:03 AM
新智元

GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的

不过两月,GPT-4.5正式出局,前浪把后浪拍在了沙滩上。 GPT-4.1家族的出世,以更强编码性能,百万token上下文,更具性价比的价格,直接击穿了4.5。 nano版的GPT-4.1性能足以媲美GPT-4o mini,而且速度更快,价格更便宜。
4/16/2025 9:30:16 AM
新智元

英伟达含量为零!华为密集模型性能比肩DeepSeek-R1,纯昇腾集群训练

密集模型的推理能力也能和DeepSeek-R1掰手腕了? 华为利用纯昇腾集群训练出的盘古Ultra,在数学竞赛、编程等推理任务当中,和R1打得有来有回。 关键是模型参数量只有135B,整个训练过程零英伟达含量,而且没有出现损失尖峰。
4/16/2025 8:50:00 AM
量子位

ICLR 2025时间检验奖颁给Adam之父!Bengio「注意力机制」摘亚军

刚刚,ICLR 2025时间检验奖公布! 斩获大奖的是,xAI工程师、Hinton高徒Jimmy Ba发表的Adam优化器。 获得亚军的是,Yoshua Bengio团队提出的「注意力机制」,为Transformer和大模型奠定了基础。
4/16/2025 8:30:00 AM
新智元

从黑箱到透明工厂:Anthropic用回路追踪技术给LLM装上思维监控屏​

译者 | 朱先忠审校 | 重楼引言多年来,基于Transformer的大型语言模型(LLM)在从简单的信息检索系统到能够进行编码、写作、开展研究的复杂智能体等一系列任务上取得了长足的进步。 然而,尽管这些模型功能强大,但它们在很大程度上仍然是黑匣子。 给定输入,它们可以完成任务,但我们缺乏直观的方法来理解任务的具体完成方式。
4/16/2025 8:05:00 AM
朱先忠

人工智能在科学发现中的崛起:AI 能否真正跳出思维定式?

译者 | 涂承烨审校 | 重楼人工智能(AI)正在快速发展,其应用已遍布到医疗、金融、教育和娱乐等行业,而最令人兴奋的领域之一便是科学研究。 AI 处理海量数据、识别复杂模式并做出预测的能力,正在加速科学发现的步伐。 这引发了一个有趣的问题:AI 能否像人类科学家一样跳出思维定式,提出真正新颖的想法?
4/16/2025 8:00:00 AM
涂承烨

软件包幻觉:LLM可能会向粗心的开发人员提供恶意代码

大型语言模型倾向于“虚构”不存在的代码包,这可能会成为一种新型供应链攻击的基础,这种攻击被赛斯·拉森(Seth Larson,Python软件基金会的驻场安全开发人员)称为“slopsquatting”。 一种已知现象如今,许多软件开发人员使用大型语言模型(LLM)来辅助编程,然而,不幸的是,LLM在回答各种话题的问题时,会编造事实并自信地呈现出来,这一已知倾向也延伸到了编码领域。 这种情况已为人所知一段时间了。
4/16/2025 7:02:00 AM
Zeljka

隐藏在AI工作流程中的悄无声息的数据泄露

随着AI日益融入日常业务流程,数据泄露的风险也随之增加。 Prompt泄露并非罕见个例,而是员工使用大型语言模型时的自然结果。 CISO不能将其视为次要问题。
4/16/2025 7:00:00 AM
Mirko

探索AI+k8s:如何使用Deepseek大模型增强k8s-dashboard

一、导读 Kubernetes(简称K8s)的普及让开发和运维工作变得更加高效,但它的复杂性却让许多人在使用时面临挑战。 从网络配置到故障排查,每一步都需要深入的技术积累。 然而,随着人工智能技术的迅猛发展,借助智能工具,我们可以将许多复杂问题简单化。
4/16/2025 3:25:00 AM
冬子先生

视觉自回归生成理解编辑大一统!北大团队多模态新突破,训练数据代码全面开源

最近Google的Gemini Flash和OpenAI的GPT-4o等先进模型又一次推动了AI浪潮。 这些模型通过整合文本、图像、音频等多种数据形式,实现了更为自然和高效的生成和交互。 北京大学团队继VARGPT实现视觉理解与生成任务统一之后,再度推出了VARGPT-v1.1版本。
4/16/2025 2:55:00 AM

借助Spring AI,快速为AI Agent搭建API网关

本文教大家如何实现一个API网关,以便AI代理(AI Agents)能够访问REST API服务。 一、工具与 AI 代理:大语言模型的得力助手 工具或函数是大语言模型(LLM)用于从提示中识别函数调用的机制。 大语言模型擅长生成自然语言文本,这对人类而言十分友好,但机器需要的是特定答案,二者需求不同。
4/16/2025 1:00:00 AM

认识谷歌 A2A:将颠覆多智能体 AI 系统的协议

近日谷歌在 Cloud Next 25 大会上开源的 Agent2Agent(A2A)协议,无疑成为了该领域一颗耀眼的新星,引发了广泛关注和热议。 这一协议被寄予厚望,有望如同一把神奇的钥匙,开启多智能体 AI 系统高效协作的全新大门,彻底改变当前人工智能应用的格局。 多智能体系统协作之困多智能体系统由多个能够感知环境、自主做出决策并相互协作的智能代理构成,宛如一个庞大而复杂的智能网络。
4/16/2025 12:00:00 AM
大模型之路

今天的智谱,燃炸了!

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)今天的智谱非常了不起,一天内同步发生了三件大事! 每一件事都让界内十分提气! 第一件事,智谱成为了首家启动IPO的“大模型六小龙”公司;第二件事,改了全球域名:z.ai;第三件事,一口气发布且开源了六款模型。
4/15/2025 7:52:04 PM
云昭

地表最强,全面第一!可灵2.0多模态编辑震撼全场!开辟视频模型的“新语言”,Prompt的门槛被砍没了!

出品 | 51CTO技术栈(微信号:blog51cto)今天,可灵全系正式进入2.0时代了! 先来看看2.0动态质量、语义响应、画面美学等维度做了升级,直接看视频是最直观的: 要知道,可灵1.6表现已经相当能打,做到了文生图行业第一,文生视频行业第二的水平。 图片根据发布会介绍,可灵AI全球用户规模突破2200万,过去的10个月里,其月活用户量增长25倍,累计生成超过1.68亿个视频及3.44亿张图片。
4/15/2025 6:07:32 PM