理论
Claude终于能Research了!打通谷歌全家桶,工作效率10倍提升
今天凌晨,Anthropic官方推出了两个重磅新功能:Research以及与Google Workspace集成。 Anthropic称Research功能是与Claude合作的新方式。 它能从多个角度分析问题,自动搜索信息,几分钟之内给出答案。
4/16/2025 1:51:29 PM
新智元
迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了
论文标题:Towards Reasoning Era: A Survey of Long Chain-of-Thought for Reasoning Large Language Models论文主页:: 仓库:. 迈向推理时代 900 篇文献揭示长链思维(Long CoT)的前世今生近年来,大模型(Large Language Models, LLMs)在数学、编程等复杂任务上取得突破,OpenAI-o1、DeepSeek-R1 等推理大模型(Reasoning Large Language Models,RLLMs)表现尤为亮眼。 但它们为何如此强大呢?
4/16/2025 1:28:00 PM
机器之心
AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理
大语言模型(LLM)还能涌现什么能力? 这次开源模型Orpheus,直接让LLM涌现人类情感! 对此,Canopy Labs的开源开发者Elias表示Orpheus就像人类一样,已经拥有共情能力,能从文本中产生潜在的线索,比如叹息、欢笑和嗤笑。
4/16/2025 9:46:46 AM
新智元
黄仁勋5000亿豪赌:AI超算首次Made in USA!
英伟达周一抛出重磅消息,宣布将首次在美国制造AI超级计算机。 未来四年内,英伟达将通过与台积电、富士康、纬创资通、安靠(Amkor)和矽品(SPIL)的合作,在美国打造出价值5000亿美元的AI基础设施。 目前,位于亚利桑那州凤凰城的台积电工厂已经率先开工,开始生产Blackwell芯片。
4/16/2025 9:41:46 AM
新智元
永别了,GPT-4!
猝不及防地,GPT-4就这样退出历史舞台了。 4月10日,OpenAI正式宣布,即将从ChatGPT中移除两年前推出的GPT-4。 从4月30日起,GPT-4将被当前的默认模型GPT-4o完全取代。
4/16/2025 9:35:03 AM
新智元
GPT-4.1全网实测来袭,惨遭谷歌Gemini碾压!大佬猜测:从GPT-4.5蒸馏的
不过两月,GPT-4.5正式出局,前浪把后浪拍在了沙滩上。 GPT-4.1家族的出世,以更强编码性能,百万token上下文,更具性价比的价格,直接击穿了4.5。 nano版的GPT-4.1性能足以媲美GPT-4o mini,而且速度更快,价格更便宜。
4/16/2025 9:30:16 AM
新智元
英伟达含量为零!华为密集模型性能比肩DeepSeek-R1,纯昇腾集群训练
密集模型的推理能力也能和DeepSeek-R1掰手腕了? 华为利用纯昇腾集群训练出的盘古Ultra,在数学竞赛、编程等推理任务当中,和R1打得有来有回。 关键是模型参数量只有135B,整个训练过程零英伟达含量,而且没有出现损失尖峰。
4/16/2025 8:50:00 AM
量子位
ICLR 2025时间检验奖颁给Adam之父!Bengio「注意力机制」摘亚军
刚刚,ICLR 2025时间检验奖公布! 斩获大奖的是,xAI工程师、Hinton高徒Jimmy Ba发表的Adam优化器。 获得亚军的是,Yoshua Bengio团队提出的「注意力机制」,为Transformer和大模型奠定了基础。
4/16/2025 8:30:00 AM
新智元
从黑箱到透明工厂:Anthropic用回路追踪技术给LLM装上思维监控屏
译者 | 朱先忠审校 | 重楼引言多年来,基于Transformer的大型语言模型(LLM)在从简单的信息检索系统到能够进行编码、写作、开展研究的复杂智能体等一系列任务上取得了长足的进步。 然而,尽管这些模型功能强大,但它们在很大程度上仍然是黑匣子。 给定输入,它们可以完成任务,但我们缺乏直观的方法来理解任务的具体完成方式。
4/16/2025 8:05:00 AM
朱先忠
人工智能在科学发现中的崛起:AI 能否真正跳出思维定式?
译者 | 涂承烨审校 | 重楼人工智能(AI)正在快速发展,其应用已遍布到医疗、金融、教育和娱乐等行业,而最令人兴奋的领域之一便是科学研究。 AI 处理海量数据、识别复杂模式并做出预测的能力,正在加速科学发现的步伐。 这引发了一个有趣的问题:AI 能否像人类科学家一样跳出思维定式,提出真正新颖的想法?
4/16/2025 8:00:00 AM
涂承烨
软件包幻觉:LLM可能会向粗心的开发人员提供恶意代码
大型语言模型倾向于“虚构”不存在的代码包,这可能会成为一种新型供应链攻击的基础,这种攻击被赛斯·拉森(Seth Larson,Python软件基金会的驻场安全开发人员)称为“slopsquatting”。 一种已知现象如今,许多软件开发人员使用大型语言模型(LLM)来辅助编程,然而,不幸的是,LLM在回答各种话题的问题时,会编造事实并自信地呈现出来,这一已知倾向也延伸到了编码领域。 这种情况已为人所知一段时间了。
4/16/2025 7:02:00 AM
Zeljka
隐藏在AI工作流程中的悄无声息的数据泄露
随着AI日益融入日常业务流程,数据泄露的风险也随之增加。 Prompt泄露并非罕见个例,而是员工使用大型语言模型时的自然结果。 CISO不能将其视为次要问题。
4/16/2025 7:00:00 AM
Mirko
探索AI+k8s:如何使用Deepseek大模型增强k8s-dashboard
一、导读 Kubernetes(简称K8s)的普及让开发和运维工作变得更加高效,但它的复杂性却让许多人在使用时面临挑战。 从网络配置到故障排查,每一步都需要深入的技术积累。 然而,随着人工智能技术的迅猛发展,借助智能工具,我们可以将许多复杂问题简单化。
4/16/2025 3:25:00 AM
冬子先生
视觉自回归生成理解编辑大一统!北大团队多模态新突破,训练数据代码全面开源
最近Google的Gemini Flash和OpenAI的GPT-4o等先进模型又一次推动了AI浪潮。 这些模型通过整合文本、图像、音频等多种数据形式,实现了更为自然和高效的生成和交互。 北京大学团队继VARGPT实现视觉理解与生成任务统一之后,再度推出了VARGPT-v1.1版本。
4/16/2025 2:55:00 AM
借助Spring AI,快速为AI Agent搭建API网关
本文教大家如何实现一个API网关,以便AI代理(AI Agents)能够访问REST API服务。 一、工具与 AI 代理:大语言模型的得力助手 工具或函数是大语言模型(LLM)用于从提示中识别函数调用的机制。 大语言模型擅长生成自然语言文本,这对人类而言十分友好,但机器需要的是特定答案,二者需求不同。
4/16/2025 1:00:00 AM
认识谷歌 A2A:将颠覆多智能体 AI 系统的协议
近日谷歌在 Cloud Next 25 大会上开源的 Agent2Agent(A2A)协议,无疑成为了该领域一颗耀眼的新星,引发了广泛关注和热议。 这一协议被寄予厚望,有望如同一把神奇的钥匙,开启多智能体 AI 系统高效协作的全新大门,彻底改变当前人工智能应用的格局。 多智能体系统协作之困多智能体系统由多个能够感知环境、自主做出决策并相互协作的智能代理构成,宛如一个庞大而复杂的智能网络。
4/16/2025 12:00:00 AM
大模型之路
今天的智谱,燃炸了!
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)今天的智谱非常了不起,一天内同步发生了三件大事! 每一件事都让界内十分提气! 第一件事,智谱成为了首家启动IPO的“大模型六小龙”公司;第二件事,改了全球域名:z.ai;第三件事,一口气发布且开源了六款模型。
4/15/2025 7:52:04 PM
云昭
地表最强,全面第一!可灵2.0多模态编辑震撼全场!开辟视频模型的“新语言”,Prompt的门槛被砍没了!
出品 | 51CTO技术栈(微信号:blog51cto)今天,可灵全系正式进入2.0时代了! 先来看看2.0动态质量、语义响应、画面美学等维度做了升级,直接看视频是最直观的: 要知道,可灵1.6表现已经相当能打,做到了文生图行业第一,文生视频行业第二的水平。 图片根据发布会介绍,可灵AI全球用户规模突破2200万,过去的10个月里,其月活用户量增长25倍,累计生成超过1.68亿个视频及3.44亿张图片。
4/15/2025 6:07:32 PM
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
LLaMA
Copilot
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind