AI在线 AI在线

理论

生成AI的两大范式:扩散模型与Flow Matching的理论基础与技术比较

生成模型已成为人工智能领域的关键突破,赋予机器创建高度逼真的图像、音频和文本的能力。 在众多生成技术中,扩散模型和Flow Matching尤为引人注目。 这两种方法虽然都致力于在噪声与结构化数据之间建立转换,但其基础原理存在本质区别。
3/20/2025 11:28:34 AM
佚名

融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践

在深度学习的背景下,NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性,导致基础设施资源利用率显著降低。 随着模型规模不断扩大而预算约束日益严格,2-3年更换一次GPU的传统方式已不具可持续性。 但是Pytorch的最近几次的更新可以有效利用异构计算集群,实现对所有可用GPU资源的充分调度,不受制于供应商限制。
3/20/2025 11:22:12 AM
Rafał Siwek

波士顿动力Atlas逆天进化!这次用上了「强化学习+动捕」,人类动作直接复刻,背后还有个AI机构

说起波士顿动力,大家肯定不陌生,他们家的Atlas机器人,也是人形机器人界的“顶流”。 刚刚,Atlas人形机器人又秀了一波新操作,简直太惊人了,动作无限接近人类,大家直接看视频感受一下波士顿动力官方发推表示,Atlas这次展示的是用动作捕捉服开发的强化学习策略。 啥意思呢?
3/20/2025 10:30:35 AM
AI寒武纪

刚刚,OpenAI史上最贵API上线!o1-pro比DeepSeek-R1溢价千倍

史上最贵API上线了! 刚刚,OpenAI终于正式开放了万众期待的o1-pro API,价格非常感人,比o1-mini贵100多倍。 大模型界的劳斯莱斯根据官方定价,o1-pro输入价格150美金/每百万token,输出价格600美金/每百万token。
3/20/2025 10:20:16 AM
新智元

AI预判了你的预判!人大高瓴团队发布TTR,教会AI一眼看穿你的下一步

本文作者均来自中国人民大学高瓴人工智能学院。 其中,第一作者谭文辉是人大高瓴博士生(导师:宋睿华长聘副教授),他的研究兴趣主要在多模态与具身智能。 本文通讯作者为宋睿华长聘副教授,她的团队 AIMind 主要研究方向为多模态感知、生成与交互。
3/20/2025 10:03:44 AM
机器之心

AI 工程师必备:Python 八大人工智能库介绍

Python已经成为人工智能 (AI) 领域的主流编程语言,这得益于其简洁的语法、丰富的社区支持以及大量专门为 AI 设计的库。 这些库提供了各种工具和框架,涵盖了机器学习、深度学习、自然语言处理、计算机视觉等多个方面,极大地简化了 AI 应用的开发过程。 本文将介绍8个常用且功能强大的人工智能库。
3/20/2025 9:48:25 AM
Python数智工坊

刚刚,OpenAI推出最贵o1-pro API!千倍于DeepSeek

刚刚,OpenAI 在其开发者 API 中推出了 o1 推理模型的一个更强大版本,即 o1-pro。 据 OpenAI 称,o1-pro 使用比 o1 更多的计算资源来提供更好的响应。 该功能仅对特定开发者开放(Tier 1–5 开发者),支持视觉、函数调用、结构化输出,并与响应和 Batch API 兼容。
3/20/2025 9:46:06 AM
机器之心

免费托管Khoj:你的个人自主AI应用程序

译者 | 布加迪审校 | 重楼Khoj是你的AI第二大脑,旨在增强大语言模型(LLM)的能力。 它便于你构建自定义代理、调度自动化以及进行深入研究。 有了Khoj,你可以把任何在线或本地托管的LLM变成个人的自主AI助手,并确保隐私和安全。
3/20/2025 9:38:50 AM
布加迪

AI接管新闻界?全球首份全AI报纸问世!AI新闻摘要即将上线

一家意大利报纸《Il Foglio》高调宣布,出版了世界上第一份完全由AI制作的报纸。 AI包揽了写作、标题、引用……甚至讽刺手法。 《Il Foglio》的编辑Claudio Cerasa称,这次发行AI报纸,是一项为期一个月的新闻实验的重要部分,旨在全方位展示AI技术对工作方式以及日常生活的影响。
3/20/2025 9:10:00 AM
新智元

DeepSeek 开源 V3/R1 架构设计思路,原来 545% 的利润率,它也只是被逼无奈?

开源周的最后一天,DeepSeek分享了DeepSeek-V3/R1的架构设计思路,让大家能够更系统更全面的了解其推理系统的设计过程,以及更深刻的理解之前开源的6个项目。 DeepSeek-V3/R1推理系统的核心目标是什么? 通过软件架构的优化,达到:更高的吞吐量;更低的延时;为什么DeepSeek要走这一条路?
3/20/2025 9:00:00 AM
架构师之路

揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍

现在,PD分离已经成为兵家必争之地。 前有Mooncake/DeepSeek等公司采用这种技术来优化大模型的推理服务,后有Nvidia/PyTorch基于该技术孵化下一代LLM服务系统。 甚至最近,黄仁勋也在2025 GTC的舞台上提到了PD分离(Prefill-Decode Disaggregation)技术,进一步证明了这一技术获得的广泛关注。
3/20/2025 9:00:00 AM
新智元

当敏捷团队遇见AI,新的实践由此诞生

译者 | 核子可乐审校 | 重楼自从ChatGPT问世以来,人们就一直在讨论AI技术将如何重塑我们的工作方式。 结合自身需求,我尝试让AI畅想AI驱动方法如何帮助敏捷团队获取深层洞察并提供更具创新性的方案,而它给出的结果也令人大开眼界。 下面我们就一起看看AI眼中新时代下敏捷团队的形态。
3/20/2025 8:25:24 AM
核子可乐

人工智能应用最大的问题是数据问题,而不是技术问题

随着人工智能技术的发展,人工智能也从刚开始的聊天模型变成了能够应用到实际场景中的一项新的技术;而且随着国家大力发展人工智能技术,人工智能就像二十年前的互联网技术一样,充斥着各种机会,但同样也面临着各种各样的挑战。 但是,以个人从事一段时间的人工智能技术应用,以及个人对人工智能技术的了解来看;人工智能目前在实际应用中所存在的主要问题就是数据问题,而不仅仅只是技术问题。 当然,人工智能技术还需要时间继续发展,但以解决实际问题出发,目前的人工智能模型需要大量的行业数据做支撑。
3/20/2025 8:10:00 AM
AI探索时代

营销团队正在引入自己的AI,它正在改变一切

BYO-AI正在改变营销人员分析数据的方式,简化工作流程并减少阻力。 要点:• 营销分析中的AI已超越炒作阶段。 营销人员正在发现AI的实际应用,尤其是在数据分析方面。
3/20/2025 7:20:00 AM
Pierre DeBois

比Manus好使!实测谷歌AI显眼包:三秒唠出一个网页,文件直接开口说相声

编辑 | Sia刚晒完「用嘴 P 图、去水印」的神技,一觉醒来谷歌 Gemini 它又上新了! 大伙儿直接对着电脑屏幕发出一阵,啊! 免费体验传送门: Gemini 网页,对话框里突然蹦出个新玩具:Canvas!
3/19/2025 5:46:00 PM
AI好好用

快了60倍!一秒生“手办”!腾讯开源的混元3DTurbo系列,5G显存搞定!模型加速的“万能”大招——Flash VDM!

出品 | 51CTO技术栈(微信号:blog51cto)腾讯开源日第二天! 在Hunyuan3D-2.0基础上打造的5款模型终于全部现身! 昨天介绍了,多视图版本模型Hunyuan3D-2-mv,以及轻量级 mini 模型Hunyuan3D-2-mini。
3/19/2025 2:24:32 PM

准确率达88%,从随机性走到确定性,AI驱动的小鼠胚胎模型发育预测

编辑丨&干细胞来源的胚胎模型的最新进展改变了发育生物学,提供了对胚胎发生的见解,而不受自然胚胎的限制。 然而,模型开发的多变性对研究标准化来说并不算容易。 德国埃尔斯鲁厄理工学院与美国加州理工学院的科研人员在面对这个问题时,选择使用深度学习来提高选择干细胞衍生胚胎模型的可重复性。
3/19/2025 2:08:00 PM
ScienceAI

Gemini大升级!谷歌引爆程序员革命:编程只需一句话,不到1分钟

谷歌Gemini惊喜不断,再次迎来重磅更新! 之前,Gemini陆续推出了原生图像处理,已被全网玩疯了。 此外,上周推出可免费体验的最新Deep Research,个性化AI助手等功能。
3/19/2025 1:12:14 PM
新智元