理论
生活机器人最后考验!杨笛一团队发布EgoNormia:现实中能否符合社会规范?
随着人工智能技术日益成熟,社会各界对AI或机器人能否学习并遵循社会规范的问题越来越关注。 从早期的科幻小说到如今的现实应用,人类始终期望机器能够理解并内化这些根植于社会生活中的「规范」。 随着视觉语言模型(VLMs)不断进步,研究者们陆续推出了诸多基准和数据集,用以评估其第一视角下的视频理解能力。
3/20/2025 1:02:34 PM
新智元
腾讯超预期成绩单发布!双位数增长,微信收入翻倍!刘炽平:资本支出增长三倍,猛追AI基建,今年将支出千亿投入AI!
出品 | 51CTO技术栈(微信号:blog51cto)3月19日,腾讯公布了2024财年Q4的成绩单。 收入同比增长11%,而利润同比增长90%。 可以说非常亮眼:收入和利润都超出了最高预期,以下是腾讯在2024年第四季度与Refinitiv估计相比的表现:收入:1724亿元人民币(23.9亿美元),预期为168.9亿元。
3/20/2025 12:56:19 PM
宇树机器人侧空翻惊呆网友:“我**想要一个!”
这下特效视频和机器人实拍真的傻傻分不清楚了…前几天机器人卷的还是前后空翻呢,宇树现在连侧空翻都曝出来了。 干拔起跳,落地都不带晃的:以上动作,由宇树的Unitree G1呈现,就是身高1米3,售价9.9万起的那个型号。 宇树官方是酱婶描述的:这是世界上第一款征服站立侧空翻的人形机器人。
3/20/2025 12:11:42 PM
量子位
OpenAI史上最贵模型来了!比DeepSeek贵270倍,100万输出token 600美元
比DeepSeek-R1贵270倍,OpenAI史上最贵模型来了! 就在刚刚,OpenAI上线了推理模型o1-pro的API。 本来大家还挺高兴,结果一看到价格,悬着的心终于死了。
3/20/2025 11:58:29 AM
生成AI的两大范式:扩散模型与Flow Matching的理论基础与技术比较
生成模型已成为人工智能领域的关键突破,赋予机器创建高度逼真的图像、音频和文本的能力。 在众多生成技术中,扩散模型和Flow Matching尤为引人注目。 这两种方法虽然都致力于在噪声与结构化数据之间建立转换,但其基础原理存在本质区别。
3/20/2025 11:28:34 AM
佚名
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
在深度学习的背景下,NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性,导致基础设施资源利用率显著降低。 随着模型规模不断扩大而预算约束日益严格,2-3年更换一次GPU的传统方式已不具可持续性。 但是Pytorch的最近几次的更新可以有效利用异构计算集群,实现对所有可用GPU资源的充分调度,不受制于供应商限制。
3/20/2025 11:22:12 AM
Rafał Siwek
波士顿动力Atlas逆天进化!这次用上了「强化学习+动捕」,人类动作直接复刻,背后还有个AI机构
说起波士顿动力,大家肯定不陌生,他们家的Atlas机器人,也是人形机器人界的“顶流”。 刚刚,Atlas人形机器人又秀了一波新操作,简直太惊人了,动作无限接近人类,大家直接看视频感受一下波士顿动力官方发推表示,Atlas这次展示的是用动作捕捉服开发的强化学习策略。 啥意思呢?
3/20/2025 10:30:35 AM
AI寒武纪
刚刚,OpenAI史上最贵API上线!o1-pro比DeepSeek-R1溢价千倍
史上最贵API上线了! 刚刚,OpenAI终于正式开放了万众期待的o1-pro API,价格非常感人,比o1-mini贵100多倍。 大模型界的劳斯莱斯根据官方定价,o1-pro输入价格150美金/每百万token,输出价格600美金/每百万token。
3/20/2025 10:20:16 AM
新智元
AI预判了你的预判!人大高瓴团队发布TTR,教会AI一眼看穿你的下一步
本文作者均来自中国人民大学高瓴人工智能学院。 其中,第一作者谭文辉是人大高瓴博士生(导师:宋睿华长聘副教授),他的研究兴趣主要在多模态与具身智能。 本文通讯作者为宋睿华长聘副教授,她的团队 AIMind 主要研究方向为多模态感知、生成与交互。
3/20/2025 10:03:44 AM
机器之心
AI 工程师必备:Python 八大人工智能库介绍
Python已经成为人工智能 (AI) 领域的主流编程语言,这得益于其简洁的语法、丰富的社区支持以及大量专门为 AI 设计的库。 这些库提供了各种工具和框架,涵盖了机器学习、深度学习、自然语言处理、计算机视觉等多个方面,极大地简化了 AI 应用的开发过程。 本文将介绍8个常用且功能强大的人工智能库。
3/20/2025 9:48:25 AM
Python数智工坊
刚刚,OpenAI推出最贵o1-pro API!千倍于DeepSeek
刚刚,OpenAI 在其开发者 API 中推出了 o1 推理模型的一个更强大版本,即 o1-pro。 据 OpenAI 称,o1-pro 使用比 o1 更多的计算资源来提供更好的响应。 该功能仅对特定开发者开放(Tier 1–5 开发者),支持视觉、函数调用、结构化输出,并与响应和 Batch API 兼容。
3/20/2025 9:46:06 AM
机器之心
免费托管Khoj:你的个人自主AI应用程序
译者 | 布加迪审校 | 重楼Khoj是你的AI第二大脑,旨在增强大语言模型(LLM)的能力。 它便于你构建自定义代理、调度自动化以及进行深入研究。 有了Khoj,你可以把任何在线或本地托管的LLM变成个人的自主AI助手,并确保隐私和安全。
3/20/2025 9:38:50 AM
布加迪
AI接管新闻界?全球首份全AI报纸问世!AI新闻摘要即将上线
一家意大利报纸《Il Foglio》高调宣布,出版了世界上第一份完全由AI制作的报纸。 AI包揽了写作、标题、引用……甚至讽刺手法。 《Il Foglio》的编辑Claudio Cerasa称,这次发行AI报纸,是一项为期一个月的新闻实验的重要部分,旨在全方位展示AI技术对工作方式以及日常生活的影响。
3/20/2025 9:10:00 AM
新智元
DeepSeek 开源 V3/R1 架构设计思路,原来 545% 的利润率,它也只是被逼无奈?
开源周的最后一天,DeepSeek分享了DeepSeek-V3/R1的架构设计思路,让大家能够更系统更全面的了解其推理系统的设计过程,以及更深刻的理解之前开源的6个项目。 DeepSeek-V3/R1推理系统的核心目标是什么? 通过软件架构的优化,达到:更高的吞吐量;更低的延时;为什么DeepSeek要走这一条路?
3/20/2025 9:00:00 AM
架构师之路
揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍
现在,PD分离已经成为兵家必争之地。 前有Mooncake/DeepSeek等公司采用这种技术来优化大模型的推理服务,后有Nvidia/PyTorch基于该技术孵化下一代LLM服务系统。 甚至最近,黄仁勋也在2025 GTC的舞台上提到了PD分离(Prefill-Decode Disaggregation)技术,进一步证明了这一技术获得的广泛关注。
3/20/2025 9:00:00 AM
新智元
当敏捷团队遇见AI,新的实践由此诞生
译者 | 核子可乐审校 | 重楼自从ChatGPT问世以来,人们就一直在讨论AI技术将如何重塑我们的工作方式。 结合自身需求,我尝试让AI畅想AI驱动方法如何帮助敏捷团队获取深层洞察并提供更具创新性的方案,而它给出的结果也令人大开眼界。 下面我们就一起看看AI眼中新时代下敏捷团队的形态。
3/20/2025 8:25:24 AM
核子可乐
人工智能应用最大的问题是数据问题,而不是技术问题
随着人工智能技术的发展,人工智能也从刚开始的聊天模型变成了能够应用到实际场景中的一项新的技术;而且随着国家大力发展人工智能技术,人工智能就像二十年前的互联网技术一样,充斥着各种机会,但同样也面临着各种各样的挑战。 但是,以个人从事一段时间的人工智能技术应用,以及个人对人工智能技术的了解来看;人工智能目前在实际应用中所存在的主要问题就是数据问题,而不仅仅只是技术问题。 当然,人工智能技术还需要时间继续发展,但以解决实际问题出发,目前的人工智能模型需要大量的行业数据做支撑。
3/20/2025 8:10:00 AM
AI探索时代
营销团队正在引入自己的AI,它正在改变一切
BYO-AI正在改变营销人员分析数据的方式,简化工作流程并减少阻力。 要点:• 营销分析中的AI已超越炒作阶段。 营销人员正在发现AI的实际应用,尤其是在数据分析方面。
3/20/2025 7:20:00 AM
Pierre DeBois
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind