英伟达
英伟达发布 GR00T N1.5 人形机器人 AI 基础模型,黄仁勋称将推动“下一代工业革命”
在 2025 台北国际电脑展上,英伟达首席执行官黄仁勋宣布大幅扩展机器人开发基础设施,推出人形机器人基础模型 Isaac GR00T N1.5 新版,并称其将推动“下一代工业革命”。
5/20/2025 1:51:31 PM
故渊
英伟达新“桌面超算”800GB大内存,满血DeepSeek R1能装1个半
英伟达官宣新办公室落户中国台湾省台北市,但居然是从太空飞下来的吗? 当然,这只是黄仁勋在Computex大会上展示的CG特效,但背后还有这样一层意思:如此逼真的画面中,只有1/10的像素是显卡渲染的,剩下全部内容为AI预测。 当初是GeForce显卡让AI成为现实,现在AI反过来给GeForce显卡带来颠覆性变革。
5/20/2025 9:02:00 AM
Switch 2芯片细节曝光!英伟达专门定制支持DLSS,网友:掌机模式相当于PS4
Switch 2处理器,细节被实锤! 数毛社(Digital Foundry)消息,已经确定Switch 2采用的是英伟达真·定制版芯片,包含8核CPU和12GB LPDDR5X内存。 GPU则基于Ampere架构,和30系显卡同款,拥有1536个CUDA核心,支持DLSS。
5/15/2025 2:40:24 PM
英伟达发布新 RL 范式:受 DeepSeek-R1 启发,重塑 AI 模型外部工具能力
英伟达联合推出 Nemotron-Research-Tool-N1 系列模型,受 DeepSeek-R1 启发,采用新型强化学习(RL)范式,强化模型推理能力。
5/14/2025 2:03:30 PM
故渊
SDS 技术首次用于音频:英伟达携手 MIT 推 Audio-SDS,参数化控制 AI 音效生成
SDS 技术广泛应用于文本生成 3D 图像和图像编辑中,英伟达融合该技术推出 Audio-SDS,结合预训练模型的生成先验知识,能够直接根据高级文本提示调整 FM 合成参数、冲击音模拟器或分离掩码,将信号处理的清晰可解释性与现代扩散模型的灵活性融为一体。
5/13/2025 2:15:09 PM
故渊
英伟达开源 OCR 代码推理 AI 模型:LiveCodeBench 基准超 OpenAI o3-Mini 和 o1(low)
英伟达开源其 Open Code Reasoning(OCR)模型套装,含 32B、14B 和 7B 三种参数规模,均采用 Apache 2.0 许可证发布,模型权重和配置已在 Hugging Face 平台开放下载。
5/9/2025 2:28:51 PM
故渊
全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍
DeepSeek的含金量还在上升。 就在最近,Hugging Face联创、首席科学家Thomas Wolf表示——DeepSeek的出现,是开源AI领域的ChatGPT时刻! 用他的话说,「正如ChatGPT让全世界认识到AI的存在,DeepSeek则让全世界意识到,原来还有着这样一个充满活力的开源社区。
5/9/2025 8:55:00 AM
新智元
黄仁勋揭秘自己如何用 AI 学习:先让“老师”把自己当成 12 岁小孩
黄仁勋表示:“我每天都在用它们学习。对那些我不熟悉的领域,我会先让 AI 用‘给12岁小孩讲解’的方式开始解释,之后再逐步深入到博士水平。
5/7/2025 3:27:01 PM
清源
英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05%
英伟达最新推出 Parakeet TDT 0.6B,是一款先进的自动语音识别(ASR)模型,已在 Hugging Face 平台上完全开源。
5/7/2025 1:46:23 PM
故渊
公开模型一切,优于DeepSeek-R1,英伟达开源Llama-Nemotron家族
在大模型飞速发展的今天,推理能力作为衡量模型智能的关键指标,更是各家 AI 企业竞相追逐的焦点。 但近年来,推理效率已成为模型部署和性能的关键限制因素。 基于此,英伟达推出了 Llama-Nemotron 系列模型(基于 Meta AI 的 Llama 模型构建)—— 一个面向高效推理的大模型开放家族,具备卓越的推理能力、推理效率,并采用对企业友好的开放许可方式。
5/7/2025 10:12:52 AM
机器之心
计算的未来:英伟达王冠正摇摇欲坠
作者丨朱可轩编辑丨陈彩娴大模型浪潮来袭后,2023 年英伟达数据中心的 GPU 出货量总计约 376 万台,较之上一年的 264 万台增长 100 多万台,并成为历史上规模增长最快的硬件公司。 据估计,2025 年英伟达销量将达到 650 万至 700 万块 GPU。 目前情况来看,英伟达在 GPU 上的垄断局面仍在持续,然而,其长期持久性(6 年)的问题仍在被持续热议。
4/30/2025 6:03:00 PM
朱可轩
Meta与英伟达、惠普联手打造太空AI项目 “Space Llama”
在最新的科技突破中,Meta 宣布与英伟达和惠普合作推出名为 “Space Llama” 的人工智能项目。 该项目旨在为国际空间站国家实验室的宇航员研究提供支持,利用 AI 技术帮助他们在太空环境中进行更高效的工作。 “Space Llama” 项目的核心目标是降低成本,减少计算需求,并能够快速响应宇航员在太空中遇到的各种问题。
4/28/2025 10:01:33 AM
AI在线
英伟达华人硬核AI神器,「描述一切」秒变细节狂魔!仅3B逆袭GPT-4o
有了AI,谁还愿意用手配「字幕」? 刚刚,英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model(DAM),仅3B参数。 论文地址: Anything,上传一张图,圈哪点哪,它即可生成一段丰富的文字描述。
4/27/2025 9:54:48 AM
英伟达AI奥赛夺冠,1.5B数学碾压DeepSeek-R1!代码全系开源,陶哲轩点赞
AI数学奥赛第一名「答卷」终于公布! NVIDIA公布并开源了他们的冠军模型OpenMath-Nemotron系列! 论文地址:、软件工程师Chan Kha Vu,则盛赞道:这些模型太不可思议了!
4/27/2025 8:54:00 AM
新智元
英伟达开源「描述一切」模型,拿下7个基准SOTA
图像描述(image captioning)生成一直是计算机视觉和自然语言处理领域面临的长期挑战,因为它涉及理解和用自然语言描述视觉内容。 虽然近期的视觉语言模型 (VLM) 在图像级描述生成方面取得了令人瞩目的成果,但如何为图像中的特定区域生成详细准确的描述仍然是一个悬而未决的问题。 这一挑战在视频领域尤为突出,因为模型必须额外捕捉动态视觉内容,例如人类动作、物体运动以及人与物体的交互。
4/27/2025 8:30:00 AM
机器之心
AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型,刷新 AIME 准确率纪录
科技媒体 marktechpost 今天(4 月 25 日)发布博文,报道称英伟达专为数学推理设计,发布 OpenMath-Nemotron-32B和OpenMath-Nemotron-14B-Kaggle 两款先进 AI 模型。
4/25/2025 3:07:09 PM
故渊
英伟达推 DAM-3B 模型:突破局部描述难题,让 AI 看懂图像 / 视频每一个角落
NVIDIA最新发布Describe Anything 3B(DAM-3B)模型,专门针对图像和视频中特定区域的详细描述难题设计。这款多模态大语言模型能通过点、边界框、涂鸦或掩码等方式锁定目标区域,生成贴合上下文的描述文本。
4/24/2025 1:40:26 PM
故渊
英伟达发布 Eagle 2.5 视觉语言 AI 模型:8B 参数媲美 GPT-4o
该模型专注于理解大规模视频和图像,尤其擅长处理高分辨率图像和长视频序列。尽管参数规模仅为 8B,Eagle 2.5 在 Video-MME 基准测试(512 帧输入)中得分高达 72.4%,接近甚至媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大规模模型。
4/23/2025 2:20:25 PM
故渊
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊