英伟达
SDS 技术首次用于音频:英伟达携手 MIT 推 Audio-SDS,参数化控制 AI 音效生成
SDS 技术广泛应用于文本生成 3D 图像和图像编辑中,英伟达融合该技术推出 Audio-SDS,结合预训练模型的生成先验知识,能够直接根据高级文本提示调整 FM 合成参数、冲击音模拟器或分离掩码,将信号处理的清晰可解释性与现代扩散模型的灵活性融为一体。
英伟达开源 OCR 代码推理 AI 模型:LiveCodeBench 基准超 OpenAI o3-Mini 和 o1(low)
英伟达开源其 Open Code Reasoning(OCR)模型套装,含 32B、14B 和 7B 三种参数规模,均采用 Apache 2.0 许可证发布,模型权重和配置已在 Hugging Face 平台开放下载。
全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍
DeepSeek的含金量还在上升。 就在最近,Hugging Face联创、首席科学家Thomas Wolf表示——DeepSeek的出现,是开源AI领域的ChatGPT时刻! 用他的话说,「正如ChatGPT让全世界认识到AI的存在,DeepSeek则让全世界意识到,原来还有着这样一个充满活力的开源社区。
黄仁勋揭秘自己如何用 AI 学习:先让“老师”把自己当成 12 岁小孩
黄仁勋表示:“我每天都在用它们学习。对那些我不熟悉的领域,我会先让 AI 用‘给12岁小孩讲解’的方式开始解释,之后再逐步深入到博士水平。
英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05%
英伟达最新推出 Parakeet TDT 0.6B,是一款先进的自动语音识别(ASR)模型,已在 Hugging Face 平台上完全开源。
公开模型一切,优于DeepSeek-R1,英伟达开源Llama-Nemotron家族
在大模型飞速发展的今天,推理能力作为衡量模型智能的关键指标,更是各家 AI 企业竞相追逐的焦点。 但近年来,推理效率已成为模型部署和性能的关键限制因素。 基于此,英伟达推出了 Llama-Nemotron 系列模型(基于 Meta AI 的 Llama 模型构建)—— 一个面向高效推理的大模型开放家族,具备卓越的推理能力、推理效率,并采用对企业友好的开放许可方式。
计算的未来:英伟达王冠正摇摇欲坠
作者丨朱可轩编辑丨陈彩娴大模型浪潮来袭后,2023 年英伟达数据中心的 GPU 出货量总计约 376 万台,较之上一年的 264 万台增长 100 多万台,并成为历史上规模增长最快的硬件公司。 据估计,2025 年英伟达销量将达到 650 万至 700 万块 GPU。 目前情况来看,英伟达在 GPU 上的垄断局面仍在持续,然而,其长期持久性(6 年)的问题仍在被持续热议。
Meta与英伟达、惠普联手打造太空AI项目 “Space Llama”
在最新的科技突破中,Meta 宣布与英伟达和惠普合作推出名为 “Space Llama” 的人工智能项目。 该项目旨在为国际空间站国家实验室的宇航员研究提供支持,利用 AI 技术帮助他们在太空环境中进行更高效的工作。 “Space Llama” 项目的核心目标是降低成本,减少计算需求,并能够快速响应宇航员在太空中遇到的各种问题。
英伟达华人硬核AI神器,「描述一切」秒变细节狂魔!仅3B逆袭GPT-4o
有了AI,谁还愿意用手配「字幕」? 刚刚,英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model(DAM),仅3B参数。 论文地址: Anything,上传一张图,圈哪点哪,它即可生成一段丰富的文字描述。
英伟达AI奥赛夺冠,1.5B数学碾压DeepSeek-R1!代码全系开源,陶哲轩点赞
AI数学奥赛第一名「答卷」终于公布! NVIDIA公布并开源了他们的冠军模型OpenMath-Nemotron系列! 论文地址:、软件工程师Chan Kha Vu,则盛赞道:这些模型太不可思议了!
英伟达开源「描述一切」模型,拿下7个基准SOTA
图像描述(image captioning)生成一直是计算机视觉和自然语言处理领域面临的长期挑战,因为它涉及理解和用自然语言描述视觉内容。 虽然近期的视觉语言模型 (VLM) 在图像级描述生成方面取得了令人瞩目的成果,但如何为图像中的特定区域生成详细准确的描述仍然是一个悬而未决的问题。 这一挑战在视频领域尤为突出,因为模型必须额外捕捉动态视觉内容,例如人类动作、物体运动以及人与物体的交互。
AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型,刷新 AIME 准确率纪录
科技媒体 marktechpost 今天(4 月 25 日)发布博文,报道称英伟达专为数学推理设计,发布 OpenMath-Nemotron-32B和OpenMath-Nemotron-14B-Kaggle 两款先进 AI 模型。
英伟达推 DAM-3B 模型:突破局部描述难题,让 AI 看懂图像 / 视频每一个角落
NVIDIA最新发布Describe Anything 3B(DAM-3B)模型,专门针对图像和视频中特定区域的详细描述难题设计。这款多模态大语言模型能通过点、边界框、涂鸦或掩码等方式锁定目标区域,生成贴合上下文的描述文本。
英伟达发布 Eagle 2.5 视觉语言 AI 模型:8B 参数媲美 GPT-4o
该模型专注于理解大规模视频和图像,尤其擅长处理高分辨率图像和长视频序列。尽管参数规模仅为 8B,Eagle 2.5 在 Video-MME 基准测试(512 帧输入)中得分高达 72.4%,接近甚至媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大规模模型。
突发!特朗普禁止英伟达,向DeepSeek等提供AI芯片
华尔街日报消息,特朗普政府已禁止在无许可证的情况下,向中国出售H20等AI芯片。 未来的相关销售也将需要许可证,这是特朗普政府首次对半导体海外销售实施重大限制,强化了拜登政府此前制定的规则。 由于该政策的实施,英伟达股票遭遇重创下跌了5%左右,并且季度营收会因无法按原计划销售损失55亿美元。
黄仁勋5000亿豪赌:AI超算首次Made in USA!
英伟达周一抛出重磅消息,宣布将首次在美国制造AI超级计算机。 未来四年内,英伟达将通过与台积电、富士康、纬创资通、安靠(Amkor)和矽品(SPIL)的合作,在美国打造出价值5000亿美元的AI基础设施。 目前,位于亚利桑那州凤凰城的台积电工厂已经率先开工,开始生产Blackwell芯片。
押注万亿美元AI未来:英伟达首次在本土打造AI超级计算机
人工智能芯片巨头英伟达宣布,将与制造合作伙伴合作,首次在美国本土设计和建造其AI超级计算机,标志着该公司在供应链战略上迈出重要一步。 英伟达已委托超过一百万平方英尺的制造空间,用于在亚利桑那州生产和测试其最新的Blackwell AI芯片,并在德克萨斯州制造和测试AI超级计算机。 英伟达的生态系统合作伙伴预计将投入5亿美元用于支持这些AI基础设施的建设。
英伟达计划在美国制造 AI 芯片,布局本土生产
近日,英伟达宣布将在美国亚利桑那州和德克萨斯州建立超过一百万平方英尺的制造空间,用于生产和测试 AI 芯片。 这是英伟达推动部分生产回归美国的一项重要举措。 据悉,英伟达的 Blackwell 芯片已经在台积电位于亚利桑那州的工厂开始生产。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉