应用
英伟达与 MIT、香港大学联手推出 Fast-dLLM 框架,推理速度提升惊人
在最近的科技进展中,英伟达与麻省理工学院(MIT)和香港大学联合推出了名为 Fast-dLLM 的新框架,显著提升了扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍。 这一创新的成果为语言模型的应用开辟了新天地。 扩散模型被视为自回归模型的有力竞争者,采用了双向注意力机制,使其在理论上能够实现多词元同步生成,从而加快解码速度。
6/3/2025 3:00:54 PM
AI在线
提前交付超预期!美国FDA的AI助手Elsa正式上线,药品审查将提速
美国食品药品监督管理局(FDA)今日正式推出名为Elsa的生成式人工智能工具,标志着美国政府部门在AI应用领域迈出重要一步。 该工具的成功部署不仅提前于原定时间表,还实现了预算节约,为政府机构AI转型树立了新标杆。 提前交付的成功案例FDA局长Marty Makary医学博士表示,Elsa的推出比原计划提前且低于预算,这得益于与机构科学审查员此前开展的成功试点计划。
6/3/2025 3:00:54 PM
AI在线
水利部发布首个水利标准 AI 大模型 助力智能化标准管理
近日,中国水利部国科司主办,水利科学研究院自主研发的 “水利标准 AI 大模型” 正式发布。 这一创新成果旨在提升我国水利标准的管理效率,推动水利领域的智能化发展。 该模型的发布标志着我国在水利标准化工具方面迈出了重要的一步。
6/3/2025 3:00:54 PM
AI在线
Salesforce 收购 Moonhub,强化 AI 招聘工具
近日,Salesforce 公司悄然收购了 Moonhub,这是一家专注于招聘和人力资源管理的人工智能初创公司。 虽然收购的具体条款尚未公开,但这一消息引发了业界的广泛关注。 图源备注:图片由AI生成,图片授权服务商Midjourney根据 Moonhub 在其官方网站上发布的声明,公司的整个团队将加入 Salesforce。
6/3/2025 3:00:54 PM
AI在线
万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live
整理丨赖文昕编辑丨陈彩娴VLA(视觉-语言-动作模型)作为具身智能领域的关键新范式,能有效整合视觉信息、语言指令与行动决策,显著提升机器人对复杂环境的理解和适应能力,对推动机器人从单一任务执行向多样化场景自主决策的跨越至关重要 ,已成为当下学术界和工业界炙手可热的研究焦点。 圆桌主持人为北京大学计算机学院助理教授、智源学者仉尚航,并邀请了清华大学交叉信息院助理教授、千寻智能联合创始人高阳,清华大学交叉信息院助理教授、星海图联合创始人赵行,与北京大学人工智能研究院助理教授、北大-灵初智能联合实验室主任杨耀东一起进行了一场深度的讨论。 会上,主持人仉尚航带领讨论 VLA,先是探讨其定义、起源及相关模型区别;接着分析技术路线与新成果,探讨不同路线的优缺点;随后围绕机器人常见任务,剖析核心技术瓶颈与主流输出范式;还研究强化学习结合、泛化能力提升、异构数据利用与协同训练;最后关注落地场景,并探讨执行长程任务的难点与可能。
6/3/2025 2:22:00 PM
赖文昕
英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍
近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。 这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍,为人工智能的应用提供了更为强大的技术支持。 扩散模型的挑战与机遇扩散模型被视为传统自回归模型(Autoregressive Models)的有力竞争者。
6/3/2025 2:00:54 PM
AI在线
智源研究院开源轻量级超长视频理解模型Video-XL-2
近日,智源研究院联合上海交通大学等机构正式发布了一款新一代超长视频理解模型——Video-XL-2。 这一模型的推出标志着长视频理解技术在开源领域取得了重大突破,为多模态大模型在长视频内容理解方面的发展注入了新的活力。 在技术架构方面,Video-XL-2主要由视觉编码器、动态Token合成模块(DTS)以及大语言模型(LLM)三个核心组件构成。
6/3/2025 2:00:54 PM
AI在线
Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理
斯坦福 Hazy Research 团队刚刚公布了一项重量级优化成果:他们将开源模型 Llama-3.2-1B 的前向推理整合成了一个“Megakernel”,并将低延迟推理能力推向了极限。 在某些实时性极高的应用中,例如对话式 AI 和人类参与的交互式工作流中,大语言模型的响应速度不仅重要,甚至可以决定用户体验的成败。 团队认为限制 LLM 推理速度的瓶颈其实是在内存加载的问题上,他们经过研究发现,现有的开源推理引擎(如 vLLM、SGLang),在极低延迟的单序列生成任务下,即使在顶级 GPU(如 H100)上,也只能利用不到 50% 的内存带宽。
6/3/2025 12:49:00 PM
郑佳美
Agent 元年,小厂碎步快跑反超
过去三年,大模型从生成走向理解,从多模态走向执行,让 AI 第一次具备了承接复杂任务链的能力。 到了 2024 年,Agent 概念迅速崛起,成为 AI 应用落地的新焦点。 所以进入 2025 年,越来越多业内人认定——这就是 Agent 元年。
6/3/2025 12:41:00 PM
郑佳美
Character.AI 推出新功能AvatarFX,用户可制作个性化动画视频
在 AI 聊天和角色扮演领域颇具影响力的 Character.AI,近日宣布推出一系列多媒体功能,旨在增强用户体验。 根据该公司周一发布的博客,新的 AvatarFX 工具将允许用户创建自定义动画视频,用户可以将自己的 AI 聊天角色带入新的创作空间。 此外,平台还引入了 “场景(Scenes)” 和 “流(Streams)” 功能,用户能够制作包含角色的视频,并在即将上线的新社交动态中分享。
6/3/2025 12:00:54 PM
AI在线
小米将多枚“Kimi” 商标转让给月之暗面
近日,小米科技有限责任公司将多枚 “Kimi” 商标转让给北京月之暗面科技有限公司。 这一商标最早于2013年申请,目前的状态多为已注册。 小米作为一家在商标保护方面一向积极的企业,曾因商标侵权问题多次通过法律手段维权,此次转让可能是其业务聚焦的战略调整,旨在优化非核心商标资源。
6/3/2025 12:00:54 PM
AI在线
谷歌“试穿”实验席卷美国:上传照片秒变模特,AI让购物超带感!
在近期举办的Google I/O2025大会上,谷歌宣布了其全新AI驱动项目——“试穿”(Try On)实验,并于近日在美国向更多用户开放。 这一功能利用生成式AI技术,让用户通过上传照片即可虚拟试穿服装,显著提升在线购物的便捷性和真实感。 AIbase综合最新网络信息,为您深入解析这一创新实验的亮点及其对电商行业的潜在影响。
6/3/2025 12:00:54 PM
AI在线
软银与英特尔携手打造新型节能 AI 内存芯片,电力消耗或减半
近日,软银与英特尔联合开发了一款全新的 AI 专用内存芯片,旨在大幅降低电力消耗,以便为日本的 AI 基础设施提供更为高效的支持。 根据日经亚洲的报道,双方的合作目标是设计一种新型堆叠式 DRAM 芯片。 这种芯片的布线方式将不同于目前市场上流行的高带宽内存(HBM),预期可以将电力消耗降低约50%。
6/3/2025 12:00:54 PM
AI在线
Console获得 620 万美元融资,利用 AI 解放 IT 团队的重复任务
在现代职场中,IT 支持的重要性不言而喻。 每当员工遇到电脑被锁或无法访问应用程序的情况时,他们总是急切希望能联系到 IT 支持。 然而,帮助台工作人员常常忙于处理其他请求,这可能导致员工无法及时获得所需的支持。
6/3/2025 12:00:54 PM
AI在线
英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍
英伟达联合麻省理工学院(MIT)、香港大学,合作推出 Fast-dLLM 框架,大幅提升扩散模型(Diffusion-based LLMs)的推理速度。
6/3/2025 11:29:46 AM
故渊
Google AI Edge Gallery发布:Gemma 3n加持,本地AI应用开发从未如此简单!
在近期举办的Google I/O2025大会上,Google悄然推出了一款开源项目——Google AI Edge Gallery,一款完全本地运行的生成式AI应用,基于最新的Gemma3n模型,集成了多模态能力,支持文本、图片和音频输入。 这一项目以其高效的端侧AI性能和开源特性,为开发者提供了构建本地化AI应用的理想模板。 Google AI Edge Gallery:端侧AI的开源新标杆Google AI Edge Gallery是一款面向Android(iOS版本即将推出)的实验性应用,允许用户在本地设备上运行来自Hugging Face的多种开源AI模型,无需联网即可实现高效推理。
6/3/2025 11:00:54 AM
AI在线
音乐巨头与AI初创公司Udio和Suno展开版权合作谈判
根据《彭博社》的最新报道,全球知名的音乐公司,包括环球音乐集团、华纳音乐集团和索尼音乐娱乐,正在与两家人工智能初创公司 Udio 和 Suno 进行版权许可谈判。 此次谈判的目的在于建立一个框架,以确保 AI 公司能够合理补偿艺术家的作品使用。 Udio 和 Suno 这两家公司专注于帮助新兴音乐艺术家创作歌曲,只需通过描述声音或歌曲主题的提示,就能生成音频录制。
6/3/2025 11:00:54 AM
AI在线
三星抛弃谷歌Gemini?Galaxy S26将携手Perplexity掀起AI搜索革命
据彭博社最新报道,三星正与AI搜索服务提供商Perplexity就一项重大合作进行谈判,该合作可能彻底改变Galaxy S26系列的AI体验,并对当前由谷歌主导的移动AI格局构成挑战。 从Gemini到Perplexity:三星的AI转向三星此前是谷歌Gemini AI的早期支持者,该技术在很大程度上取代了三星自家的Bixby助手。 然而,新的合作协议显示三星正在寻求更多元化的AI策略。
6/3/2025 11:00:54 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测