AI在线 AI在线

资讯列表

英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍

近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。 这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍,为人工智能的应用提供了更为强大的技术支持。  扩散模型的挑战与机遇扩散模型被视为传统自回归模型(Autoregressive Models)的有力竞争者。
6/3/2025 2:00:54 PM
AI在线

智源研究院开源轻量级超长视频理解模型Video-XL-2

近日,智源研究院联合上海交通大学等机构正式发布了一款新一代超长视频理解模型——Video-XL-2。 这一模型的推出标志着长视频理解技术在开源领域取得了重大突破,为多模态大模型在长视频内容理解方面的发展注入了新的活力。 在技术架构方面,Video-XL-2主要由视觉编码器、动态Token合成模块(DTS)以及大语言模型(LLM)三个核心组件构成。
6/3/2025 2:00:54 PM
AI在线

终于可以免费使用Sora了!微软版Sora今日开放

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)微软 Bing 越来越不像搜索了! 微软周一宣布,将在 Bing 应用程序中引入视频创建器 (Bing Video Creator ),该应用程序使用 OpenAI 的 Sora 模型让用户根据文本提示生成视频。 更重要的是,这也就意味着一直以来只有付费用户才能使用的 Sora 视频生成功能,而现在,Sora 与微软必应的集成标志着其首次免费开放。
6/3/2025 1:26:52 PM
云昭

Gartner高级顾问总监:从生产力陷阱到财务效率的理性转向,生成式AI的降本困境与破局之道

谈到2025年科技圈的热点,非生成式AI莫属。 可以说,生成式AI已经成为推动企业业务创新和数字化转型的核心焦点。 根据Gartner调研显示,过去两年中,全球企业IT预算持续收缩,但AI与安全领域的投入逆势增长。
6/3/2025 1:21:37 PM

X和OpenAI加入Rust重写潮!马斯克宣布:基于Rust的X有了“比特币风格加密”,惨被币圈技术大佬群嘲:根本不懂!

马斯克又放大招了——这次轮到 X 也加入 Rust 重写潮了! 他宣布,X 内置的私信功能 XChat 已经完成 Rust 重构,并声称采用了“比特币风格加密”。 图片这句“比特币风格加密”,听上去是一种“不明觉厉”的术语,普通用户只觉得大概是更安全了,而玩币圈的技术党则一头雾水。
6/3/2025 1:00:12 PM
云昭

Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理

斯坦福 Hazy Research 团队刚刚公布了一项重量级优化成果:他们将开源模型 Llama-3.2-1B 的前向推理整合成了一个“Megakernel”,并将低延迟推理能力推向了极限。 在某些实时性极高的应用中,例如对话式 AI 和人类参与的交互式工作流中,大语言模型的响应速度不仅重要,甚至可以决定用户体验的成败。 团队认为限制 LLM 推理速度的瓶颈其实是在内存加载的问题上,他们经过研究发现,现有的开源推理引擎(如 vLLM、SGLang),在极低延迟的单序列生成任务下,即使在顶级 GPU(如 H100)上,也只能利用不到 50% 的内存带宽。
6/3/2025 12:49:00 PM
郑佳美

Agent 元年,小厂碎步快跑反超

过去三年,大模型从生成走向理解,从多模态走向执行,让 AI 第一次具备了承接复杂任务链的能力。 到了 2024 年,Agent 概念迅速崛起,成为 AI 应用落地的新焦点。 所以进入 2025 年,越来越多业内人认定——这就是 Agent 元年。
6/3/2025 12:41:00 PM
郑佳美

​Character.AI 推出新功能AvatarFX,用户可制作个性化动画视频

在 AI 聊天和角色扮演领域颇具影响力的 Character.AI,近日宣布推出一系列多媒体功能,旨在增强用户体验。 根据该公司周一发布的博客,新的 AvatarFX 工具将允许用户创建自定义动画视频,用户可以将自己的 AI 聊天角色带入新的创作空间。 此外,平台还引入了 “场景(Scenes)” 和 “流(Streams)” 功能,用户能够制作包含角色的视频,并在即将上线的新社交动态中分享。
6/3/2025 12:00:54 PM
AI在线

小米将多枚“Kimi” 商标转让给月之暗面

近日,小米科技有限责任公司将多枚 “Kimi” 商标转让给北京月之暗面科技有限公司。 这一商标最早于2013年申请,目前的状态多为已注册。 小米作为一家在商标保护方面一向积极的企业,曾因商标侵权问题多次通过法律手段维权,此次转让可能是其业务聚焦的战略调整,旨在优化非核心商标资源。
6/3/2025 12:00:54 PM
AI在线

谷歌“试穿”实验席卷美国:上传照片秒变模特,AI让购物超带感!

在近期举办的Google I/O2025大会上,谷歌宣布了其全新AI驱动项目——“试穿”(Try On)实验,并于近日在美国向更多用户开放。 这一功能利用生成式AI技术,让用户通过上传照片即可虚拟试穿服装,显著提升在线购物的便捷性和真实感。 AIbase综合最新网络信息,为您深入解析这一创新实验的亮点及其对电商行业的潜在影响。
6/3/2025 12:00:54 PM
AI在线

​软银与英特尔携手打造新型节能 AI 内存芯片,电力消耗或减半

近日,软银与英特尔联合开发了一款全新的 AI 专用内存芯片,旨在大幅降低电力消耗,以便为日本的 AI 基础设施提供更为高效的支持。 根据日经亚洲的报道,双方的合作目标是设计一种新型堆叠式 DRAM 芯片。 这种芯片的布线方式将不同于目前市场上流行的高带宽内存(HBM),预期可以将电力消耗降低约50%。
6/3/2025 12:00:54 PM
AI在线

Console获得 620 万美元融资,利用 AI 解放 IT 团队的重复任务

在现代职场中,IT 支持的重要性不言而喻。 每当员工遇到电脑被锁或无法访问应用程序的情况时,他们总是急切希望能联系到 IT 支持。 然而,帮助台工作人员常常忙于处理其他请求,这可能导致员工无法及时获得所需的支持。
6/3/2025 12:00:54 PM
AI在线

英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍

英伟达联合麻省理工学院(MIT)、香港大学,合作推出 Fast-dLLM 框架,大幅提升扩散模型(Diffusion-based LLMs)的推理速度。
6/3/2025 11:29:46 AM
故渊

Google AI Edge Gallery发布:Gemma 3n加持,本地AI应用开发从未如此简单!

在近期举办的Google I/O2025大会上,Google悄然推出了一款开源项目——Google AI Edge Gallery,一款完全本地运行的生成式AI应用,基于最新的Gemma3n模型,集成了多模态能力,支持文本、图片和音频输入。 这一项目以其高效的端侧AI性能和开源特性,为开发者提供了构建本地化AI应用的理想模板。 Google AI Edge Gallery:端侧AI的开源新标杆Google AI Edge Gallery是一款面向Android(iOS版本即将推出)的实验性应用,允许用户在本地设备上运行来自Hugging Face的多种开源AI模型,无需联网即可实现高效推理。
6/3/2025 11:00:54 AM
AI在线

​音乐巨头与AI初创公司Udio和Suno展开版权合作谈判

根据《彭博社》的最新报道,全球知名的音乐公司,包括环球音乐集团、华纳音乐集团和索尼音乐娱乐,正在与两家人工智能初创公司 Udio 和 Suno 进行版权许可谈判。 此次谈判的目的在于建立一个框架,以确保 AI 公司能够合理补偿艺术家的作品使用。 Udio 和 Suno 这两家公司专注于帮助新兴音乐艺术家创作歌曲,只需通过描述声音或歌曲主题的提示,就能生成音频录制。
6/3/2025 11:00:54 AM
AI在线

三星抛弃谷歌Gemini?Galaxy S26将携手Perplexity掀起AI搜索革命

据彭博社最新报道,三星正与AI搜索服务提供商Perplexity就一项重大合作进行谈判,该合作可能彻底改变Galaxy S26系列的AI体验,并对当前由谷歌主导的移动AI格局构成挑战。 从Gemini到Perplexity:三星的AI转向三星此前是谷歌Gemini AI的早期支持者,该技术在很大程度上取代了三星自家的Bixby助手。 然而,新的合作协议显示三星正在寻求更多元化的AI策略。
6/3/2025 11:00:54 AM
AI在线

云数据平台 Snowflake 宣布收购数据库初创公司 Crunchy Data

云数据平台 Snowflake 于6月2日宣布计划收购数据库初创公司 Crunchy Data。 该交易的估值约为2.5亿美元,尽管具体条款尚未披露,但这一收购被视为 Snowflake 在数据市场不断扩张的重要一步。 图源备注:图片由AI生成,图片授权服务商MidjourneyCrunchy Data 成立于13年前,是一家专注于 Postgres 的数据库合作伙伴,提供开发者所需的工具来构建基于 Postgres 的应用程序。
6/3/2025 11:00:54 AM
AI在线

ElevenLabs推全新语音交互平台Conversational AI 2.0:AI语音助手比真人还懂你

近日,ElevenLabs正式推出了其全新一代语音交互平台Conversational AI2.0,以更自然、更智能、更高效的语音交互体验引发业界热议。 这一升级版本在对话流畅性、多语言支持和企业级应用能力上实现重大突破,不仅能精准捕捉用户对话节奏,还能无缝切换多语言并从企业知识库提取信息,为客服、营销和内容创作等领域带来全新可能。 自然对话新体验:告别尴尬中断Conversational AI2.0引入了先进的轮流对话模型,通过实时分析用户的语音提示(如“呃”“嗯”等),精准判断何时发言、何时等待,从而避免传统语音系统中常见的尴尬停顿或不合时宜的打断。
6/3/2025 11:00:54 AM
AI在线