AI在线 AI在线

应用

Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理

斯坦福 Hazy Research 团队刚刚公布了一项重量级优化成果:他们将开源模型 Llama-3.2-1B 的前向推理整合成了一个“Megakernel”,并将低延迟推理能力推向了极限。 在某些实时性极高的应用中,例如对话式 AI 和人类参与的交互式工作流中,大语言模型的响应速度不仅重要,甚至可以决定用户体验的成败。 团队认为限制 LLM 推理速度的瓶颈其实是在内存加载的问题上,他们经过研究发现,现有的开源推理引擎(如 vLLM、SGLang),在极低延迟的单序列生成任务下,即使在顶级 GPU(如 H100)上,也只能利用不到 50% 的内存带宽。
6/3/2025 12:49:00 PM
郑佳美

Agent 元年,小厂碎步快跑反超

过去三年,大模型从生成走向理解,从多模态走向执行,让 AI 第一次具备了承接复杂任务链的能力。 到了 2024 年,Agent 概念迅速崛起,成为 AI 应用落地的新焦点。 所以进入 2025 年,越来越多业内人认定——这就是 Agent 元年。
6/3/2025 12:41:00 PM
郑佳美

​Character.AI 推出新功能AvatarFX,用户可制作个性化动画视频

在 AI 聊天和角色扮演领域颇具影响力的 Character.AI,近日宣布推出一系列多媒体功能,旨在增强用户体验。 根据该公司周一发布的博客,新的 AvatarFX 工具将允许用户创建自定义动画视频,用户可以将自己的 AI 聊天角色带入新的创作空间。 此外,平台还引入了 “场景(Scenes)” 和 “流(Streams)” 功能,用户能够制作包含角色的视频,并在即将上线的新社交动态中分享。
6/3/2025 12:00:54 PM
AI在线

小米将多枚“Kimi” 商标转让给月之暗面

近日,小米科技有限责任公司将多枚 “Kimi” 商标转让给北京月之暗面科技有限公司。 这一商标最早于2013年申请,目前的状态多为已注册。 小米作为一家在商标保护方面一向积极的企业,曾因商标侵权问题多次通过法律手段维权,此次转让可能是其业务聚焦的战略调整,旨在优化非核心商标资源。
6/3/2025 12:00:54 PM
AI在线

谷歌“试穿”实验席卷美国:上传照片秒变模特,AI让购物超带感!

在近期举办的Google I/O2025大会上,谷歌宣布了其全新AI驱动项目——“试穿”(Try On)实验,并于近日在美国向更多用户开放。 这一功能利用生成式AI技术,让用户通过上传照片即可虚拟试穿服装,显著提升在线购物的便捷性和真实感。 AIbase综合最新网络信息,为您深入解析这一创新实验的亮点及其对电商行业的潜在影响。
6/3/2025 12:00:54 PM
AI在线

​软银与英特尔携手打造新型节能 AI 内存芯片,电力消耗或减半

近日,软银与英特尔联合开发了一款全新的 AI 专用内存芯片,旨在大幅降低电力消耗,以便为日本的 AI 基础设施提供更为高效的支持。 根据日经亚洲的报道,双方的合作目标是设计一种新型堆叠式 DRAM 芯片。 这种芯片的布线方式将不同于目前市场上流行的高带宽内存(HBM),预期可以将电力消耗降低约50%。
6/3/2025 12:00:54 PM
AI在线

Console获得 620 万美元融资,利用 AI 解放 IT 团队的重复任务

在现代职场中,IT 支持的重要性不言而喻。 每当员工遇到电脑被锁或无法访问应用程序的情况时,他们总是急切希望能联系到 IT 支持。 然而,帮助台工作人员常常忙于处理其他请求,这可能导致员工无法及时获得所需的支持。
6/3/2025 12:00:54 PM
AI在线

英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍

英伟达联合麻省理工学院(MIT)、香港大学,合作推出 Fast-dLLM 框架,大幅提升扩散模型(Diffusion-based LLMs)的推理速度。
6/3/2025 11:29:46 AM
故渊

Google AI Edge Gallery发布:Gemma 3n加持,本地AI应用开发从未如此简单!

在近期举办的Google I/O2025大会上,Google悄然推出了一款开源项目——Google AI Edge Gallery,一款完全本地运行的生成式AI应用,基于最新的Gemma3n模型,集成了多模态能力,支持文本、图片和音频输入。 这一项目以其高效的端侧AI性能和开源特性,为开发者提供了构建本地化AI应用的理想模板。 Google AI Edge Gallery:端侧AI的开源新标杆Google AI Edge Gallery是一款面向Android(iOS版本即将推出)的实验性应用,允许用户在本地设备上运行来自Hugging Face的多种开源AI模型,无需联网即可实现高效推理。
6/3/2025 11:00:54 AM
AI在线

​音乐巨头与AI初创公司Udio和Suno展开版权合作谈判

根据《彭博社》的最新报道,全球知名的音乐公司,包括环球音乐集团、华纳音乐集团和索尼音乐娱乐,正在与两家人工智能初创公司 Udio 和 Suno 进行版权许可谈判。 此次谈判的目的在于建立一个框架,以确保 AI 公司能够合理补偿艺术家的作品使用。 Udio 和 Suno 这两家公司专注于帮助新兴音乐艺术家创作歌曲,只需通过描述声音或歌曲主题的提示,就能生成音频录制。
6/3/2025 11:00:54 AM
AI在线

三星抛弃谷歌Gemini?Galaxy S26将携手Perplexity掀起AI搜索革命

据彭博社最新报道,三星正与AI搜索服务提供商Perplexity就一项重大合作进行谈判,该合作可能彻底改变Galaxy S26系列的AI体验,并对当前由谷歌主导的移动AI格局构成挑战。 从Gemini到Perplexity:三星的AI转向三星此前是谷歌Gemini AI的早期支持者,该技术在很大程度上取代了三星自家的Bixby助手。 然而,新的合作协议显示三星正在寻求更多元化的AI策略。
6/3/2025 11:00:54 AM
AI在线

云数据平台 Snowflake 宣布收购数据库初创公司 Crunchy Data

云数据平台 Snowflake 于6月2日宣布计划收购数据库初创公司 Crunchy Data。 该交易的估值约为2.5亿美元,尽管具体条款尚未披露,但这一收购被视为 Snowflake 在数据市场不断扩张的重要一步。 图源备注:图片由AI生成,图片授权服务商MidjourneyCrunchy Data 成立于13年前,是一家专注于 Postgres 的数据库合作伙伴,提供开发者所需的工具来构建基于 Postgres 的应用程序。
6/3/2025 11:00:54 AM
AI在线

ElevenLabs推全新语音交互平台Conversational AI 2.0:AI语音助手比真人还懂你

近日,ElevenLabs正式推出了其全新一代语音交互平台Conversational AI2.0,以更自然、更智能、更高效的语音交互体验引发业界热议。 这一升级版本在对话流畅性、多语言支持和企业级应用能力上实现重大突破,不仅能精准捕捉用户对话节奏,还能无缝切换多语言并从企业知识库提取信息,为客服、营销和内容创作等领域带来全新可能。 自然对话新体验:告别尴尬中断Conversational AI2.0引入了先进的轮流对话模型,通过实时分析用户的语音提示(如“呃”“嗯”等),精准判断何时发言、何时等待,从而避免传统语音系统中常见的尴尬停顿或不合时宜的打断。
6/3/2025 11:00:54 AM
AI在线

Cerebras 推理 API 全面开放,开发者每日获百万免费 Token

2025年6月2日,人工智能芯片公司 Cerebras Systems 宣布,其推理 API 现已对所有开发者全面开放,取消了此前的等待名单限制。 这一举措标志着 Cerebras 在加速生成式 AI 应用开发方面迈出了重要一步,为全球开发者提供高效、快速的 AI 推理服务。 据 Cerebras 官方声明,开发者每日可免费获得100万个 Token 的使用额度。
6/3/2025 11:00:33 AM
AI在线

小米向月之暗面转让多枚“Kimi”商标

小米近日将多枚“Kimi”商标转让给北京月之暗面公司,后者为AI助手Kimi的开发者。此次转让或为小米优化非核心商标资源,月之暗面近期动作频繁,包括与小红书合作等。#小米商标转让# #AI助手Kimi#
6/3/2025 10:51:50 AM
远洋

我国水利标准 AI 大模型正式发布,采用海量知识库 + DeepSeek / Qwen 双模型

我国水利标准AI大模型正式发布,采用海量知识库+DeepSeek/Qwen双模型,实现水利标准全生命周期数字化、智能化管理。查重比对准确率超96.7%,标准编制效率提高2.5倍。#水利科技##AI大模型#
6/3/2025 10:04:47 AM
远洋

Meta 公司将90% 的风险评估交给 AI,安全隐患引发担忧

近日,Meta 公司(Facebook、Instagram、WhatsApp 及 Threads 的母公司)宣布将其内部的安全和隐私审查工作转向人工智能,计划让高达90% 的风险评估自动化。 根据《国家公共广播电台》(NPR)获得的内部文件,以往由专门团队负责评估更新对用户隐私的影响、对未成年人的伤害,或者对错误信息传播的影响,现在这些责任将主要转移给 AI 技术。 在新的评估框架下,产品团队需填写一份问卷,详细描述更新内容,随后 AI 系统将即时给出评估结果,指出潜在风险并设定项目所需的条件。
6/3/2025 10:01:10 AM
AI在线

​谷歌推出AI Edge Gallery应用,实现离线智能手机AI处理

谷歌近期悄然推出了一款名为 AI Edge Gallery 的实验性 Android 应用,允许用户在不连接互联网的情况下直接在智能手机上运行复杂的人工智能模型。 这标志着谷歌在边缘计算和隐私保护方面迈出了重要一步。 AI Edge Gallery 应用支持用户从知名的 Hugging Face 平台下载和执行 AI 模型,能够实现图像分析、文本生成、编程辅助和多轮对话等功能,且所有数据处理均在本地完成,增强了用户的隐私保护。
6/3/2025 10:01:09 AM
AI在线