资讯列表
Salesforce 收购 Moonhub,强化 AI 招聘工具
近日,Salesforce 公司悄然收购了 Moonhub,这是一家专注于招聘和人力资源管理的人工智能初创公司。 虽然收购的具体条款尚未公开,但这一消息引发了业界的广泛关注。 图源备注:图片由AI生成,图片授权服务商Midjourney根据 Moonhub 在其官方网站上发布的声明,公司的整个团队将加入 Salesforce。
人工智能和知识图谱三:知识图谱系统的基准与评估
一、通用基准知识图谱一些大型知识库已成为事实上的研究基准,通常用作链接预测、问答和实体分类等任务的数据来源。 关键的基准包括:Freebase:一个巨大的通用领域图谱,前身是谷歌收购的开放数据库,包含数百万个实体的事实。 虽然 Freebase 本身已停止服务,已迁移至 Wikidata,但它仍在基准测试中继续存在。
万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live
整理丨赖文昕编辑丨陈彩娴VLA(视觉-语言-动作模型)作为具身智能领域的关键新范式,能有效整合视觉信息、语言指令与行动决策,显著提升机器人对复杂环境的理解和适应能力,对推动机器人从单一任务执行向多样化场景自主决策的跨越至关重要 ,已成为当下学术界和工业界炙手可热的研究焦点。 圆桌主持人为北京大学计算机学院助理教授、智源学者仉尚航,并邀请了清华大学交叉信息院助理教授、千寻智能联合创始人高阳,清华大学交叉信息院助理教授、星海图联合创始人赵行,与北京大学人工智能研究院助理教授、北大-灵初智能联合实验室主任杨耀东一起进行了一场深度的讨论。 会上,主持人仉尚航带领讨论 VLA,先是探讨其定义、起源及相关模型区别;接着分析技术路线与新成果,探讨不同路线的优缺点;随后围绕机器人常见任务,剖析核心技术瓶颈与主流输出范式;还研究强化学习结合、泛化能力提升、异构数据利用与协同训练;最后关注落地场景,并探讨执行长程任务的难点与可能。
DeepReaserch智能体突破:阿里WebDancer原生Agentic Model让AI自己「上网找答案」
一、背景在现实生活中,我们常常需要解决各种复杂的多步推理问题,这些问题往往需要从多个网页中获取信息,并进行综合分析和推理才能得出答案。 例如,当我们想要了解某个历史事件的详细经过时,可能需要查阅多个不同来源的网页,对比和分析其中的信息,才能还原事件的全貌。 这种复杂的信息检索任务,对于传统的搜索引擎来说是非常困难的,因为它们通常只能提供单步的搜索结果,而无法像人类一样进行多步的推理和决策。
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2
长视频理解是多模态大模型关键能力之一。 尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。 近日,智源研究院联合上海交通大学等机构,正式发布新一代超长视频理解模型:Video-XL-2。
李飞飞空间智能独角兽开源底层技术!AI生成3D世界在所有设备流畅运行空间智能的“着色器”来了
李飞飞空间智能创业公司World Labs,开源一项核心技术! Forge渲染器,可在桌面端、低功耗移动设备、XR等所有设备上实时、流畅地渲染AI生成的3D世界。 具体来说,Forge是一款Web端3D高斯泼溅渲染器,无缝集成three.js,实现完全动态和可编程的高斯泼溅。
大神卡帕西这么用ChatGPT:日常4o快又稳,烧脑切o4做后盾,o3只当备胎用
OpenAI模型命名混乱没规律,以至于打开ChatGPT后,好多人都不知道到底该用哪个模型来完成任务。 不过别慌,现在咱们有救了! 刚刚,大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。
英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍
近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。 这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍,为人工智能的应用提供了更为强大的技术支持。 扩散模型的挑战与机遇扩散模型被视为传统自回归模型(Autoregressive Models)的有力竞争者。
智源研究院开源轻量级超长视频理解模型Video-XL-2
近日,智源研究院联合上海交通大学等机构正式发布了一款新一代超长视频理解模型——Video-XL-2。 这一模型的推出标志着长视频理解技术在开源领域取得了重大突破,为多模态大模型在长视频内容理解方面的发展注入了新的活力。 在技术架构方面,Video-XL-2主要由视觉编码器、动态Token合成模块(DTS)以及大语言模型(LLM)三个核心组件构成。
终于可以免费使用Sora了!微软版Sora今日开放
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)微软 Bing 越来越不像搜索了! 微软周一宣布,将在 Bing 应用程序中引入视频创建器 (Bing Video Creator ),该应用程序使用 OpenAI 的 Sora 模型让用户根据文本提示生成视频。 更重要的是,这也就意味着一直以来只有付费用户才能使用的 Sora 视频生成功能,而现在,Sora 与微软必应的集成标志着其首次免费开放。
Gartner高级顾问总监:从生产力陷阱到财务效率的理性转向,生成式AI的降本困境与破局之道
谈到2025年科技圈的热点,非生成式AI莫属。 可以说,生成式AI已经成为推动企业业务创新和数字化转型的核心焦点。 根据Gartner调研显示,过去两年中,全球企业IT预算持续收缩,但AI与安全领域的投入逆势增长。
X和OpenAI加入Rust重写潮!马斯克宣布:基于Rust的X有了“比特币风格加密”,惨被币圈技术大佬群嘲:根本不懂!
马斯克又放大招了——这次轮到 X 也加入 Rust 重写潮了! 他宣布,X 内置的私信功能 XChat 已经完成 Rust 重构,并声称采用了“比特币风格加密”。 图片这句“比特币风格加密”,听上去是一种“不明觉厉”的术语,普通用户只觉得大概是更安全了,而玩币圈的技术党则一头雾水。
Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理
斯坦福 Hazy Research 团队刚刚公布了一项重量级优化成果:他们将开源模型 Llama-3.2-1B 的前向推理整合成了一个“Megakernel”,并将低延迟推理能力推向了极限。 在某些实时性极高的应用中,例如对话式 AI 和人类参与的交互式工作流中,大语言模型的响应速度不仅重要,甚至可以决定用户体验的成败。 团队认为限制 LLM 推理速度的瓶颈其实是在内存加载的问题上,他们经过研究发现,现有的开源推理引擎(如 vLLM、SGLang),在极低延迟的单序列生成任务下,即使在顶级 GPU(如 H100)上,也只能利用不到 50% 的内存带宽。
Agent 元年,小厂碎步快跑反超
过去三年,大模型从生成走向理解,从多模态走向执行,让 AI 第一次具备了承接复杂任务链的能力。 到了 2024 年,Agent 概念迅速崛起,成为 AI 应用落地的新焦点。 所以进入 2025 年,越来越多业内人认定——这就是 Agent 元年。
Character.AI 推出新功能AvatarFX,用户可制作个性化动画视频
在 AI 聊天和角色扮演领域颇具影响力的 Character.AI,近日宣布推出一系列多媒体功能,旨在增强用户体验。 根据该公司周一发布的博客,新的 AvatarFX 工具将允许用户创建自定义动画视频,用户可以将自己的 AI 聊天角色带入新的创作空间。 此外,平台还引入了 “场景(Scenes)” 和 “流(Streams)” 功能,用户能够制作包含角色的视频,并在即将上线的新社交动态中分享。
小米将多枚“Kimi” 商标转让给月之暗面
近日,小米科技有限责任公司将多枚 “Kimi” 商标转让给北京月之暗面科技有限公司。 这一商标最早于2013年申请,目前的状态多为已注册。 小米作为一家在商标保护方面一向积极的企业,曾因商标侵权问题多次通过法律手段维权,此次转让可能是其业务聚焦的战略调整,旨在优化非核心商标资源。
谷歌“试穿”实验席卷美国:上传照片秒变模特,AI让购物超带感!
在近期举办的Google I/O2025大会上,谷歌宣布了其全新AI驱动项目——“试穿”(Try On)实验,并于近日在美国向更多用户开放。 这一功能利用生成式AI技术,让用户通过上传照片即可虚拟试穿服装,显著提升在线购物的便捷性和真实感。 AIbase综合最新网络信息,为您深入解析这一创新实验的亮点及其对电商行业的潜在影响。
软银与英特尔携手打造新型节能 AI 内存芯片,电力消耗或减半
近日,软银与英特尔联合开发了一款全新的 AI 专用内存芯片,旨在大幅降低电力消耗,以便为日本的 AI 基础设施提供更为高效的支持。 根据日经亚洲的报道,双方的合作目标是设计一种新型堆叠式 DRAM 芯片。 这种芯片的布线方式将不同于目前市场上流行的高带宽内存(HBM),预期可以将电力消耗降低约50%。