资讯列表
智元远征A2创造纪录,成首个中美欧三区域认证的人形机器人
智元机器人旗下远征A2人形机器人近日成功通过中国CR、欧盟CE-MD、欧盟CE-RED、美国FCC四项产品认证,创造了人形机器人行业的历史性突破,成为全球首个同时拥有中、美、欧三个主要区域认证的人形机器人产品。 远征A2不仅是全球首个获得三区域认证的人形机器人,同时也是国内首个获得CR和CE-MD认证的人形机器人,在多个维度实现了"首个"突破。 这四项认证覆盖了全球最重要的三大市场:中国CR认证确保产品符合国内安全标准,欧盟CE-MD和CE-RED认证分别涵盖医疗设备和无线电设备指令要求,美国FCC认证则保障了产品在美国市场的合规性。
6/3/2025 4:01:04 PM
AI在线
水利部发布首个水利标准 AI 大模型 助力智能化标准管理
近日,中国水利部国科司主办,水利科学研究院自主研发的 “水利标准 AI 大模型” 正式发布。 这一创新成果旨在提升我国水利标准的管理效率,推动水利领域的智能化发展。 该模型的发布标志着我国在水利标准化工具方面迈出了重要的一步。
6/3/2025 3:00:54 PM
AI在线
提前交付超预期!美国FDA的AI助手Elsa正式上线,药品审查将提速
美国食品药品监督管理局(FDA)今日正式推出名为Elsa的生成式人工智能工具,标志着美国政府部门在AI应用领域迈出重要一步。 该工具的成功部署不仅提前于原定时间表,还实现了预算节约,为政府机构AI转型树立了新标杆。 提前交付的成功案例FDA局长Marty Makary医学博士表示,Elsa的推出比原计划提前且低于预算,这得益于与机构科学审查员此前开展的成功试点计划。
6/3/2025 3:00:54 PM
AI在线
英伟达与 MIT、香港大学联手推出 Fast-dLLM 框架,推理速度提升惊人
在最近的科技进展中,英伟达与麻省理工学院(MIT)和香港大学联合推出了名为 Fast-dLLM 的新框架,显著提升了扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍。 这一创新的成果为语言模型的应用开辟了新天地。 扩散模型被视为自回归模型的有力竞争者,采用了双向注意力机制,使其在理论上能够实现多词元同步生成,从而加快解码速度。
6/3/2025 3:00:54 PM
AI在线
Salesforce 收购 Moonhub,强化 AI 招聘工具
近日,Salesforce 公司悄然收购了 Moonhub,这是一家专注于招聘和人力资源管理的人工智能初创公司。 虽然收购的具体条款尚未公开,但这一消息引发了业界的广泛关注。 图源备注:图片由AI生成,图片授权服务商Midjourney根据 Moonhub 在其官方网站上发布的声明,公司的整个团队将加入 Salesforce。
6/3/2025 3:00:54 PM
AI在线
人工智能和知识图谱三:知识图谱系统的基准与评估
一、通用基准知识图谱一些大型知识库已成为事实上的研究基准,通常用作链接预测、问答和实体分类等任务的数据来源。 关键的基准包括:Freebase:一个巨大的通用领域图谱,前身是谷歌收购的开放数据库,包含数百万个实体的事实。 虽然 Freebase 本身已停止服务,已迁移至 Wikidata,但它仍在基准测试中继续存在。
6/3/2025 3:00:04 PM
晓晓
万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live
整理丨赖文昕编辑丨陈彩娴VLA(视觉-语言-动作模型)作为具身智能领域的关键新范式,能有效整合视觉信息、语言指令与行动决策,显著提升机器人对复杂环境的理解和适应能力,对推动机器人从单一任务执行向多样化场景自主决策的跨越至关重要 ,已成为当下学术界和工业界炙手可热的研究焦点。 圆桌主持人为北京大学计算机学院助理教授、智源学者仉尚航,并邀请了清华大学交叉信息院助理教授、千寻智能联合创始人高阳,清华大学交叉信息院助理教授、星海图联合创始人赵行,与北京大学人工智能研究院助理教授、北大-灵初智能联合实验室主任杨耀东一起进行了一场深度的讨论。 会上,主持人仉尚航带领讨论 VLA,先是探讨其定义、起源及相关模型区别;接着分析技术路线与新成果,探讨不同路线的优缺点;随后围绕机器人常见任务,剖析核心技术瓶颈与主流输出范式;还研究强化学习结合、泛化能力提升、异构数据利用与协同训练;最后关注落地场景,并探讨执行长程任务的难点与可能。
6/3/2025 2:22:00 PM
赖文昕
DeepReaserch智能体突破:阿里WebDancer原生Agentic Model让AI自己「上网找答案」
一、背景在现实生活中,我们常常需要解决各种复杂的多步推理问题,这些问题往往需要从多个网页中获取信息,并进行综合分析和推理才能得出答案。 例如,当我们想要了解某个历史事件的详细经过时,可能需要查阅多个不同来源的网页,对比和分析其中的信息,才能还原事件的全貌。 这种复杂的信息检索任务,对于传统的搜索引擎来说是非常困难的,因为它们通常只能提供单步的搜索结果,而无法像人类一样进行多步的推理和决策。
6/3/2025 2:17:18 PM
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2
长视频理解是多模态大模型关键能力之一。 尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。 近日,智源研究院联合上海交通大学等机构,正式发布新一代超长视频理解模型:Video-XL-2。
6/3/2025 2:15:33 PM
李飞飞空间智能独角兽开源底层技术!AI生成3D世界在所有设备流畅运行空间智能的“着色器”来了
李飞飞空间智能创业公司World Labs,开源一项核心技术! Forge渲染器,可在桌面端、低功耗移动设备、XR等所有设备上实时、流畅地渲染AI生成的3D世界。 具体来说,Forge是一款Web端3D高斯泼溅渲染器,无缝集成three.js,实现完全动态和可编程的高斯泼溅。
6/3/2025 2:14:59 PM
大神卡帕西这么用ChatGPT:日常4o快又稳,烧脑切o4做后盾,o3只当备胎用
OpenAI模型命名混乱没规律,以至于打开ChatGPT后,好多人都不知道到底该用哪个模型来完成任务。 不过别慌,现在咱们有救了! 刚刚,大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。
6/3/2025 2:13:56 PM
英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍
近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。 这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍,为人工智能的应用提供了更为强大的技术支持。 扩散模型的挑战与机遇扩散模型被视为传统自回归模型(Autoregressive Models)的有力竞争者。
6/3/2025 2:00:54 PM
AI在线
智源研究院开源轻量级超长视频理解模型Video-XL-2
近日,智源研究院联合上海交通大学等机构正式发布了一款新一代超长视频理解模型——Video-XL-2。 这一模型的推出标志着长视频理解技术在开源领域取得了重大突破,为多模态大模型在长视频内容理解方面的发展注入了新的活力。 在技术架构方面,Video-XL-2主要由视觉编码器、动态Token合成模块(DTS)以及大语言模型(LLM)三个核心组件构成。
6/3/2025 2:00:54 PM
AI在线
终于可以免费使用Sora了!微软版Sora今日开放
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)微软 Bing 越来越不像搜索了! 微软周一宣布,将在 Bing 应用程序中引入视频创建器 (Bing Video Creator ),该应用程序使用 OpenAI 的 Sora 模型让用户根据文本提示生成视频。 更重要的是,这也就意味着一直以来只有付费用户才能使用的 Sora 视频生成功能,而现在,Sora 与微软必应的集成标志着其首次免费开放。
6/3/2025 1:26:52 PM
云昭
Gartner高级顾问总监:从生产力陷阱到财务效率的理性转向,生成式AI的降本困境与破局之道
谈到2025年科技圈的热点,非生成式AI莫属。 可以说,生成式AI已经成为推动企业业务创新和数字化转型的核心焦点。 根据Gartner调研显示,过去两年中,全球企业IT预算持续收缩,但AI与安全领域的投入逆势增长。
6/3/2025 1:21:37 PM
X和OpenAI加入Rust重写潮!马斯克宣布:基于Rust的X有了“比特币风格加密”,惨被币圈技术大佬群嘲:根本不懂!
马斯克又放大招了——这次轮到 X 也加入 Rust 重写潮了! 他宣布,X 内置的私信功能 XChat 已经完成 Rust 重构,并声称采用了“比特币风格加密”。 图片这句“比特币风格加密”,听上去是一种“不明觉厉”的术语,普通用户只觉得大概是更安全了,而玩币圈的技术党则一头雾水。
6/3/2025 1:00:12 PM
云昭
Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理
斯坦福 Hazy Research 团队刚刚公布了一项重量级优化成果:他们将开源模型 Llama-3.2-1B 的前向推理整合成了一个“Megakernel”,并将低延迟推理能力推向了极限。 在某些实时性极高的应用中,例如对话式 AI 和人类参与的交互式工作流中,大语言模型的响应速度不仅重要,甚至可以决定用户体验的成败。 团队认为限制 LLM 推理速度的瓶颈其实是在内存加载的问题上,他们经过研究发现,现有的开源推理引擎(如 vLLM、SGLang),在极低延迟的单序列生成任务下,即使在顶级 GPU(如 H100)上,也只能利用不到 50% 的内存带宽。
6/3/2025 12:49:00 PM
郑佳美
Agent 元年,小厂碎步快跑反超
过去三年,大模型从生成走向理解,从多模态走向执行,让 AI 第一次具备了承接复杂任务链的能力。 到了 2024 年,Agent 概念迅速崛起,成为 AI 应用落地的新焦点。 所以进入 2025 年,越来越多业内人认定——这就是 Agent 元年。
6/3/2025 12:41:00 PM
郑佳美