AI在线 AI在线

资讯列表

具身智能新时代!VLA迎来最强基础模型Magma:UI导航、机器人操作全能

现有的大语言模型、图像生成模型等都只是在某几个模态数据上进行操作,无法像人类一样与物理世界产生交互。 视觉-语言-行动(VLA,Vision-Language-Action)模型是可以感知视觉刺激、语言输入以及其他与环境相关数据的自主智能体,能够在物理和数字环境中生成有意义的「具身行动」(embodied actions)以完成特定任务。 图片由于二维数字世界和三维物理世界之间存在差异,现有的VLA模型通常对任务进行简化,导致多模态理解能力偏弱,在跨任务和跨领域的泛化能力上不够通用。
3/10/2025 1:31:28 PM

「古董」GPU也能跑DeepSeek同款GRPO!显存只需1/10,上下文爆涨10倍

开源微调神器Unsloth带着黑科技又来了:上次更新把GRPO需要的内存见到了7GB,这次只需要5GB的VRAM,就能训练自己的推理模型Qwen2.5(1.5B),比上次要少2GB。 这次彻底把推理模型训练显存打下来了! 这次把GRPO训练推理模型的上下文变长10倍,同时需要的显存少了90%。
3/10/2025 1:11:26 PM
新智元

软件行业的颠覆性革命:AI不仅吞噬一切,它就是一切

从前,软件吞噬了世界。 如今,AI来了,要消化剩下的部分。 曾经由应用程序主导、市场控制访问、平台抽取分成的计算模式正在瓦解。
3/10/2025 1:11:00 PM
Justin Westcott

一次搭建完胜1亿次编码,MCP硅谷疯传!Anthropic协议解锁智能体「万能手」

上一周,智能体迎来里程碑式的一周。 从Manus及其开源复现,到Opera的浏览器操作AI智能体、AI工作伴侣Archer,再到多种个人项目,将Agent推向热议风口。 在处理动辄需要十几甚至几十分钟的复杂任务时,涉及到3个核心能力:规划工具使用记忆其中,第二趴是让智能体「动起来」的关键,真正与现实世界进行交互。
3/10/2025 1:08:37 PM
新智元

AI正在冲击一切 无法适应的品牌将会消失

智能体正在筛选品牌、重塑商业并主导消费者选择。 颠覆浪潮即将来袭——你的品牌能否脱颖而出?在不久的将来,商业世界将迎来一场颠覆性的变革,重新定义竞争、客户互动,乃至企业的生存之道。 这场变革的核心是自主式AI——一种承诺通过充当我们的个人数字助理,真正成为我们的“跑腿者”,从而彻底改变日常生活的AI。
3/10/2025 1:04:21 PM
Matt Stroud

扩散模型+深度学习双剑合璧,生成式AI破解染色质构象

编辑丨&人体内的每一个细胞都包含相同的基因序列,但每个细胞只表达这些基因的一个方面。 这些细胞特异性基因表达模式确保脑细胞与皮肤细胞不同,部分由染色质的三维结构决定,遗传物质控制着每个基因的可及性。 高通量测序和成像技术的最新进展大大提高了如今研究单个细胞基因组组织的能力。
3/10/2025 12:57:00 PM
ScienceAI

90%成功响应率,整合约9000个样本,统合癌症蛋白质组学的LLM驱动平台

编辑丨&功能蛋白质组学为癌症机制提供了关键见解,有助于发现新的生物标志物和治疗靶点。 为了充分利用他们整合的将近 500 份高质量抗体的精选组合,美国德克萨斯大学决定采用 LLM 驱动来使资源更高效。 他们推出了 DrBioRight 2.0,这是一个由最先进的大型语言模型提供支持的直观生物信息学平台。
3/10/2025 12:52:00 PM
ScienceAI

OmniParser V2 在 Windows 系统上的详细安装与运行指南

OmniParser V2 在 Windows 系统上的详细安装与运行指南
3/10/2025 12:26:20 PM
AI在线

谷歌再度被要求出售Chrome!AI投资和安卓系统暂时苟住了!网友:这样只会让Edge成为赢家!谷歌:坚决上诉!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)重磅后续来了:谷歌的Chrome还是要卖! 图片上周五,美国司法部在周五提交的法庭文件中,提议要求谷歌剥离 Chrome 浏览器,作为最终的补救措施之一。 提案要求谷歌“迅速且完全剥离 Chrome 及所有必要资产或服务,以确保剥离的成功完成,并将其出售给由原告(即政府)自行决定批准的买家,且需遵守法院和原告批准的条款。
3/10/2025 12:26:10 PM
伊风

稚晖君的「好东西」揭晓!首个通用具身基座模型,机器人告别「看得懂做不来」

上周五,稚晖君在微博上预告,「下周有好东西发布」。 还没进入「下周」多久,智元机器人的「好东西」揭晓了,还是双重惊喜:Vision-Language-Latent-Action (ViLLA) 架构和通用具身基座大模型 GO-1。 机器人训练,苦数据难久矣。
3/10/2025 12:02:00 PM
机器之心

如何看待”首个真干活”AI—Manus?

话题背景今日凌晨,一款通用AI Agent产品「Manus」正式发布。 GAIA评分已超越OpenAI的DeepResearch,成为GAIA评分第一。 这一产品以“数字代理人”自居,宣称能独立完成复杂任务并交付完整成果,迅速成为科技圈的焦点。
3/10/2025 12:00:00 PM
腾讯技术工程

DeepSeek的最佳用法?西湖大学发布可以自主进化的手机智能体AppAgentX

背景介绍近年来,大语言模型(LLM) 的快速发展正推动人工智能迈向新的高度。 像 DeepSeek-R1 这样的模型因其强大的理解和生成能力,已经在 对话生成、代码编写、知识问答 等任务中展现出了卓越的表现。 如今,LLM 的应用范围正进一步拓展,催生了一类新的智能体 —— 基于 LLM 的 GUI 智能体(GUI Agents),它们能够像人类一样,直接通过鼠标、键盘与计算机或手机进行交互。
3/10/2025 12:00:00 PM
机器之心

​罗永浩 AR 创业公司细红线科技启动春季招聘,转向 AI 系统开发

近日,罗永浩的 AR 创业公司细红线科技(Thin Red Line)宣布正式启动2025年春季招聘,吸引了不少关注。 该公司目前开放的全职岗位均为产品经理,包括资深软件产品经理、AI 方向软件产品经理、IM 方向软件产品经理、BI 数据产品经理和商业化产品经理等,工作地点分别位于上海和北京,但公司并未公开具体的薪资区间。 据行业媒体36氪的报道,罗永浩的最新创业构想是围绕 AI 操作系统(AIOS)展开。
3/10/2025 11:49:00 AM
AI在线

人工智能到底是啥?今天彻底讲明白!

想象一下,你家里突然多了个超级聪明的机器人管家。 你对它说:“帮我点杯奶茶! ” 它立刻打开外卖软件,选好你最喜欢的口味,还自动用优惠券帮你省钱。
3/10/2025 11:48:10 AM
快乐程序猿

OpenAI给所有模型做“身份卡”!一个页面读懂能力、速度、价格全指标

OpenAI的模型搞得太多太凌乱,官方自己都看不下去了。 为了厘清这些模型还有它们的各种版本,官方直接给做它们了一套“身份卡”。 每个模型“身份卡”都包含了能力、速度、支持模态、价格等信息,并且以图示 简单文本的形式呈现,既简洁又清晰。
3/10/2025 11:38:42 AM

​美国司法部要求谷歌出售Chrome浏览器,放宽AI投资限制

根据美国司法部最新的法庭文件,仍然要求谷歌出售其网页浏览器 Chrome。 该提议最早是在去年由时任总统拜登提出的,司法部在特朗普第二次任期内依然坚持这一计划。 然而,司法部不再要求谷歌剥离所有人工智能投资,包括谷歌在 Anthropic 上投入的数十亿美元。
3/10/2025 11:21:00 AM
AI在线

中国信通院启动人形机器人应用场景图谱编制工作

为加快推动人形机器人应用场景建设,促进技术迭代升级,中国信息通信研究院泰尔系统实验室现正式启动人形机器人应用场景征集工作,申报截止日期为 2025 年 3 月 24 日。
3/10/2025 11:18:44 AM
浩渺

“稚晖君”智元机器人已量产下线 1000 台机器人

据《科创板日报》报道,今日,据智元具身研究中心常务主任任广辉介绍,截至目前,智元机器人已经量产下线 1000 台机器人。
3/10/2025 11:05:16 AM
浩渺