AI在线 AI在线

Jan团队发布Jan-v2-VL-Max!30B多模态模型专攻长周期Agent任务,长序列执行稳超Gemini 2.5 Pro

在AI智能体(Agent)向复杂、多步任务演进的关键阶段,开源社区迎来一员新锐猛将。 Jan团队今日正式发布 Jan-v2-VL-Max——一款300亿参数的多模态大模型,专为长周期、高稳定性自动化执行场景打造,在关键指标上已超越谷歌Gemini2.5Pro与DeepSeek R1,为开源Agent生态注入强劲动力。 聚焦“误差累积”难题,专治多步执行“失焦”当前多模态Agent在执行长序列操作(如自动化UI操作、跨应用任务流)时,常因中间步骤微小偏差导致后续任务全面偏离,即“误差累积”问题。

在AI智能体(Agent)向复杂、多步任务演进的关键阶段,开源社区迎来一员新锐猛将。Jan团队今日正式发布 Jan-v2-VL-Max——一款300亿参数的多模态大模型,专为长周期、高稳定性自动化执行场景打造,在关键指标上已超越谷歌Gemini2.5Pro与DeepSeek R1,为开源Agent生态注入强劲动力。

image.png

聚焦“误差累积”难题,专治多步执行“失焦”

当前多模态Agent在执行长序列操作(如自动化UI操作、跨应用任务流)时,常因中间步骤微小偏差导致后续任务全面偏离,即“误差累积”问题。Jan-v2-VL-Max针对性引入 LoRA-based RLVR(Reinforced Long-horizon Vision-Language Reasoning)技术,在保持Qwen3-VL-30B基座能力的同时,显著提升推理链的一致性与抗干扰能力,确保任务在数十步操作后仍精准执行。

“幻象递减回报”测试登顶,定义Agent新基准

该模型在全新评测基准 “幻象递减回报”(Hallucination-Decay Return, HDR)中表现突出。该基准专门衡量Agent在任务长度延伸过程中,因幻觉或逻辑断裂导致回报率下降的速度。Jan-v2-VL-Max在长序列任务中维持高回报稳定性,超越Gemini2.5Pro与DeepSeek R1,验证其在真实自动化场景中的可靠性。

image.png

即开即用,支持本地高效部署

为降低使用门槛,Jan团队提供:  

- 网页端直接交互界面,用户可上传图像、输入指令,测试多步自动化流程;  

- vLLM优化本地部署方案,支持在消费级GPU上高效运行,便于开发者集成至自研Agent系统。

开源社区的“长思考”突破

Jan-v2-VL-Max虽在长序列执行上相较基座模型仅实现“小幅提升”,但在Agent领域,每1%的稳定性提升都意味着可用性质变。这一成果标志着开源社区正从“单步响应”迈向“长程规划”,为UI自动化、机器人控制、多工具协同等高价值场景提供可落地的开源基座。

AIbase认为,当大模型竞争从“谁更聪明”转向“谁更可靠”,Jan团队此次聚焦执行稳定性的技术路径,恰逢其时。在Agent即将成为AI主交互范式的浪潮下,Jan-v2-VL-Max或将成为开发者构建“永不掉链子”智能体的关键拼图。

相关资讯

OpenAI 回应“封嘴”离职条款:从未回收过任何员工股权

OpenAI 回应“封嘴”离职条款:从未回收过任何员工股权

OpenAI 首席执行官阿尔特曼在 X (推特)上就此前“封嘴”离职条款传闻进行回应:公司从来没有收回任何人的既得股权,哪怕人们没有签署离职协议(或不同意非贬低协议),也不会采取上述做法。阿尔特曼表示,“这是我的责任,是我在管理 OpenAI 过程中为数不多的几次真正尴尬的事情之一。我不知道会发生这种事,但我本应该知道。”在过去一个月左右的时间里,该团队已经开始修复标准离职文件。如果任何签署了这些旧协议的前雇员对此感到担心,他们可以联系我,我们也会解决这个问题。对此感到非常抱歉。在 OpenAI 此前的离职文件中,
5/19/2024 3:40:44 PM 清源
OpenAI解散Ilya重要团队,前高管怒斥,宫斗第二季

OpenAI解散Ilya重要团队,前高管怒斥,宫斗第二季

奥特曼的激进策略,现在不受控制了?没有想到,OpenAI 在本周发布 GPT-4o,技术再次大幅度领先之后,随之迎来的却是一系列坏消息。本周,OpenAI 联合创始人、首席科学家 Ilya Sutskever 官宣离职,与 Ilya 同步宣布离开的,还有超级对齐团队的共同领导者 Jan Leike。                              山姆・奥特曼、 Ilya Sutskever 和 Jan Leike。Ilya 与 Jan 是 OpenAI 超级对齐团队的领导者,该团队的任务是确保人工智能与
5/18/2024 4:18:00 PM 机器之心
Adobe AI代理再扩军:新增产品支持与全球上线数据洞察代理

Adobe AI代理再扩军:新增产品支持与全球上线数据洞察代理

Adobe持续推进其AI代理生态扩展,正式发布“产品支持代理”,旨在简化Adobe Experience Platform中的故障排除流程,并优化客户体验管理。 同时,Adobe宣布其“数据洞察代理”现已在全球范围内上线。 新发布的“产品支持代理”由Adobe Experience Platform Agent Orchestrator提供技术支持,能够在AI Assistant的对话界面中,为用户提供即时的操作指导和支持案例创建流程。
6/6/2025 11:00:55 AM AI在线