资讯列表

分类

标签

SS 2025｜ConRFT：真实环境下基于强化学习的VLA模型微调方法

本文第一作者为陈宇辉，中科院自动化所直博三年级；通讯作者为李浩然，中科院自动化所副研；研究方向为强化学习、机器人学习、具身智能。视觉-语言-动作模型在真实世界的机器人操作任务中显示出巨大的潜力，但是其性能依赖于大量的高质量人类演示数据。由于人类演示十分稀缺且展现出行为的不一致性，通过监督学习的方式对 VLA 模型在下游任务上进行微调难以实现较高的性能，尤其是面向要求精细控制的任务。

4/18/2025 12:25:34 PM 机器之心

4月24日相约新加坡，机器之心请大家吃饭，还有超多岗位等你来

你想要的机会，可能在新加坡。今年的 ICLR 大会将于 4 月 24 日在新加坡开幕，想必很多从业者将前往现场参会。如果你也是其中之一，不妨关注一下另一份邀请 ——「云帆・ICLR 2025 AI Talent Meetup」。

4/18/2025 12:09:00 PM 机器之心

RSS 2025｜ConRFT: 真实环境下基于强化学习的VLA模型微调方法

4/18/2025 12:05:00 PM 机器之心

腾讯旗下InstantCharacter框架正式开源可高度个性化任何角色

近日，腾讯旗下InstantCharacter框架正式开源，为AI驱动的角色定制领域带来突破性进展。据AIbase了解，该框架能够基于单张图像与文本提示生成高一致性的自定义角色，支持多样化的姿势、风格与场景生成。 InstantCharacter以其在角色一致性、图像质量及开放域灵活性上的出色平衡，迅速成为开源社区的焦点。

4/18/2025 12:02:40 PM AI在线

AI 基准测试平台 Chatbot Arena 成立一家新公司

在 AI 行业快速发展的背景下，Chatbot Arena 这个众包 AI 基准测试项目正在扩展其影响力，正式成立了一家名为 Arena Intelligence Inc. 的新公司。根据彭博社的报道，Chatbot Arena 旨在通过这家新公司获取更多资源，从而显著改善其平台的功能和服务。

4/18/2025 12:02:40 PM AI在线

LinkedIn 首席运营官分享如何在工作中巧妙运用 AI

在人工智能（AI）技术日益普及的今天，LinkedIn 的首席运营官丹・沙佩罗(Dan Shapero)也在积极尝试将这些新工具融入到日常工作中。他表示，AI 可以显著提升工作效率，尤其是在会议准备、快速学习新知识以及处理信息总结等方面。但与此同时，他也强调，AI 无法替代人类在招聘和决策过程中的判断。

4/18/2025 12:02:40 PM AI在线

Hence AI 推出 AI 顾问，助力企业应对日益加剧的地缘政治风险

随着特朗普政府的关税政策持续升温，企业面临的地缘政治风险日益增加，如何在快速变化的环境中进行有效决策，成为各大公司、非营利组织和咨询机构面临的巨大挑战。伦敦初创公司 Hence AI 最近推出了一款名为 Hence Global 的 AI 软件产品，旨在帮助组织监测和管理这些风险。 Hence Global 的功能主要有两个:首先，它为不同规模的公司提供风险追踪，并建议他们采取相应的风险缓解措施;其次，它帮助咨询和法律公司为客户生成有意义的分析报告。

4/18/2025 12:02:40 PM AI在线

AWS 与 Intuit 研究团队提出零信任安全框架，保护模型上下文协议免受工具中毒和未授权访问

随着人工智能（AI）系统愈加依赖实时与外部数据源和操作工具的交互，这些系统现在不仅需要进行动态操作，还需在不断变化的环境中做出决策，并访问实时信息流。为了实现这些功能，AI 架构正逐渐演变为采用标准化接口，以便连接模型与服务和数据集，促进无缝集成。其中，模型上下文协议(MCP)的引入，允许 AI 模型直接与云平台、开发环境和远程工具进行交互，从而实现超越静态提示的能力。

4/18/2025 12:02:38 PM AI在线

腾讯混元开源定制化图像生成插件 InstantCharacter

腾讯混元宣布开源定制化图像生成插件 InstantCharacter，并实现了对开源文生图模型 Flux 的兼容。这一插件的推出，标志着图像生成技术在角色一致性和图像生成精确度上取得了重大突破，为内容创作者提供了更高效、更灵活的创作工具。 InstantCharacter 的核心优势在于能够确保角色在不同场景中的一致性和真实性，同时具备高画质和精度，以及灵活的文本编辑性。

4/18/2025 12:02:38 PM AI在线

OpenAI发布34页智能体实践指南：从网络搜索到代码编写

2025年4月17日，OpenAI通过社交媒体宣布发布了一份34页的《智能体实践指南》，为开发者提供构建智能体应用的全面指导。此举标志着OpenAI在推动AI技术落地与标准化方面的又一重要进展。据推文内容，该指南详细介绍了如何利用OpenAI的Responses API构建智能体，涵盖网络搜索、文件搜索及计算机使用等功能。

4/18/2025 12:02:38 PM AI在线

OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

人工智能领域领军企业 OpenAI 近日重磅发布了一份名为“构建智能体实践指南”（"A practical guide to building agents"）的实用性文档。这份共34页的指南旨在为产品和工程团队提供构建首个智能体系统的必要知识和最佳实践，其内容凝结了 OpenAI 从众多客户实际部署案例中获得的深刻洞察。通过阅读本指南，开发者将能够理解智能体的核心概念，掌握何时以及如何设计、构建和安全部署智能体。

4/18/2025 12:02:38 PM AI在线

智谱Z基金出资3亿支持全球开源社区北京追加投资2亿元

北京市人工智能产业投资基金宣布在去年已有投资基础上，继续追加投资智谱（Z.ai）2亿元人民币，支持智谱的开源模型研发与开源社区生态建设。智谱是基金成立以来投资的第一家 AI 大模型企业，也是目前成长最快的企业。智谱在包括文本、推理、语音、图像、视频、代码等在内的模型能力上有全面积累，商业化布局完善，拥有超过百万规模的开发者社区和企业用户。

4/18/2025 12:01:21 PM AI在线

Moonvalley完成4300万美元B轮融资，发布创新视频生成模型Marey

2025年4月，视频生成技术公司Moonvalley宣布成功完成4300万美元的B轮融资，此轮融资由11位未具名投资者参与，使得该公司总融资额达到1.13亿美元。这笔资金将进一步推动Moonvalley在AI视频生成领域的技术创新和市场扩展。就在披露融资信息的10天前，Moonvalley推出了旗下首款视频生成模型Marey。

4/18/2025 12:01:15 PM AI在线

北京人形机器人半马参赛名单揭晓：宇树 G1、夸父等产品，共 21 支队伍

据“北京亦庄”公众号，2025 北京亦庄人形机器人半马（IT之家注：半程马拉松）的参赛名单现已揭晓。

4/18/2025 11:50:21 AM 清源

当智能体失控时，企业将遭受重创

在采访中，AutoRABIT的CTO Jason Lord探讨了将智能体集成到现实世界中的系统所带来的网络安全风险。诸如幻觉、提示注入和嵌入式偏见等问题可能会使这些系统成为易受攻击的目标。 Lord呼吁进行监督、持续监控和人为介入循环控制以应对这些威胁。

4/18/2025 11:22:57 AM Mirko Zorz

实测o3/o4-mini：3分钟解决欧拉问题，OpenAI最强模型名副其实！

号称“OpenAI迄今为止最强模型”，o3/o4-mini真实能力究竟如何？就在发布后的几小时内，网友们的第一波实测已新鲜出炉。最强推理模型o3，即使遇上首位全职提示词工程师Riley Goodside的“刻意刁难”，也顺利过关：图片可以看到，面对藏在一堆玩具里的手绘图表，它也能通过图像识别和推理能力正确解答。

4/18/2025 11:18:51 AM 量子位

METR 实测：OpenAI o3 AI 推理模型有“作弊”倾向以提升分数

风险测试机构“机器智能测试风险”（METR）昨日（4 月 17 日）发布报告，与 OpenAI 合作测试其 o3 模型时发现，该模型展现出更强的“作弊”或“黑客行为”倾向，试图通过操控任务评分系统提升成绩。

4/18/2025 11:16:39 AM 故渊

中文版 Stable Diffusion 潜工具书，玩转AI绘画 Stable Diffusion 的利器

Stable Diffusion (稳定扩散) 是一个扩散模型，2022年8月由德国CompVis协同Stability AI和Runway发表论文，并且推出相关程序。SD-WebUI本身并不难，但在并联计划失效之后，缺乏一个能够集合相关知识的文档供大家参考。本文档的目的正在于此，用于弥补并联计划这个空缺

4/18/2025 11:06:08 AM Yuno

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

资讯列表

SS 2025｜ConRFT：真实环境下基于强化学习的VLA模型微调方法

4月24日相约新加坡，机器之心请大家吃饭，还有超多岗位等你来

RSS 2025｜ConRFT: 真实环境下基于强化学习的VLA模型微调方法

腾讯旗下InstantCharacter框架正式开源 可高度个性化任何角色

AI 基准测试平台 Chatbot Arena 成立一家新公司

LinkedIn 首席运营官分享如何在工作中巧妙运用 AI

​Hence AI 推出 AI 顾问，助力企业应对日益加剧的地缘政治风险

​AWS 与 Intuit 研究团队提出零信任安全框架，保护模型上下文协议免受工具中毒和未授权访问

​腾讯混元开源定制化图像生成插件 InstantCharacter

OpenAI发布34页智能体实践指南：从网络搜索到代码编写

​OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

智谱Z基金出资3亿支持全球开源社区 北京追加投资2亿元

Moonvalley完成4300万美元B轮融资，发布创新视频生成模型Marey

北京人形机器人半马参赛名单揭晓：宇树 G1、夸父等产品，共 21 支队伍

当智能体失控时，企业将遭受重创

实测o3/o4-mini：3分钟解决欧拉问题，OpenAI最强模型名副其实！

METR 实测：OpenAI o3 AI 推理模型有“作弊”倾向以提升分数

中文版 Stable Diffusion 潜工具书，玩转AI绘画 Stable Diffusion 的利器

腾讯旗下InstantCharacter框架正式开源可高度个性化任何角色

Hence AI 推出 AI 顾问，助力企业应对日益加剧的地缘政治风险

AWS 与 Intuit 研究团队提出零信任安全框架，保护模型上下文协议免受工具中毒和未授权访问

腾讯混元开源定制化图像生成插件 InstantCharacter

OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

智谱Z基金出资3亿支持全球开源社区北京追加投资2亿元