AI在线 AI在线

Captioning Reinforcement Learning

3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

邢龙和董潇逸为本篇文章共同第一作者。 邢龙是中国科学技术大学博士生,师从林达华教授和吴枫教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。 董潇逸是香港中文大学 MMLab 的博士后研究员,同时在上海人工智能实验室担任兼职顾问研究员,已在顶级会议和期刊(如 CVPR、ICCV、ECCV 等)上发表了 50 余篇论文,Google Scholar 上获得超过 10000 次引用。
10/28/2025 12:48:00 PM
机器之心
  • 1