AI在线 AI在线

谷歌再破界限:Gemini 2.5 Pro实现6小时视频理解,AI视觉能力迈入新纪元

谷歌Gemini2.5Pro视频理解能力再升级,这款旗舰AI模型不仅支持长达6小时的视频分析,还拥有高达200万Token的超大上下文窗口,同时首次实现通过API直接解析YouTube链接。 官方数据显示,该模型在VideoMME基准测试中达到84.7%的准确率,与行业顶尖水平的85.2%仅有一线之差,彰显了其强劲实力。 这项突破性技术现已通过Google AI Studio向开发者开放体验。

谷歌Gemini2.5Pro视频理解能力再升级,这款旗舰AI模型不仅支持长达6小时的视频分析,还拥有高达200万Token的超大上下文窗口,同时首次实现通过API直接解析YouTube链接。官方数据显示,该模型在VideoMME基准测试中达到84.7%的准确率,与行业顶尖水平的85.2%仅有一线之差,彰显了其强劲实力。这项突破性技术现已通过Google AI Studio向开发者开放体验。

Gemini2.5Pro凭借其庞大的上下文窗口,实现了一次性处理约6小时视频内容的能力(以每秒1帧采样,每帧66个Token计算)。开发者现在可通过简单的API调用直接输入YouTube链接,让模型自动理解、分析并转化视频内容。在Google Cloud Next '25开场视频的演示中,该模型成功识别出16个不同的产品展示片段,精准结合音视频线索实现了内容定位,展现了其深度理解能力。

QQ20250512-090756.jpg

更令人印象深刻的是其瞬时定位和跨时间分析能力。Gemini2.5Pro能够根据用户提示快速定位视频中的关键时刻,如在一段连续视频中精确统计出主角使用手机的17次独立事件。其逻辑判断能力更支持复杂的时间推理任务,分析视频中事件的发生顺序或频率。技术背后是谷歌采用的3D-JEPA和多模态融合技术,通过结合音视频信息和代码数据,大幅提升了模型的视频理解深度与准确性。

应用场景方面,Gemini2.5Pro为多个领域带来了创新可能。在教育领域,模型可基于教学视频自动生成交互式学习应用,显著提升学生参与度;创意产业中,它能将视频内容转化为p5.js动画或交互式可视化,为创作者提供高效工具;商业分析场景下,模型可智能解析会议或产品演示视频,自动提取关键信息并生成专业报告。

值得注意的是,谷歌通过提供低分辨率处理模式(每帧仅占用66个Token)进一步降低了长视频处理成本。官方测试表明,该经济模式在VideoMME测试中性能仅下降0.5%,实现了成本与性能的出色平衡,为开发者在实际应用中提供了更多选择。

Gemini2.5Pro的视频理解突破标志着AI正从以语言为中心向以视频为驱动的多模态产品转型。其200万Token上下文窗口和YouTube链接解析功能为开发者提供了前所未有的创作空间,特别是在教育、娱乐和企业分析等高价值领域。尽管如此,业内专家指出,模型在处理超长视频时的延迟优化仍有提升空间。谷歌已计划进一步扩展上下文窗口并整合更多多模态功能,如实时流媒体处理,以应对日益增长的市场需求,继续引领AI视觉能力的发展方向。

相关资讯

​谷歌发布全新推理 AI 模型 Gemini 2.5和Gemini 2.5 Pro实验版

近日,谷歌在开发者平台 Google AI Studio 及 Gemini 应用程序上发布了其最新的人工智能推理模型 ——Gemini2.5。 此模型具备停下来 “思考” 的能力,标志着人工智能技术的新进步。 谷歌还推出了 Gemini2.5Pro Experimental,这款多模式推理 AI 模型被认为是迄今为止最智能的。
3/26/2025 9:47:00 AM
AI在线

Google 发布升级版 Gemini 2.5 Pro AI 模型 助力开发者提升编码能力

近日,Google 宣布推出其最新的 AI 模型 ——Gemini2.5Pro Preview(I/O 版)。 这一升级版是在即将召开的 Google I/O2025开发者大会前发布的,标志着公司在 AI 领域的持续创新。 根据 Google 的说法,Gemini2.5Pro Preview 在多项广泛使用的基准测试中表现优异,力求在激烈的市场竞争中占据一席之地。
5/7/2025 9:00:53 AM
AI在线

Perplexity 竞技场夺冠,Sonar挑战谷歌Gemini的搜索霸主地位

在最新的 LM Arena Search Arena 评估中,Perplexity 公司的 Sonar-Reasoning-Pro-High 模型表现优异,与谷歌的 Gem-2.5-Pro-Grounding 模型并列第一,直接对决的胜率达到53%。 这一消息无疑给搜索引擎领域带来了新的震动,显示了 Perplexity 在 AI 搜索技术上的强大实力。 Sonar 系列模型在此次评估中包揽了前四名,这不仅彰显了其深度搜索能力,也显示了其在严谨引证方面的出色表现。
4/16/2025 4:01:05 PM
AI在线
  • 1