AI在线 AI在线

Gemini 3 的实力到底有多强?超多案例带你了解(附提示词)

大家应该看了很多 Gemini 3 的相关信息了,藏师傅这里就不废话了。 简单说一下它有多强,从测试基准来看直接在几乎所有基准上都达到了 SOTA,同时相当一部分大幅领先第二名,当然除了 SWE-Bench 这个。 用来验证 AI 是否脱离了“概率模仿”并开始产生“真正思考”的测试集 ARC-AGI v2 的得分上,甚至超过了现在最强模型的两倍以上,看看 Gemini 3 孤零零在的位置。

Gemini 3 的实力到底有多强?超多案例带你了解(附提示词)

大家应该看了很多 Gemini 3 的相关信息了,藏师傅这里就不废话了。

简单说一下它有多强,从测试基准来看直接在几乎所有基准上都达到了 SOTA,同时相当一部分大幅领先第二名,当然除了 SWE-Bench 这个。

Gemini 3 的实力到底有多强?超多案例带你了解(附提示词)

用来验证 AI 是否脱离了“概率模仿”并开始产生“真正思考”的测试集 ARC-AGI v2 的得分上,甚至超过了现在最强模型的两倍以上,看看 Gemini 3 孤零零在的位置。

Gemini 3 的实力到底有多强?超多案例带你了解(附提示词)

从昨晚发布开始我就用 Gemini 3 做了相当多的测试。

同时测试内容依旧秉承藏师傅一贯的观点,除了测试能力以外也尽可能都是对大家有用的。

我也会开放这些提示词,由于谷歌一贯的财大气粗,所以你几乎在 AI Studio 和谷歌新发布的 AI IDE Antigravity 上可以免费用 Gemini 3,只有你自己的看法才是最客观的,建议多试试。

Gemini 刚发布的时候我最关注的还是多模态的理解能力,毕竟这个一直是谷歌的看家本事,先拿了两个视频试了一下。

第一个是 AI 艺术家 852 話 做的 AI MV 视频,里面有相当多的快闪效果,分镜变化也很频繁,非常适合用来分析模型对于视频细节的分析能力。

提示词是:帮我详细分析这个视频的每个分镜内容,确保我可以让设计师复刻它

可以看到他几乎按每秒钟说了每个动画效果表现的细节和画面主体内容,前面加上了总的风格描述,最后加上了如果要用 AE 做的话用哪些插件才行,非常细了。

Gemini 3 的实力到底有多强?超多案例带你了解(附提示词)

接下来刚好要发谷歌新发布的 AI IDE 的介绍,索性直接把他们的宣传视频扔给了 Gemini 3,让他帮我总结。

整体非常有条理,产品的核心定位、宣传主题以及产品的详细功能都分析到了,我直接就发了,结果数据还行。

提示词为:帮我详细总结视频内容,介绍这个产品。

Gemini 3 的实力到底有多强?超多案例带你了解(附提示词)

然后就来到了我们的重头戏,编码能力上,现在 AI Studio 里面的 Build 模式是真的顶,居然生成的网页也可以直接调用谷歌所有 AI 能力。

于是就想能不能让他帮我直接实现一个设计 Agent 产品,可以帮我思考设计方案,完善之后自己写提示词作图。

提示词:帮我实现一个功能完整的视频和图片 Agent 平台,支持自主完成图像编辑和设计任务

没想到真的可以,支持对话,他详细询问你的需求,然后帮你用 Nano 生成设计图,真的一句话一次就搞定了,我甚至没说什么是设计 Agent 以及应该如何实现这些能力。

这个 Logo 设计图和基于 Logo 设计的月饼包装袋都是它帮忙设计的,以前哪敢想啊,朋友们,需求和实现方案都不管,一句话需求,说句不好听的,实习生肯定搞不定。

Gemini 3 的实力到底有多强?超多案例带你了解(附提示词)

然后我们来试一下 Gemini 3 的设计稿还原能力。

我找了一张自己收藏夹里相对复杂的设计图,里面细节挺多的,让他完美还原这个设计稿,图片可以用占位图。

Gemini 3 的实力到底有多强?超多案例带你了解(附提示词)

没想到直出效果这么好,尤其是头部这部分的排版细节,比如字号、字体颜色以及行间距等。

而且右边那本书他找不到图片,直接自己用代码写了一本,还补全了设计稿中不存在的的内容。

昨天有朋友说,这个细节还是有问题,我还开玩笑说,没 AI 的时候一些大厂程序员拿着 figma 设计稿第一版能做到这个水平,我就已经烧高香了。

然后我就想,图片 Agent 做了,那要不整一个视频 Agent?

但是 AI Studio 里面没有内置 Veo 3.1 视频模型,于是我就到 Youware 用 Gemini 3 试了一下,也是简单说了一下。

提示词:帮我做一个设计 Agent 网页工具,它可以帮我自动地迭代和优化,并且生成设计图和设计视频,调用所有相关的设计 AI API。

第一次他生成的视频只有一个分镜,于是又让他加了多个分镜编排的能力,让他调用 LLM 生成提示词和剧本。

然后搞定了,真离谱啊,选择故事模式后他会自己生成剧本以及每个分镜的提示词然后调用 Veo 生成多段视频。

然后我才反应过来,我这不是做了一个 Krea 那种 AI 聚合应用吗,基本功能都有了,于是直接把 Krea 的界面截图扔给他,连界面也复刻了,哈哈。

Gemini 3 的实力到底有多强?超多案例带你了解(附提示词)

早上起来刷到一个,那种宣传产品功能的用 AE 做的快闪动画,然后就想这里面都是前端界面的元素吗,能不能让 Gemini 3 用代码给我整一个。

整理了一下提示词之后,他还真的整了一个出来,现在会以之前非常流行的滚动叙事网页的形式表现,如果你想做自己的产品网站的话可以参考这个提示词,还是很吸睛的。

从三秒开始的动画真的很顶,这个 3D 卡片的旋转悬浮然后再排列整齐的动画非常的流畅而且丰富。

而且美学表现也很强,标题的渐变色、描边以及后面卡片的细节,你真的可以用这套逻辑让 Gemini 帮你用前端写一个宣传视频出来,这是一个很大的机会,可以填补目前的 AI 视频模型做不了的部分。

上面的离谱吗?还有更离谱的,早上看见朋友向阳乔木想用 Gemini 生成短剧点子,于是优化了一下,看看能不能让 Gemini 3 直接生成互动式游戏。

没想到在 AI Studio 里面简单调整了两次就搞定了,Gemini 3 会根据你提供的文本生成互动式游戏,很像 GalaGame 常见的形式。

区别就是里面所有的素材都是随着剧情的推进实时生成的,包括:对话文案、语音对话、人物头像、画面背景以及章节信息。

上面这是个很好的机会,人人只要有好剧本会打字就可以做互动内容和互动游戏,再搭配苹果前几天给类似小程序这种产品松绑和降低分成,里面可能酝酿着一个新的顶级内容消费平台的机会。

你用下面这个提示词在 AI Studio 里面的 Build 模式可以直接生成类似游戏,记得在第四步把文案放进去,老板以后靠这个提示词发财了,可千万记得点我。

最后是一个很好玩的案例,可以同时表现 Gemini 3 的多模态能力以及代码能力,它可以直接从一张图片帮你生成 3D 的体素图像动画,还原度很高。

提示词:I have provided an image. Code a beautiful voxel art scene inspired by this image. Write threejs code as a single-page

刚好刷到一个很好看的赛博风格圣诞树图片就扔给 Gemini 3 了。

没想到它这么懂,带缩放动画的星星、闪光特效和旋转的点状发光丝带,给整个动画增加了非常多的表现力。顺便用这玩意提前祝大家圣诞快乐了。

好了这期内容就这样了,希望这些玩法和测试能给你带来一些启发。

相关资讯

谷歌最强AI不是Nano Banana?真正的王炸竟然是它!

你以为 Nano Banana 就是谷歌 AI 最强模型? 那你就大错特错了! 诚然,Nano Banana 能够将多张图像融合为一张、在复杂叙事中保持角色一致、通过自然语言指令进行精确转换,还能利用 Gemini 的知识库生成和编辑图像。
9/17/2025 2:03:35 AM
龙爪槐守望者

被低估的谷歌?聊聊Gemini 2.0最近3个超酷的新功能

Google 最近的动作真的多。 感觉就是趁着 OpenAI 存粮打完了,疯狂的撒豆子一样往外面撒更新。 昨天晚上 11 点多,他们又发了一个关于 Gemini 的更新(其实功能礼拜天就上了,我也不知道他们为啥今天才发推文)。
3/21/2025 12:11:04 AM
数字生命卡兹克

29 年经典游戏被攻克:谷歌 Gemini 2.5 Pro 成功通关《宝可梦蓝》

谷歌Gemini 2.5 Pro成功通关29年前的经典游戏《宝可梦蓝》,展示了AI在游戏领域的突破。谷歌CEO皮查伊兴奋宣布这一成果,引发对AI游戏能力的讨论。#AI游戏# #Gemini#
5/4/2025 7:55:19 AM
远洋