AI在线 AI在线

AI绘画未来如何改进?来看斯坦福教授的预测!

编者按:这篇文章是来自斯坦福的年轻教授 Maneesh Agrawala,他本人既是斯坦福计算机专业的教授,也是斯坦福大学布朗媒体创新研究所的所长。他在去年 HAI 2022 秋季会议上发布了演讲「AI回路:演进中的人类」,而这篇文章正是演讲内容修订后的版本。对于 AIGC 当下存在的深层问题,AI 的逻辑以及未来可能的改进方式,给出了详尽的解读和预测。以下是正文: 最近我决定更新一下我的个人网站的图片资料:作为一名计算机专业的教授,我觉得现在制作一张高质量照片,最简单的方法,就是使用 DALL-E2 来生成。所以

编者按:这篇文章是来自斯坦福的年轻教授 Maneesh Agrawala,他本人既是斯坦福计算机专业的教授,也是斯坦福大学布朗媒体创新研究所的所长。他在去年 HAI 2022 秋季会议上发布了演讲「AI回路:演进中的人类」,而这篇文章正是演讲内容修订后的版本。对于 AIGC 当下存在的深层问题,AI 的逻辑以及未来可能的改进方式,给出了详尽的解读和预测。以下是正文:

最近我决定更新一下我的个人网站的图片资料:

AI绘画未来如何改进?来看斯坦福教授的预测!

作为一名计算机专业的教授,我觉得现在制作一张高质量照片,最简单的方法,就是使用 DALL-E2 来生成。所以我写了一个简单的 prompt:「Picture of a Professor named Maneesh Agrawala」,然后 DALL-E2 给我生成了……额……这张照片:

AI绘画未来如何改进?来看斯坦福教授的预测!

根据我文本提示,它生成了一张看起来有着明显印度裔特征的男性,给他穿上了看起来「专业」的服装,并且把场景设置在一个学术研究室当中。从整体上来看,物体、灯光、阴影和色彩都是连贯的,是单一且统一的照片。我对于 AI 生成的照片总体上是不会吹毛求疵的,不过手看起来比较奇怪,有一边眼镜腿没了,当然,从我更人需求的角度出发,我很希望它生成这个角色看起来年轻一点。

总体上来看,AI 能够生成如此之逼真的照片确实是令人惊艳的,这是人类历史上从未有过的数字超能力。

AI 能生成的不止是图片内容。先走的生成式 AI 对于用户而言,是一个巨大的黑箱。将自然语言作为输入内容,AI 能够生成素质惊人的文本内容(GPT4,ChatGPT),图片内容(DALL-E2、Stable Diffusion、Midjourney),视频内容(Make-a-Video),3D 模型(DreamFusion)甚至程序代码(Copilot , Codex )。

AI绘画未来如何改进?来看斯坦福教授的预测!

AI绘画未来如何改进?来看斯坦福教授的预测!

那么这次我们使用 DALL-E2 重新生成一张照片看看吧。这次, 我想看看如果斯坦福以《银翼杀手》的风格呈现出来的时候,会是什么样子。斯坦福最典型的建筑就它的主广场,中间是被棕榈树包围的纪念教堂,而谈及《银翼杀手》的时候,我能想到的是霓虹灯,拥挤的夜市,连绵的雨水和大排档。所以我撰写了 prompt:「stanford memorial church with neon signage in the style of bladerunner」。

AI绘画未来如何改进?来看斯坦福教授的预测!

相关资讯

上手即用!2025年AI产品信任设计指南

上手即用!2025年AI产品信任设计指南

编者按:传统的 APP 要建立信任机制并不复杂,现在有很多值得参考的模式、范例。 但是 AI 类产品所面临的情况是截然不同的,那么如何为 AI 类产品进行信任设计呢? 今天来自 Mary Borysova 的这篇文章就基于这个视角,结合一系列的头部 AI APP 来和你一起探讨这个问题。
12/21/2025 2:01:12 AM Mary Borysova
​OpenAI 删除部分 ChatGPT 内容警告政策 以提升用户体验

​OpenAI 删除部分 ChatGPT 内容警告政策 以提升用户体验

OpenAI 宣布对其人工智能聊天机器人 ChatGPT 进行了一项重要的更新,决定删除在某些内容可能违反服务条款时发出的 “警告” 信息。 OpenAI 的人工智能模型行为团队成员 Laurentia Romaniuk 在社交平台 X 上表示,这一改变旨在减少用户在使用 ChatGPT 时遇到的 “无端或无法解释的拒绝回答” 的情况。 ChatGPT 的产品主管 Nick Turley 也在相关帖子中表示,用户现在可以按照自己的方式使用 ChatGPT,只要他们遵守法律,并且不试图对自己或他人造成伤害。
2/14/2025 9:06:00 AM AI在线
​谷歌推出 A2UI 标准,让 AI 实时生成用户界面

​谷歌推出 A2UI 标准,让 AI 实时生成用户界面

谷歌最近发布了名为 A2UI(代理到用户界面)的新标准,赋予人工智能代理即时创建图形用户界面的能力。 这一开源项目旨在规范 AI 如何生成视觉响应,使其不仅限于发送文本,而是能够直接生成表单、按钮等用户界面元素,从而提升用户体验。 传统上,AI 与用户的交互多通过纯文本进行,处理复杂任务时往往显得繁琐。
12/22/2025 5:26:21 PM AI在线