UI
被Manus惊到了?OpenAI深夜发布Agent开发三剑客!开源一个新的SDK,现场手搓三个Agent!还抖了一个内部的料
出品 | 51CTO技术栈(微信号:blog51cto)“2025年将是Agent之年,这一年,ChatGPT和我们的开发工具将从仅仅回答问题,转变为真正为你在现实世界中做事。 ”上周Manus通用智能体的发布之后带火了Claude的MCP框架之后,OpenAI终于坐不住了,今天凌晨一点通过直播的形式,一口气把自己内部工程人员在用的Agent开发工具发布了出来。 整体直播不长,只有20分钟,但足以让外界从OpenAI的视角来见识一番以全球最先进的基座模型来做出来的Agent的效果。
3/12/2025 7:56:29 AM
AI 让手机任务自动“跑”起来!我国高校最新研究,简化移动设备操作
AI 解放碳基生物双手,甚至能让你的手机自己玩自己! 你没听错 —— 这其实就是移动任务自动化。 在 AI 飞速发展下,这逐渐成为一个新兴的热门研究领域。
10/31/2024 2:31:43 PM
清源
国内首个UI大模型出炉!Motiff妙多大模型打造设计师最佳助手、优化UI设计工作流
人工智能的发展速度可能超乎你的想象。自GPT-4将多模态技术引入公众视野以来,多模态大模型进入快速发展阶段,逐渐从单纯的模型研发转向垂直领域的探索和应用,与各行各业深度融合。在界面交互领域,谷歌、苹果等国际科技巨头纷纷投入UI多模态大模型研发,这被视为手机AI革命的必经之路。在此背景下,国内首个UI大模型横空出世。8月17日,在IXDC2024国际体验设计大会上,AI时代设计工具Motiff妙多推出了其自主研发的UI多模态大模型——Motiff妙多大模型。这是全球首个由UI设计工具企业研发的大模型,标志着中国UI设
8/19/2024 2:46:00 PM
新闻助手
苹果发布多模态模型 Ferret-UI,部分手机 UI 任务超越 GPT-4V
编译 | 赖文昕编辑 | 陈彩娴大模型的诞生,让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发,OpenAI、Anthropic、Mistral等创业之星的升起更是证明了在新技术的影响下,大厂并不存在绝对的优势。 不久前,苹果叫停了启动十多年且投入数十亿美元的自动驾驶电动汽车项目,美国总部裁员了600多人,另有近2000名员工转到AI部门。 然而,在目前市场上的主流智能手机品牌中,苹果几乎是唯一一家尚未正式推出大模型的厂商。
4/10/2024 2:31:00 PM
赖文昕
苹果介绍 Ferret-UI 多模态大语言模型:更充分理解手机屏幕内容
感谢苹果公司近日发布研究论文,展示了 Ferret-UI AI 系统,可以理解应用程序屏幕上的内容。以 ChatGPT 为代表的 AI 大语言模型(LLMs),其训练材料通常是文本内容。为了能够让 AI 模型能够理解图像、视频和音频等非文本内容,多模态大语言模型(MLLMs)因此孕育而生。只是现阶段 MLLMs 还无法有效理解移动应用程序,这主要有以下几个原因:1. 手机屏幕的宽高比,和大多数训练图像使用的屏幕宽高比不同。2. MLLMs 需要识别出图标和按钮,但它们相对来说都比较小。因此苹果构想了名为 Ferre
4/10/2024 7:50:52 AM
故渊
AI绘画未来如何改进?来看斯坦福教授的预测!
编者按:这篇文章是来自斯坦福的年轻教授 Maneesh Agrawala,他本人既是斯坦福计算机专业的教授,也是斯坦福大学布朗媒体创新研究所的所长。他在去年 HAI 2022 秋季会议上发布了演讲「AI回路:演进中的人类」,而这篇文章正是演讲内容修订后的版本。对于 AIGC 当下存在的深层问题,AI 的逻辑以及未来可能的改进方式,给出了详尽的解读和预测。以下是正文:
最近我决定更新一下我的个人网站的图片资料:作为一名计算机专业的教授,我觉得现在制作一张高质量照片,最简单的方法,就是使用 DALL-E2 来生成。所以
4/7/2023 6:33:39 AM
Maneesh Agrawala
当人工智能也会画UI,设计师的核心价值在哪里?
编者按:设计规范越来越完善,软件越来越简单,连PM 都可以动手搭一个UI 界面,那么此时设计师的核心价值在哪里?如何让自己摆脱“只会画画图标和线框图”的印象?这篇文章总结了4个进阶方法。
鸿影:近年来各家平台的设计规范日渐完善,公司也在大力推行中台化战略,DPL、组件化、模块化等成为了我们工作中的重心之一,设计标准化的趋势愈演愈烈,在促进设计效率提升、解放生产力的同时,也让我开始产生一种深深的焦虑:当组件和业务模块沉淀到一定程度,产品经理和前端直接拿来搭建页面也能有模有样,设计师的核心价值和不可替代性又在哪里?当平
1/10/2017 10:10:58 PM
程远
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind