GPT-4o
OpenAI推出全新图像生成模型,挑战Google一句话P图
在科技界的最新动态中,OpenAI 刚刚宣布,他们在最新的 GPT-4o 模型中集成了迄今为止最先进的图像生成器。 OpenAI 的首席执行官萨姆・奥特曼(Sam Altman)在社交媒体平台 X 上兴奋地分享了他第一次看到模型生成的图像时的震惊,认为这简直难以置信,并期待用户们充分发挥他们的创造力。 新功能的亮点包括:- 能够精确渲染文本内容,提供高质量的图像效果。
3/26/2025 9:48:00 AM
AI在线
OpenAI发布最新图像生成模型:GPT-4o内置多轮对话编辑功能
2025年3月25日,OpenAI宣布其最新图像生成模型正式内置于GPT-4o中,这一突破性升级为用户带来了更强大的图像生成与编辑体验。 据悉,该功能已于今日开始向ChatGPT和Sora的所有Plus、Pro、Team以及免费用户逐步推出。 这一消息迅速引发了科技界的广泛关注。
3/26/2025 8:48:00 AM
AI在线
研究显示,AI 用户可与双人团队媲美,提升工作效率
最近的一项研究显示,使用人工智能(AI)的个人在工作表现上可与传统的双人团队相媲美。 此次研究由776名洁(Procter & Gamble)专家参与,他们在一天的工作坊中为多个业务单位开发产品创意。 研究将参与者分成两组,分别是由一名商业专家和一名技术专家组成的团队,和单独的个人,其中一半的团队和个人都获得了 GPT-4和 GPT-4o 的访问权限。
3/24/2025 9:33:00 AM
AI在线
OpenAI 发布报告:大多数GPT-4o API问题已解决
3月18日,OpenAI 发布了最新的事故报告,宣布其 GPT-4o API 问题已基本得到解决。 几天前,该公司曾指出,由于用户通过 API 使用 GPT-4o 时出现响应性能下降,导致部分用户受到影响。 此次更新的报告显示,大多数用户已经恢复了正常的服务体验,但仍有少数客户的情况正在持续关注中。
3/18/2025 9:38:00 AM
AI在线
GPT-4o“人格觉醒”? 升级后变身“毒舌”暖男,还懂人类小情绪了!
AI 圈再掀波澜!OpenAI 首席执行官奥特曼近日暗示 GPT-4o 模型迎来重大升级,虽然具体细节讳莫如深,但用户的“民间测评”已然炸开了锅。 不少博主惊喜发现,升级后的 GPT-4o 仿佛脱胎换骨,不仅智商“更上一层楼”,还展现出令人惊叹的“个性化”和“情感理解力”,简直让人怀疑 AI 是否偷偷进化出了“灵魂”!用户们最直观的感受是 GPT-4o 变得“更聪明”了,而且一改以往略显呆板的形象,开始展现出鲜明的“个性”。 这种“个性”首先体现在行为模式的转变上。
2/17/2025 2:06:00 PM
AI在线
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好
GPT-4o悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。 除了数学(第6),还在多个单项上拿下第一:创意写作;编程;指令遵循;长文本查询;多轮对话;先直观看下新版GPT-4o的能力如何,还是以之前DeepSeek-R1和o3-mini都挑战过的一个例子来看。 Prompt:编写一个Python程序,展示一个球在旋转的六边形内弹跳。
2/17/2025 12:24:43 PM
量子位
研究警告AI语言模型极限:超8K上下文性能腰斩,概念推理成难关
慕尼黑大学、慕尼黑机器学习中心与Adobe Research近日联合发布的研究显示,包括GPT-4o、Gemini1.5Pro和Llama-3.3-70B在内的12款顶尖AI语言模型,在长文本概念推理任务中面临显著性能衰减。 尽管这些模型均支持至少128,000个标记的上下文处理,但其深层逻辑关联能力仍存在根本性局限。 研究团队开发的NOLIMA(无文字匹配)基准测试系统,通过刻意规避关键词重复的设计,揭示AI模型在概念联结上的脆弱性。
2/13/2025 9:53:00 AM
AI在线
ChatGPT 能耗揭秘:每次响应仅需 0.3 瓦,远低于传闻!
最近,一项由非营利组织 Epoch AI 进行的研究揭示了 OpenAI 的聊天机器人平台 ChatGPT 的能耗情况,结果显示,ChatGPT 的能耗远低于早期的估算。 根据一些报道,ChatGPT 回答一个问题需要约3瓦时的电力,而 Epoch AI 的研究认为这个数据被高估了。 研究表明,使用 OpenAI 最新默认模型 GPT-4o 时,平均每个查询仅消耗约0.3瓦时的电力,这一数字甚至低于许多家用电器的能耗。
2/12/2025 9:08:00 AM
AI在线
OpenAI发布首个AI智能体Operator,首批面向ChatGPT Pro用户
OpenAI 宣布推出其最新 AI 代理 “Operator”,这一工具旨在帮助用户在网络上执行各种任务。 OpenAI 在其博客中表示,Operator 正在进行 “研究预览”,初步面向美国的 ChatGPT Pro 订阅用户,月费为200美元。 Operator 的设计理念是通过一种称为 “计算机使用代理” 的模型,结合了 GPT-4o 的视觉能力和强化学习的高级推理,能够与图形用户界面(GUI)进行交互。
1/24/2025 9:34:00 AM
AI在线
全球!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑
又一个国产AI在外网被刷屏火了! 来感受一下这个feel:图片这个AI,正是来自面壁智能最新的模型——MiniCPM-o 2.6。 之所以如此火爆,是因为它以仅仅8B的体量,在多模态能力上直接能跟GPT-4o掰手腕!
1/16/2025 4:39:44 PM
量子位
多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格
GPT-4o仅得分64.5,其余模型均未及格! 全面、细粒度评估模型多模态长文档理解能力的评测集来了~名为LongDocURL,集成了长文档理解、数值推理和跨元素定位三个主任务,并包含20个细分子任务。 LongDocURL主打多模态、长上下文,专注于篇幅在50~150页的英文文档,平均页数和文档标记数分别为85.6和43622.6。
1/2/2025 11:01:45 AM
中国MoE一夜爆火!大模型新王暴打GPT-4o,训练成本仅600万美元
一夜之间,来自中国的大模型刷屏全网。 DeepSeek-V3,一个拥有671B参数的MoE模型,吞吐量每秒高达60 token,比上一代V2直接飙升3倍。 在多项基准测试中,V3性能直接与Claude 3.5 Sonnet、GPT-4o相匹敌。
12/27/2024 10:27:58 AM
新智元
豆包升级了“眼睛”,看APP截图就能写代码了!超低价让多模态AI普惠
豆包的“眼睛”升级了,现在让它看一眼APP截图,就能直接给你生成代码! 话不多说,我们直接给它上一个难度。 例如我们先随机截取一张网站的图片:再来到火山方舟的大模型广场,pick一下最新的Doubao-vision-pro-32k版本:(PS:该模型也可以在豆包APP中体验)然后把刚才的截图“喂”给豆包,并附上一句简单的Prompt:帮我写代码,克隆这个APP。
12/20/2024 7:10:00 AM
12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究
给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台? 实验表明,不同的模型在这件事上喜好也不一样,比如基于Claude 3.5 Sonnet的智能体,就会表现出极强的合作意识。 而GPT-4o则是主打一个“自私”,只考虑自己的短期利益。
12/19/2024 5:50:28 PM
亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!
就在刚刚,亚马逊推出了号称最强大的多模态模型Nova系列。 在多项基准测试中,最强的Nova Pro成功超越了GPT-4o,仅次于Gemini 1.5 Pro、Claude 3.5 Sonnet。 相较之下,Nova Lite和Nova Micro,就要比同级竞品差上不少了。
12/4/2024 1:24:19 PM
新智元
仅仅一天,Gemini就夺回了GPT-4o拿走的头名
太卷了,大模型迭代开始以「周」为单位了吗? 一周前,谷歌的 Gemini-Exp-1114 模型取代 GPT-4o,坐上了 Arena 榜单的头把交椅。 对于苦苦追赶 OpenAI 几个月的谷歌来说,这次在基准测试上的胜利十分振奋人心。
11/22/2024 1:15:00 PM
机器之心
终于来了!OpenAI开放GPT-4o高级语音,还用中文说「对不起」
这项高级语音功能,大家可是等了好久。谷歌又被 OpenAI 截胡了。前脚谷歌刚刚升级完两款模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,后脚奥特曼就直接宣布 GPT-4o 今天起正式开放。「高级语音功能今天推出!(将在本周内完成),希望您的等待值得。」奥特曼表示道,最后还不忘加一个委屈、小桃心的表情。这次,OpenAI 的高级语音功能将向所有的 Plus 和 Team 用户推出。但免费用户是体验不了了,因为 OpenAI 暂时没有这个计划。据了解,Plus 用户每月需支付
9/25/2024 1:53:00 PM
机器之心
ChatGPT的高级语音模式终于上线了:中文一开口,就暴露了「歪果仁」身份
OpenAI 的「Her」终于向部分人群开放了。今年 5 月,OpenAI 在「春季新品发布会」上搬出了新一代旗舰生成模型 GPT-4o、桌面 App,并展示了一系列新能力。现在,OpenAI 宣布向一小部分 ChatGPT Plus 用户开放 ChatGPT 的高级语音模式,让用户首次获得 GPT-4o 的超现实音频响应。这部分用户将在 ChatGPT 应用程序中收到提醒,并收到一封电子邮件,其中包含有关如何使用该应用程序的说明。「自从我们首次演示先进的语音模式以来,我们一直致力于加强语音对话的安全性和质量,准备
7/31/2024 5:08:00 PM
机器之心
资讯热榜
阿里推出 AI 医学助手 App“氢离子”:收录千万级核心期刊文献,还可查疾病、找药品
OpenAI 董事会主席:如果你想快速烧掉百万美元,就开发自己的 AI 模型吧
Meta 被指控盗用 2000 余部成人影片训练 AI,或面临 3.5 亿美元天价赔偿
刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25
WAIC 2025 主论坛演讲 | MiniMax 创始人闫俊杰:每个人的 AI
腾讯Robotics X具身智能开放平台Tairos发布,融合左脑、右脑、小脑
业界首个,腾讯混元 3D 世界模型正式发布并开源
AI和云基础设施初创企业E2B如何成为88%的财富100强企业的必备选择
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用