资讯列表
张俊林:OpenAI o1的价值意义及强化学习的Scaling Law
蹭下热度谈谈 OpenAI o1 的价值意义及 RL 的 Scaling law。一、OpenAI o1 是大模型的巨大进步我觉得 OpenAI o1 是自 GPT 4 发布以来,基座大模型最大的进展,逻辑推理能力提升的效果和方法比预想的要好,GPT 4o 和 o1 是发展大模型不同的方向,但是 o1 这个方向更根本,重要性也比 GPT 4o 这种方向要重要得多,原因下面会分析。为什么说 o1 比 4o 方向重要?这是两种不同的大模型发展思路,说实话在看到 GPT 4o 发布的时候我是有些失望的,我当时以为 Op
9/14/2024 1:30:00 PM
机器之心
首次!用合成人脸数据集训练的识别模型,性能高于真实数据集
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]研究动机一个高质量的人脸识别训练集要求身份 (ID) 有高的分离度(Inter-class separability)和类内的变化度(Intra-class variation)。然而现有
9/14/2024 1:28:00 PM
机器之心
电力、芯片制造、数据和延迟成四大限制因素,Scaling Law能续到2030年吗?
近年来,人工智能模型的能力显著提高。其中,计算资源的增长占了人工智能性能提升的很大一部分。规模化带来的持续且可预测的提升促使人工智能实验室积极扩大训练规模,训练计算以每年约 4 倍的速度增长。从这个角度来看,人工智能训练计算的增长速度甚至超过了近代史上一些最快的技术扩张。它超过了移动电话采用率(1980-1987 年,每年 2 倍)、太阳能装机容量(2001-2010 年,每年 1.5 倍)和人类基因组测序(2008-2015 年,每年 3.3 倍)的峰值增长率。在最近的一份报告中,Epoch AI 研究了当前人工
9/14/2024 1:22:00 PM
机器之心
李飞飞任CEO,空间智能公司World Labs亮相,全明星阵容曝光
人工智能的下个大方向已经出现,标志性学者决定下场创业。本周五,一个重磅消息引爆了 AI 圈:斯坦福大学计算机科学家李飞飞正式宣布创办 AI 初创公司 ——World Labs,旨在向人工智能系统传授有关物理现实的深入知识。李飞飞说道:在 AI 领域中,真正难以解决的问题是什么?我的答案是空间智能 —— 这项技术可以赋能和实现创作、设计、学习、AR/VR、机器人等领域的无数可能用例。为此,李飞飞与三位联合创始人 Justin Johnson、Christoph Lassner、Ben Mildenhall,以及一支世
9/14/2024 1:08:00 PM
机器之心
o1 模型完整思维链成 OpenAI 头号禁忌,问多了等着封号吧
警告!不要在 ChatGPT 里问最新 o1 模型是怎么思考的 ——只要尝试几次,OpenAI 就会发邮件威胁撤销你的使用资格。请停止此活动,确保您使用 ChatGPT 时符合我们的使用条款。违反此条款的行为可能导致失去 OpenAI o1 访问权限。大模型新范式 o1 横空出世不到 24 小时,就已经有不少用户反馈收到这封警告邮件,引起众人不满。有人反馈只要提示词里带“reasoning trace”、“show your chain of thought”等关键词就会收到警告。甚至完全避免出现关键词,使用其他手
9/14/2024 12:50:33 PM
汪淼
网信办发布《人工智能生成合成内容标识办法(征求意见稿)》
感谢国家互联网信息办公室今日发布关于《人工智能生成合成内容标识办法(征求意见稿)》公开征求意见的通知。其中第四条提到,服务提供者提供的生成合成服务属于《互联网信息服务深度合成管理规定》第十七条第一款情形的,应当按照下列要求对生成合成内容添加显式标识。(一)在文本的起始、末尾、中间适当位置添加文字提示或通用符号提示等标识,或在交互场景界面或文字周边添加显著的提示标识;(二)在音频的起始、末尾或中间适当位置添加语音提示或音频节奏提示等标识,或在交互场景界面中添加显著的提示标识;(三)在图片的适当位置添加显著的提示标识;
9/14/2024 10:59:15 AM
浩渺
OpenAI大秀肌肉,一口气放出10个新模型Demo,全球网友玩疯了
AI好好用报道编辑:杨文9.11和9.8哪个大还是答不对。9 月 13 日凌晨,OpenAI 又搞了个大新闻 ——推出 o1 系列模型,也就是江湖流传已久的「草莓」。这款模型到底厉害在哪,能让朋友圈刷了屏?这么说吧,它不需要专门训练,就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。(查看详情,请移步:刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限)不过,实现通用复杂推理的代价是,每次回答要花费更长时间思考。因为 o1 是经过强化学习训练的新型语言模型,在输出回答之前,它会
9/14/2024 10:25:00 AM
AI好好用
因类人通用推理、可辅助制作生物武器等因素,OpenAI o1 AI 模型归类为“中等风险”
科技媒体 The Decoder 昨日(9 月 13 日)发布博文,报道称在 OpenAI 自家的“防备框架”(Preparedness Framework)下,将最新发布的 o1 AI 模型归类为“中等风险”(medium risk)。防备框架简介AI在线曾于 2023 年 12 月报道,OpenAI 成立了新的“防备”(Preparedness)团队,并提出“防备框架”指导方针。防备团队将反复评估 OpenAI 最先进、尚未发布的 AI 模型,根据不同类型的感知风险评为四个等级,从低到高依次是“低”、“中”、“
9/14/2024 9:29:08 AM
故渊
OpenAI ChatGPT AI 聊天机器人新增“/picture”和“/search”指令
OpenAI 扩充 ChatGPT 系统快捷指令,新增“/picture”和“/search”,进一步改善用户的交互体验。AI在线附上操作方法如下:在与 ChatGPT 对话时,只需输入一个“/”(不含双引号),一个便捷的弹出窗口就会显示这些快捷选项。“/picture”该指令会调用 OpenAI 的文生图模型 DALL-E,即使用户没有具体的提示或想法,只需选择 / picture,也能为你生成有趣的图像。“/search”该指令会进入一个新的搜索模式,你输入的任何内容都会被视为搜索查询。即便用户没有输入任何内容
9/14/2024 9:13:18 AM
故渊
Meta 下周在英国重启数据收集计划,利用用户公开帖子训练其 AI
Meta 公司昨日(9 月 13 日)发布新闻稿,宣布以负责任和透明的方式,重启 AI 训练计划,利用英国用户在 Facebook 和 Instagram 上的公开帖子来训练 AI。
9/14/2024 8:37:22 AM
故渊
如何判断AI的输出是否正确?三个办法搞定!
在生成式 AI 工具如 ChatGPT 逐渐融入日常工作和生活的今天,很多人都在依赖 AI 来完成各种任务:撰写文案、编程、生成分析报告,甚至是做生活规划。虽然 AI 的应用场景越来越广泛,但它的输出并非每次都能符合预期。很多人在使用 AI 时会碰到这样的问题:AI 生成的内容到底靠不靠谱?它的输出是否可以完全信赖?如何判断 AI 给出的答案是正确的?
作为一名 AI 产品设计师,我也经常需要依赖 AI 工具来完成日常工作。经过无数次与 AI 的互动,我逐渐摸索出了三个简单有效的办法,可以帮助我们快速判断 AI 的
9/14/2024 7:50:39 AM
小普
超过人类博士的能力!OpenAI 全新发布o1模型!
OpenAI 发布新旗舰模型GPT-4o! 实时交互犹如真人,免费开放大家好,这里是和你们一起探索 AI 的花生。 阅读文章 .
9/14/2024 12:08:56 AM
数字生命卡兹克
“AI 教母”李飞飞为新公司融资 2.3 亿美元,创业方向瞄准“空间智能”
据路透社今晚报道,被誉为“AI 教母”的 AI 研究员李飞飞为她与三位同事共同创立的初创公司 World Labs 筹集了 2.3 亿美元(AI在线备注:当前约 16.38 亿元人民币),该公司致力于开发能够理解三维物理世界运作的 AI 技术。World Labs 的首轮融资由 Andreessen Horowitz、New Enterprise Associates 和 Radical Ventures 共同领投,其他投资者包括 AMD、Intel Capital、英伟达的 NVentures 等。尽管现有的生成
9/13/2024 10:58:20 PM
清源
元象发布中国最大 MoE 开源大模型:总参数 255B,激活参数 36B
元象 XVERSE 发布中国最大 MoE 开源模型 XVERSE-MoE-A36B。该模型总参数 255B,激活参数 36B,官方号称效果能“大致达到”超过 100B 大模型的“跨级”性能跃升,同时训练时间减少 30%,推理性能提升 100%,使每 token 成本大幅下降。MoE(Mixture of Experts)混合专家模型架构,将多个细分领域的专家模型组合成一个超级模型,在扩大模型规模的同时,保持模型性能最大化,甚至还能降低训练和推理的计算成本。谷歌 Gemini-1.5、OpenAI 的 GPT-4 、
9/13/2024 8:49:18 PM
沛霖(实习)
美国银行谈 AI 热潮:当前仍处早期阶段,才相当于互联网的 1996 年
当地时间 12 日,美国银行发布报告称,当前 AI 的繁荣仍处于早期阶段,其发展轨迹与 20 世纪 90 年代的互联网类似。美国银行此次提出这番观点,正值投资者对 AI 怀疑的情绪与日俱增之际。此前,大量资金涌入 AI 领域,投资者寄希望于看到企业通过 AI 实现承诺的效率和生产力提升。报告称,现在的怀疑者们认为,生成式 AI 的收入潜力无法证明目前 AI 基础设施投资的合理性。“但请记住,比互联网最初的消费者用例更重要的,是由互联网催生的数千种用例和公司。”该报告基于对超过 3,000 家公司的股票分析师和宏观策
9/13/2024 8:22:49 PM
清源
美团买药联合银河通用,展出全球首个人形机器人智慧药房解决方案
2024 年 9 月 12 日至 16 日,中国国际服务贸易交易会(以下简称“服贸会”)在北京国家会议中心和首钢园区举办。美团买药与银河通用联合打造了全球首个人形机器人智慧药房解决方案,由具身大模型机器人 Galbot 完成 24 小时无人值守,在美团买药展位不间断地完成着补货、取货任务,未来有望与连锁药房合作。在执行补货任务时,面对货架上数十种商品,Galbot 可以自主分析哪些需要补货,并从货筐中识别出对应的商品,抓取并放置到货架的对应位置。而当有顾客模拟“下单”后,Galbot 会自主规划路径移动到物品附近,
9/13/2024 7:41:32 PM
沛霖(实习)
训大模型为啥这么贵?专家:一半以上算力被浪费了
人工智能时代,大模型的发展带来了智能算力需求的大爆发。据估算,自 2012 年以来,AI 模型训练算力需求每 3~4 个月就翻一番,每年训练 AI 模型所需算力增长幅度高达 10 倍。同时,OpenAI 曾在 2020 年提出 Scaling law 定律。该定律指出,大模型的最终性能与计算量、模型参数量及训练数据量的大小密切相关。换言之,若要提升大模型的能力,就需要不断增加模型参数和训练数据量,这就需要部署大规模的训练集群,随着集群规模的不断扩大,训练成本也呈指数级增长。9月13日,在百度智能云举办的媒体技术沙龙
9/13/2024 6:55:00 PM
新闻助手