应用
苹果 AI 研究:“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型
《洛杉矶时报》昨日(11 月 1 日)发布博文,报道称苹果研究团队测试了 20 个最先进的 AI 模型,发现在有干扰项存在的情况下,它们处理简单的算术问题时表现不佳,甚至不如小学生。 苹果公司用以下这道简单的算术题测试 20 多个最先进的 AI 模型,AI在线附上题目如下:Oliver 在星期五采摘了 44 个猕猴桃、然后他在星期六采摘了 58 个猕猴桃,星期日采摘的数量是星期五的两倍,不过其中有 5 个猕猴桃的块头要比平均值要小,请问 Oliver 这三天共摘了多少个猕猴桃? 正确答案是 190 个,计算公式为 44(星期五) 58(星期六) 88(44*2,星期日)。
11/2/2024 7:41:20 AM
故渊
克服奖励欺骗:Meta 发布全新后训练方式 CGPO 编程水平直升 5%,打破 RLHF 瓶颈
CGPO 框架通过混合评审机制和约束优化器,有效解决了 RLHF 在多任务学习中的奖励欺骗和多目标优化问题,显著提升了语言模型在多任务环境中的表现。 CGPO 的设计为未来多任务学习提供了新的优化路径,有望进一步提升大型语言模型的效能和稳定性。 近年来,随着大规模语言模型(LLMs)的发展,特别是通用大模型的应用场景愈发广泛,RLHF 逐渐成为调整和优化语言模型输出的主流方法。
11/1/2024 10:31:28 PM
问舟
奥特曼回答一切:Ilya确实看到了了不起的东西,OpenAI也缺算力
北京时间 11 月 1 日凌晨,OpenAI 宣布为 ChatGPT 推出了最新的人工智能搜索体验。 在宣布发布 ChatGPT 搜索后不久,OpenAI 还在 Reddit 上进行了 AMA 问答。 在问到 Ilya 到底看到了什么时?
11/1/2024 4:56:00 PM
机器之心
豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍
强化学习(RL)对大模型复杂推理能力提升有关键作用,但其复杂的计算流程对训练和部署也带来了巨大挑战。 近日,字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。 这是一个灵活高效的 RL/RLHF 框架,可显著提升训练吞吐量,降低开发和维护复杂度。
11/1/2024 2:44:00 PM
新闻助手
夸克发布“灵知”学习大模型,号称考研数学题正确率、得分率比肩 OpenAI o1
夸克今日宣布全面升级“AI 搜题”产品,用户可通过手机、平板、电脑等设备搜到各类新题和难题,AI 还会分步骤进行题目讲解,并支持用户随时提问。 据介绍,夸克 AI 还可围绕题目中的知识点与考点进行深度讲解,精准定位关键步骤,能够以“启发式”学习的体验让用户不仅学会这一道难题,还能举一反三学会一类题。 同时,夸克发布“灵知”学习大模型。
11/1/2024 12:54:46 PM
清源
“成都造”机器狗在宽窄巷子当夜间“巡逻员”,机器人进入景区将迎常态化
据《成都商报》昨日报道,10 月 30 日晚,机器狗“灵瞳”作为“巡逻员”在宽窄巷子投入使用,其任务是根据景区木制建筑及道路特点,进行夜间安全巡逻示范,巡逻内容包括火灾防范、治安维护等。 此次机器人产品的亮相,是机器人进场景长效机制的首次实践,标志着“成都造”机器人进入景区工作的常态化序幕正式拉开。 未来,将有更多不同类型和功能的机器人,进入春熙路、大熊猫繁育研究基地等景区承担不同工种并进行常态化工作。
11/1/2024 10:27:57 AM
清源
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/1/2024 10:21:00 AM
机器之心
谷歌推出新付费功能,借助搜索结果对抗 AI 幻觉问题
谷歌公司昨日(10 月 31 日)发布新闻稿,宣布在其 Google AI Studio 和 Gemini API 中,推出 Grounding with Google Search 功能,支持用户通过谷歌搜索验证 AI 回答内容。 主流大模型的挑战包括 OpenAI、Anthropic 和 Google 在内,大部分大语言模型(LLM)由于训练数据集的原因,都有 1 个知识截止日期,因此在回答近期相关事件时,都表现得非常糟糕。 新功能简介Grounding with Google Search 功能旨在解决大型语言模型(LLM)在处理最新事件时的响应不足问题,开发者通过结合实时搜索,可以获得更准确和时效性的信息,提升 AI 应用的可靠性和实用性。
11/1/2024 9:47:27 AM
故渊
3个月吸粉15W!手把手教你做小红书超火的AI人间清醒语录卡片
一键出爆款! 如何用 Coze 搭建图文生成 排版一体化工作流? 一、完整工作流拆解,一张图看懂
最终会生成的内容:4 张图片(1 张封面页,3 张内容页),如下图:我们要实现上图工作流,需要先搭建「2 个图像流,1 个工作流,1 个卡片,1 个 Bot」,如下所示:二、图像流创建:封面页
通过搭建「图像流」来生成下图这张封面:图阅读文章 .
11/1/2024 7:55:49 AM
夏花生
继 ChatGPT 后,Anthropic 旗下 Claude AI 推出桌面平台客户端
继 ChatGPT 后,目前又有一款海外流行的人工智能 Claude AI 获得了桌面版客户端,目前相关客户端处于测试状态,支持 Windows / macOS / iOS 平台。 开发商 Anthropic 在 X 平台官宣了这一消息,同时透露用户可以使用热键快速唤起客户端界面,不过 Claude AI 客户端定位 AI 搜索引擎,与 OpenAI 的 ChatGPT 客户端聊天有所差异。 参考应用详情页,这一 AI 客户端主打语音搜索,不过用户也可以令其写作文章邮件、解决数学问题、判断语法错误、分析文档内容等。
11/1/2024 7:34:03 AM
漾仔
OpenAI 正面对抗谷歌、Perplexity,ChatGPT 搜索功能今日上线
感谢北京时间今日凌晨,OpenAI 宣布在其大模型产品 ChatGPT 中新增了搜索功能,正式进军由 Alphabet 旗下 Google 长期主导的搜索领域,同时也与微软的必应和新兴搜索型 AI 聊天机器人服务 Perplexity 形成竞争。 OpenAI 表示,ChatGPT 搜索功能会根据用户的需求自动决定是否检索网络,能够快速提供最新信息,并附上相关的网页链接。 官方博客表示,ChatGPT 搜索功能利用第三方搜索供应商的技术,并整合合作伙伴直接提供的内容,来满足用户的信息需求。
11/1/2024 7:14:03 AM
清源
因效果不佳,消息称亚马逊“大模型加成”新款 Alexa AI 智能助理正式版已推迟至明年发布
据外媒 The Verge 报道,亚马逊旗下基于人工智能重塑的新版 Alexa 正式版已被推迟到明年发布。 亚马逊在去年 9 月首次宣布了新版 Alexa,其主要在现在的语音助理基础上获得 AI 大模型能力(类似于添加了“苹果牌 AI”Apple Intelligence 的 Siri),先前用户可以通过 Echo 音箱调用新款 Alexa 测试版与其聊天,但目前亚马逊已悄悄关闭这项测试功能。 ▲ 用户可以通过 Echo 音箱调用新款 Alexa 测试版聊天,图源亚马逊AI在线获悉,彭博社的“消息人士”声称,亚马逊认为当下的新版 Alexa 在能力上有所欠缺,其“反应缓慢、语音僵硬、功能较少”,且扰乱 Echo 音箱原先控制智能家居的能力,因此最终选择“重新设计 Alexa 的大脑”,将相关 AI 推迟到明年发布。
11/1/2024 6:52:59 AM
漾仔
美团的这些AI应用,倒把我给整不会了
好好用报道编辑:杨文美团,有点迷茫。 贵为大厂,美团的 AI 进展稍显拖沓。 早在去年一季度财报发布时,王兴就对外表示,公司已组建内部团队进行大模型和应用层面的研发。
10/31/2024 9:45:00 PM
AI好好用
锚定行业痛点,讯飞星火深度赋能民生刚需
2024年被称为“大模型应用元年”,人工智能应用日益进入到场景化的深水区。 10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞正式发布星火4.0 Turbo,根据真实数据背靠背的测试,星火4.0 Turbo的7大能力超过GPT-4 Turbo,代码能力和数学能力超越GPT-4o。 与此同时,国产超大规模智算平台“飞星二号”正式启动,进一步夯实讯飞星火大模型底座能力。
10/31/2024 5:23:00 PM
新闻助手
沉淀·静水流深——机器之心2024年度AI榜单正式启动
几代科研人员和从业者的探索与沉淀,在 2024 年盛放,写下人工智能发展史上至今最为璀璨的一章。 诺贝尔奖始终见证着人类智慧的巅峰。 而今年,人工智能的变革力量首次得到这一科学领域至高荣誉的认可。
10/31/2024 5:08:00 PM
机器之心
任正非最新谈话:世界走向人工智能的潮流不可阻挡
国际大学生程序设计竞赛(ICPC)中国官网今日发布了华为创始人兼 CEO 任正非与 ICPC 主席、教练、获奖选手座谈会的内容,座谈时间是今年 10 月 14 日。 在座谈中,针对不同国家选手的提问,任正非谈到了不同国家的特点,同时还对人工智能、年轻人创业等话题发表了看法。 AI在线汇总谈话部分要点如下:我支持电子考试,在全世界各个角落都可以考试,你可以使用计算机或其他工具等各种方式来帮助你解决问题。
10/31/2024 3:12:22 PM
清源
第一个走入全面AI化的行业,正在经历一次「系统升级」
一年前,阿里巴巴国际站首次发布AI外贸产品时,AI行业还刚刚陷入“模型还是应用”的大辩论中。 在彼时的采访中,阿里国际站总裁张阔对此没有丝毫迟疑:“模型不是稀缺的,真正稀缺的是好的应用。 ”这一判断下,仅仅一年,阿里国际站的AI外贸产品就已经在全球范围内拥有了6万企业用户,发布了700多万商品,接待了2000万次海外客户;这些用AI发布的商品,支付转化率能高出52%;靠AI接待的客户,回复率提升了26%……当这一长串的数字划过一年后又一场发布会的大屏幕时,前排一个外贸商家举起来拍照的手机屏幕里弹出一条新闻:“有一半大模型企业要去做应用了”。
10/31/2024 3:05:00 PM
晓楠
独家丨字节招兵买马,拟在欧洲设立AI研发中心
知情人士透露,字节跳动目前已经开始寻找欧洲的 LLM 和 AI 方面技术大牛,积极招揽人才。 而纵观欧洲各国的 AI 技术水平,瑞士、英国和法国相对靠前。 其中,瑞士和英国都有不少知名院校。
10/31/2024 2:57:00 PM
晓楠
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind