应用
谷歌具身智能新研究:比RT-2优秀的RT-H来了
RT-H 在一系列机器人任务中的表现都优于 RT-2。随着 GPT-4 等大型语言模型与机器人研究的结合愈发紧密,人工智能正在越来越多地走向现实世界,因此具身智能相关的研究也正受到越来越多的关注。在众多研究项目中,谷歌的「RT」系列机器人始终走在前沿(参见《大模型正在重构机器人,谷歌 Deepmind 这样定义具身智能的未来》)。谷歌 DeepMind 去年 7 月推出的 RT-2:全球第一个控制机器人的视觉 - 语言 - 动作(VLA)模型。只需要像对话一样下达命令,它就能在一堆图片中辨认出霉霉,并送给她一罐可乐
3/11/2024 11:46:00 AM
机器之心
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹
设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。近期的研究表明,采用扩散模型的规划模块能够同时生成长序列的轨迹规划,这更加符合人类的决策模式。此外,扩散模型在策略表征和数据合成方面也能为现有的决策智能算法提供更优的选择。来自上海交通大学的团队撰写的综述论文《Diffusion Models for Reinforcement Learning: A Survey》梳理了扩散模型在强化学习相关领域的应用。综述指出现有强化学习算法面临长序列规划误差累积、
3/11/2024 11:46:00 AM
机器之心
大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀
剧本杀是一种广受欢迎的多角色扮演侦探游戏,要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理,玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类:平民的目标是找出隐藏在他们中间的凶手,而凶手则尽力隐藏自己的身份,避免被发现。那么,如果让 AI 加入游戏,会产生怎样的新变化呢? 剧本杀游戏流程。加拿大蒙特利尔大学和 Mila 研究所的研究团队带来了一项令人兴奋的新研究,将 AI 的潜力引入到剧本杀游戏中。这项
3/11/2024 11:45:00 AM
机器之心
OPPO 刘作虎内部讲话:AI 手机不是噱头,3 个月内友商必定都会跟进
3 月 11 日上午消息,新浪科技获悉,OPPO 高级副总裁、首席产品官,一加创始人刘作虎近日在一加内部会中回应了行业热议的 AI 手机话题。他表示,AI 手机不是噱头,而是行业大势所趋,3 个月内友商必定都会跟进。新浪科技独家获悉的内部会视频显示,在讲话开始,刘作虎首先总结了一加的业绩情况。刘作虎透露,一加在 2023 和 2024 开年都取得了领先行业的增速,其中 2024 年开年实现了同比去年 40% 的增长。2022 年,在一加 9 周年时,OPPO 正式宣布开启双品牌时代,OPPO 线上就是一加。同时,O
3/11/2024 9:33:28 AM
张俊
基于生成式 AI 技术,汤姆猫正在研发一款语音交互陪伴机器人
感谢汤姆猫公司日前公布了新一期的“投资者关系活动记录表”,披露了公司在 AI 领域的布局。据介绍,汤姆猫公司国内研发团队与西湖心辰合作的汤姆猫 AI 讲故事等产品,已初步完成主要功能的测试,公司海外团队研发的首款 AI 手游《Talking BenAI》已在斯洛文尼亚、塞浦路斯、南非等地区开启首轮海外测试。此外,公司 AI 硬件团队正研发一款基于生成式人工智能技术的 AI 语音交互陪伴机器人,预计将为公司业务带来全新增长空间。汤姆猫透露,此前一款全新适配 MR / VR 硬件的产品原型已经在苹果 Vision
Pr
3/11/2024 9:04:56 AM
浩渺
百度实战案例!百科AI对话式体验设计完整复盘
导语
近年来 AI 发展如火如荼,大模型诞生与技术的积累和不断创新,带来了人机交互方式的革新。各大厂也纷纷结合自身业务场景进行模型和应用的开发,AI 正以惊人的速度改变着我们的生活和工作方式。面对生成式 AI 的行业浪潮,百度百科产研团队也在探索如何结合大模型能力,发挥百科在泛知识领域的优势,延展百科场景 AI 特色体验,强化内容浏览的体验感及效率性,契合用户对百科的期望,带给用户更极致的知识消费体验。一、认知建立——0到1建设消费新场景
我们初步要做的是利用生成式 AI 的能力来解决词条冗长内容阅读的问题。在此基
3/11/2024 8:37:06 AM
团队百度MEUX
OpenAI 视频生成服务 Sora 引发隐私担忧,意大利数据监管机构展开调查
感谢意大利数据保护机构 (Garante) 周五宣布,已对微软支持的 OpenAI 公司开发的一项服务展开调查,这个名为 Sora 的服务可以根据文本提示生成视频。监管机构要求 OpenAI 澄清其向用户和非用户告知其产品 Sora 使用的数据的方式是否符合欧盟法规。OpenAI 公司暂未对此事发表评论。意大利数据监管机构是欧盟国家中最为积极的监管机构之一,一直致力于评估人工智能平台是否符合欧盟的数据隐私法规。IT之家注意到,去年该机构就以涉嫌违规使用用户数据为由,禁止了聊天机器人 ChatGPT 在意大利的使用。
3/10/2024 5:42:41 PM
远洋
调查:AMD AI 芯片 Instinct MI300X 吸引大量用户弃用英伟达
根据最近的一项调查,大量人工智能专业人士正计划从英伟达转向采用 AMD Instinct MI300X GPU。TensorWave 联合创始人 Jeff Tatarchuk 透露,他们进行了一项独立调查,涵盖 82 名工程师和人工智能专业人士。其中,约有 50% 的受访者表示他们对 AMD Instinct MI300X GPU 充满信心,因为相比于英伟达的 H100 系列产品,MI300X 不仅拥有更出色的性价比,而且供应充足,避免了遇到货源紧张的问题。Jeff 还提到,TensorWave 公司也将采用 MI
3/10/2024 5:17:03 PM
远洋
百度李彦宏:“程序员”职业将不复存在,未来编程语言只会剩下英文和中文
感谢在 3 月 9 日央视的《对话》・开年说节目上百度创始人、董事长兼首席执行官李彦宏表示,以后不会存在“程序员”这种职业了,因为只要会说话,所有人都能具备程序员的能力。“未来的编程语言只会剩下两种,一种叫做英文,一种叫做中文。”李彦宏说道。谈到“百模大战”,李彦宏看来,这是对社会资源很大的浪费。大家不要去“卷”大模型,去“卷”应用,只有应用才真正直接创造价值。同时,他强调,做出上亿用户使用的应用时,大模型的真正价值才得到体现。对于未来两年大模型会对人类生活或生产带来怎么改变,李彦宏认为,“互联网改变我们的很多生活
3/10/2024 3:58:23 PM
远洋
ChatGPT 每天耗电超 50 万度,是美国普通家庭 1.7 万多倍
感谢据 The New Yorker 报道,热门聊天机器人 ChatGPT 每天需要处理超过 2 亿次请求,其电量消耗可能高达每天 50 万千瓦时。相比之下,美国普通家庭每天的平均用电量仅为 29 千瓦时,这意味着 ChatGPT 的日耗电量是普通家庭的 1.7 万倍以上。更令人担忧的是,随着生成式人工智能的普及,其电量消耗可能会进一步激增。荷兰中央银行数据科学家 Alex de Vries 在一份发表于可持续能源期刊《焦耳》上的论文中计算得出,如果谷歌将生成式人工智能技术应用于所有搜索,其每年将消耗约 290 亿
3/10/2024 3:50:10 PM
远洋
Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限
谷歌 Gemini 修改 bug 让网友大开眼界!X 一小伙分享,为测试 Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了 3 个 bug,并分别录制了网页 bug 视频。接着把代码库打包成文件连同视频一起输给了 Gemini 1.5 Pro,提示它找到并修复代码中的所有 bug,且要提供一个简要指南以及所做更改的说明。没想到,Gemini 1.5 Pro 还真就分分钟正确识别并修复了每一个 bug。小伙将这种玩法 po 出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。其本人还在评论区强调,
3/10/2024 2:30:22 PM
清源
文生视频平台 Pika 喜提功能升级:视频有声音了,可生成各种背景音效
文生视频平台 Pika 今日凌晨通过 X 平台官宣新功能:视频可以集成 AI 生成的音效了。用户现可在 Pika 生成的视频中无缝生成、整合声音,可以通过提示词来描述想要的声音,或者直接让 Pika 根据视频内容自动生成声音。“如果您觉得它很酷,那是因为它的确很酷。抱歉,我们之前静音了!”与此同时,官方放出了一段预告片和几个 DEMO,预告片中的车辆鸣笛声、刀剑呼啸声均与视频内容匹配,而在 DEMO 演示中,烤肉的滋滋声和海底的水声也可以说与画面主题非常吻合。 据介绍,该功能目前仅面向“超级合作者”和专业用
3/10/2024 2:21:59 PM
清源
首个自主完成人类任务机器人出现,五指灵活速度超人,大模型加持虚拟空间训练
【新智元导读】Sanctuary AI 发布了世界第一个能够以人类的速率自主完成任务的机器人,他们通过在远程控制机器人操作获取数据,在虚拟空间训练,完成了这一壮举。这周,由 OpenAI,微软,贝索斯,英伟达投资的机器人公司 Figure AI 融资接近 7 亿美元,号称在 1 年之内要做出等独立行走工作的人形机器人。而特斯拉的擎天柱也屡屡传出好消息。没人怀疑,今年会是人形机器人爆发的一年。一家位于加拿大的机器人公司 Sanctuary AI 最近发布了一款全新的人形机器人 Phoenix,官方号称它能以和人类一样
3/10/2024 1:50:41 PM
清源
中国首部文生视频 AI 动画片,《千秋诗颂》英文版今日发布
感谢据央视新闻报道,今日,由中央广播电视总台打造的中国首部文生视频 AI 系列动画片《千秋诗颂》英文版在总台 CGTN 正式上线发布。据介绍,《千秋诗颂》是首部以我国自主研发 AIGC 技术支撑制作的系列动画片。动画片依托总台 "央视听媒体大模型",运用 AI 人工智能技术将国家统编语文教材中的诗词转化制作成唯美的国风动画。2 月 26 日至 3 月 2 日,《千秋诗颂》在总台央视综合频道开播,播出后反响热烈,六集节目收视率在全国所有上星频道动画片中位居第一。报道称,《千秋诗颂》系列动画片英文版同样采用总台最新 A
3/10/2024 1:27:51 PM
浩渺
百度李彦宏:对于 ChatGPT 和文心一言“有着天壤之别”的言论并不生气
央视财经频道昨晚播出《对话・开年说》节目,访谈嘉宾为百度创始人、董事长李彦宏。李彦宏谈到了当前对于文心一言的负面评价,他表示,对“ChatGPT 和文心一言有着天壤之别”的言论并不生气,希望在一年内能够改变这些人的想法。李彦宏表示,对于文心一言是非常有信心的,任何一个能够拿到专业版使用权的人可以和 GPT-4 比较一下。对于人工智能的发展速度,李彦宏称“比我想象中的更慢”:这一概念已被提出快 70 年了,可能每过十年左右,就有一群人说,我们终于要实现通用人工智能了。但其实情况比想象中要复杂。李彦宏称文心一言 4.0
3/10/2024 10:24:42 AM
清源
AI“复活”逝者成生意,专家建议避免侵犯他人合法权益
据《法治日报》近日报道,在一些电商平台上,有不少做 AI“复活”生意的商家,标价从几元、几十元到上百元乃至数千元。与此同时,近年来,AI 换声、AI 换脸等诈骗手段也越来越高级,欺骗用户的情感和钱财。受访专家建议,AI“复活”技术提供者提供服务前,应明确要求用户提供相关证明,并加强技术防范,避免 AI 产品侵犯他人合法权益或被用于欺诈等不法行为。相关部门要加强监管,推动建立行业标准,既保证技术创新,也要保障人类的价值和尊严。IT之家此前报道,近日一名男子通过 AI 换脸技术成功“复活”去世的父亲。视频中,这名男子为
3/10/2024 9:00:30 AM
浩渺
微软开始为 Copilot Pro 用户推出创建自定义 GPT 功能
微软 Bing 副总裁 Michael Schechter 表示,微软已经开始面向 Copilot Pro 用户推出 Copilot GPT Builder 功能,允许用户打造属于自己的自定义 AI 机器人。如图所示,微软 Copilot GPT Builder 目前正在分阶段推出,拥有体验资格的 Copilot Pro 用户可以看到一个新的预览功能,点击即可通过自定义配置创建一个个性化 Copilot GPT。微软今年 1 月为 Copilot 推出了一项可选订阅服务 Copilot Pro,每月收费 20 美元
3/9/2024 8:29:06 PM
问舟
世界知识产权组织正在设计 AI 驱动注册体系,将推出 IP Chat BOT
感谢据中新网消息,世界知识产权组织(WIPO)中国办事处主任刘华透露,作为其五套“金钥匙”之一,世界知识产权组织正在设计第三代注册体系 AI based,也就是以人工智能为驱动的注册体系,并将很快推出一款 IP Chat BOT。刘华称,世界知识产权组织是一座“知识财富的金矿”,目前有政策平台、注册体系、专利数据库、合作平台和能力建设五套“金钥匙”。她表示,作为第二套“金钥匙”的注册体系,包括申请国际专利的专利合作条约(PCT)体系,国际商标注册申请的马德里体系,国际外观设计注册申请的海牙体系等,世界知识产权组织现
3/9/2024 2:31:26 PM
浩渺
资讯热榜
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇
蚂蚁集团携手北医三院成立AI医疗联合实验室 打造专属AI就医助理
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
AI新词
芯片
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视频生成
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用