AI在线 AI在线

资讯列表

全国首批人形机器人具身智能标准发布:按下肢运动、上肢作业等分 4 个等级

据浦东发布消息,人形机器人及具身智能创新论坛昨日在上海召开,国家地方共建人形机器人创新中心联合行业内头部企业和机构,共同发布全国首批人形机器人具身智能标准 ——《人形机器人分类分级应用指南》《具身智能智能化等级分级指南》。 ▲ 图源浦东发布公众号《人形机器人分类分级应用指南》定义了人形机器人通用、结构、智能相关的术语名词,从结构外观、移动方式、智能模型等方面进行指导分类,按照具身智能、下肢运动、上肢作业、应用环境等作为分级要素,将人形机器人划分为 L1-L4 四个技术等级(详细标准暂未公开,下同)。 《具身智能智能化等级分级指南》规定了具身智能技术领域的智能化等级划分依据,采用系统功能性、自主性、泛化性的分级原则,按照感知、认知、决策、自主等核心能力作为分级要素,将智能化等级从基础到高级智能化水平划分为 G1-G5 五个阶段。
10/29/2024 4:26:39 PM
沛霖(实习)

智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等

北京智源人工智能研究院(BAAI)推出了新的扩散模型架构 OmniGen,这是一种用于统一图像生成的多模态模型。 ▲ 文本生成图像,编辑生成图像的部分元素,根据生成图像的人体姿态生成重绘图像,从另一图像中提取所需对象与新图像融合官方表示,OmniGen 具有以下特点:统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉条件生成等。 此外,OmniGen 可以处理经典的计算机视觉任务,将其转换为图像生成任务。
10/29/2024 4:11:56 PM
沛霖(实习)

TMI2024 | 阿大、同济等提出TraCoCo,用于3D医学图像半监督分割

编辑 | ScienceAI3D 医学图像分割方法已经取得了成功,但它们对大量体素级标注数据的依赖是一个需要解决的缺点,因为获取这些标注的成本很高。 半监督学习(SSL)通过使用大量未标注数据和少量标注数据进行模型训练,解决了这一问题。 最成功的 SSL 方法基于一致性学习,即通过最小化从扰动视图中获得的模型响应之间的距离来实现的。
10/29/2024 2:26:00 PM
ScienceAI

Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser

从 AlphaGo、AlphaZero 、MuZero 到 AlphaCode、AlphaTensor,再到最近的 Gemini 和 AlphaProof,Julian Schrittwieser 的工作成果似乎比他的名字更广为人知。 今天的 AI 社区,再次被一则大佬转会消息吸引了目光。 在谷歌工作十年后,大名鼎鼎的谷歌 DeepMind Alpha 系列核心作者 Julian Schrittwieser,宣布加入 Anthropic。
10/29/2024 2:25:00 PM
机器之心

丹麦首台AI超级计算机,NVIDIA技术加持,服务于量子计算、清洁能源、生物技术等领域

编辑 | 萝卜皮2024 年 10 月 23 日 NVIDIA 创始人兼首席执行官黄仁勋携手丹麦国王启动该国最大 AI 超级计算机,旨在实现量子计算、清洁能源、生物技术等领域的突破,服务丹麦社会乃至全球。 丹麦首台 AI 超级计算机以丹麦神话中的女神命名为 Gefion。 Gefion 由丹麦人工智能创新中心 (DCAI) 运营,该公司由全球最富有的慈善基金会 Novo Nordisk 基金会和丹麦出口与投资基金资助成立。
10/29/2024 2:24:00 PM
ScienceAI

神秘模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney

一夜之间,名为“red_panda” (小熊猫)的神秘文生图模型狠狠火了! ! 登顶文生图竞技场,直接将 Flux、Midjourney 等一众顶尖模型踩在脚下 ——其 ELO 得分比 Flux 1.1 Pro 高出 100 多,胜率高达 79%,每 7 秒就能生成一张图像。
10/29/2024 1:35:35 PM
汪淼

古早费曼论文手写公式也能转LaTeX,还能看懂梗图,马斯克Grok新功能上线就火了

Grok 大模型终于能看懂图像了。 设想一下,如果我们能够将所有 LaTeX 时代之前的文本资料输入到先进的大型语言模型(LLM)中,并从中获得格式规范的 LaTeX 文档库,这无疑将极大地推动科学文献的数字化进程和标准化工作。 对于科研工作者而言,这不仅仅是技术层面的飞跃,它更标志着知识管理和信息传播方式的一次重大变革。
10/29/2024 1:29:00 PM
机器之心

新扩散模型OmniGen一统图像生成,架构还高度简化、易用

大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。 然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。 近日,智源推出了新的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。
10/29/2024 1:24:00 PM
机器之心

强化学习训练一两个小时,100%自主完成任务:机器人ChatGPT时刻真来了?

把平均成功率从 50% 拉到了 100%。 最近,AI 的进步有目共睹,现在这些进步已经开始传递到机器人领域。 强大的 AI 技术也能帮助机器人更好地理解其所处的物理世界并采取更合理的行动。
10/29/2024 1:21:00 PM
机器之心

权威AI开源标准1.0版发布:Llama也不算开源

大模型开源的口号,不是随便说说的。 该来的终于来了。 本周,人工智能领域迎来了对于「开源」的官方定义。
10/29/2024 1:17:00 PM
机器之心

超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
10/29/2024 1:15:00 PM
机器之心

国庆期间被 AI 雷军“骂了 7 天”,雷军本人呼吁网友不要再玩

感谢在今年国庆假期期间,一些网友利用 AI 技术克隆雷军的声音,借此吐槽不文明行为或表达对他人的不满,有网友戏称“被 AI 雷军追着骂了整个假期”。 对此,雷军本人今日发布视频回应称,的确让自己挺困扰,也挺不舒服。 雷军表示希望大家不要再玩了,觉得这个事情不太好,不过他还是觉得 AI 是很好的技术,也非常实用。
10/29/2024 12:56:24 PM
汪淼

华为云董理斌:解难题做难事,AI重塑千行万业

10 月 28 日,新浪新闻・2024 探索大会在北京召开,邀请专家学者、行业领袖,以及数字技术领域的探索者和从业者们,就新质生产力赋能产业、企业数字化转型、数字生态构建等热点话题展开深入探讨。 华为云 Marketing 部部长董理斌发表题为 “解难题做难事,AI 重塑千行万业” 的主题演讲,分享华为云在 AI for Science 领域的最新进展,以及盘古大模型、昇腾 AI 云服务等创新技术。 华为云 Marketing 部部长董理斌发表主题演讲人工智能正在改变我们进行科学研究的方式,增强人类探索以前难以解决的问题的能力。
10/29/2024 11:42:00 AM
新闻助手

微软开源 OmniParser 纯视觉 GUI 智能体:让 GPT-4V 秒懂屏幕截图,可操控手机 / 电脑

科技媒体 marktechpost 于 10 月 24 日发布博文,报道称微软公司宣布开源 OmniParser,是一款解析和识别屏幕上可交互图标的 AI 工具。 项目背景传统的自动化方法通常依赖于解析 HTML 或视图层次结构,从而限制了其在非网络环境中的适用性。 而包括 GPT-4V 在内的现有的视觉语言模型(VLMs),并不擅长解读复杂 GUI 元素,导致动作定位不准确。
10/29/2024 10:01:35 AM
故渊

消息称 Meta 正开发自家 AI 搜索引擎:追赶 OpenAI,降低对微软、谷歌的依赖

感谢科技媒体 The Information 昨日(10 月 28 日)发布博文,报道称 Meta 公司一方面为减少对微软、谷歌的依赖,另一方面追赶 OpenAI 在 AI 领域的发展,正开发一款 AI 搜索引擎。 AI在线援引该媒体报道,内置于 Instagram 和 Facebook 的 Meta AI 机器人目前调用谷歌公司的 Google 和微软 Bing 搜索引擎,来回答用户关于近期新闻和事件的问题。 而消息称 Meta 公司早在 8 个月前就组建了专门的团队,通过网络爬虫收集了大数量网页数据,并建立了一个信息数据库。
10/29/2024 8:49:19 AM
故渊

谷歌扩展 AI 总结搜索结果功能至全球 100 多个市场,覆盖 10 亿月活用户

感谢谷歌公司昨日(10 月 28 日)发布博文,宣布在全球 100 多个国家和地区扩展 AI Overviews in Search 功能,覆盖全球 10 亿月活跃用户。 AI在线注:谷歌公司于今年 5 月在美国启动 AI Overviews in Search 功能,并于今年 8 月扩展到部分美国以外的市场,该功能主要用于 AI 总结搜索结果,让用户找到更契合的搜索结果。 谷歌在博文中表示,将于本周开始将会在全球 100 多个国家和地区推出 AI Overviews 功能,覆盖全球 10 亿月活跃用户。
10/29/2024 8:14:46 AM
故渊

AI 电商设计新思路!Midjourney 一站搞定 N 种不同风格的场景素材

大家好,我是花生。 自 Midjourney 的外部编辑功能上线后,我就一直有探索它在不同设计上的应用思路,尤其是电商设计这一块,没想到真得到了一些不错的结果。 虽然只是比较初步的尝试,但从中能看到新版 Midjourney 在电商场景设计方面的巨大应用潜力,相信能给你带来新的启发和灵感。
10/29/2024 7:58:25 AM
夏花生

大厂实战!百度「捏合总结」功能设计复盘

百度APP个人中心 AI 版重构设计复盘前言AI 能力的迅猛发展,为产品设计带来了很多新的可能性和机会。 阅读文章 . 前言.
10/29/2024 1:38:43 AM
百度MEUX 团队