应用
普渡初代类人形机器人 PUDU D7 发布:算力 200 TOPS、自由度 30 DOF
普渡机器人今日发布初代类人形机器人 PUDU D7,基于仿生双臂和全向移动底盘设计,能够在多个场景中执行复杂任务操作。AI在线注意到,PUDU D7 预计将在 2025 年实现商业化落地。该机器人身高 165 厘米,重量 45 公斤,仿生臂的单臂展达到 65 厘米,整机拥有 30 个自由度,配备灵巧手后,自由度将提升至 50。PUDU D7 具备类人的构型,底部配备通用的移动能力,底盘支持 360 度全向移动,最大速度 2 米 / 秒,能在最大 10 度的斜坡上稳定运行。D7 的电池容量超过 1KWh,可持续工作超
9/19/2024 7:26:13 PM
沛霖(实习)
引领通用具身新时代:普渡发布首款类人形机器人PUDU D7
9月19日,全球服务机器人领军企业普渡机器人正式发布其初代类人形机器人PUDU D7。基于仿生双臂和全向移动底盘设计,PUDU D7能够在多个场景中执行复杂任务操作,更好地满足跨行业客户真实的多样化需求。该款机器人预计将在2025年实现全面商业化落地,为通用具身服务机器人的商业化应用带来突破性变革。普渡初代类人形机器人PUDU D7普渡机器人创始人兼CEO张涛表示:“作为普渡的核心价值观,发明家精神推动我们不断创新与进步。PUDU D7的发布标志着我们在构建专用型机器人、类人形机器人和人形机器人的重要一步。通过推进
9/19/2024 6:43:00 PM
新闻助手
快手可灵 AI 发布 1.5 模型:新增“运动笔刷”,支持生成 1080p 视频
快手可灵 AI 今日面向全球发布可灵 1.5 模型,新增“运动笔刷”功能。据介绍,“运动笔刷”功能为图片中的元素(人或物体等)指定运动轨迹,还支持额外指定静止区域,提升画面可控性。同时,可灵 AI 的视频画质有所提升,支持生成 1080p 视频,同时构图更美观、动作更合理、文本相关性提升。快手高级副总裁盖坤 9 月 13 日在投资者日上披露,截至目前,已有超过 260 万人使用过快手的视频生成大模型可灵 AI,并累计生成超 2700 万个视频。产品发布以来,可灵 AI 已进行了 9 次迭代和升级,近期,可灵 AI
9/19/2024 5:56:27 PM
汪淼
CoT能让模型推理能力无上限?田渊栋、LeCun下场反对:两层MLP还能模拟全世界呢
「这相当于在理论上,两层神经网络在理论上可以拟合任何数据,我们就盲目相信并应用在所有场景中。」大模型新范式 OpenAI o1 一经发布,如何「复刻」出 o1 便成为了 AI 圈最热的话题。由于 OpenAI 对技术细节守口如瓶,想从 AI 那里「套话」,让它复述完整的内部推理过程,多问几句,OpenAI 直接发邮件警告要撤销你的使用资格。想从技术报告中想找出点蛛丝马迹,也同样困难。于是,大家将目光转向了以往类似的研究成果,希望从中找到些线索。比如,Google Brain 推理团队创建者 Denny Zhou 立
9/19/2024 5:51:00 PM
机器之心
阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o
人工智能领域再度迎来重磅消息! 2023 年 8 月,通义首次开源后迅速引起全球开发者的关注和热议,短短一年时间内,阿里云大模型又迎来了重要升级。 在 9 月 19 日的云栖大会上,CTO 周靖人宣布:通义千问发布新一代开源模型 Qwen2.5,开源旗舰模型 Qwen2.5-72B 性能超越 Llama 3.1-405B,再次登上全球开源大模型的王座;通义旗舰模型 Qwen-Max 全方位升级,性能已经逼近 GPT-4o。 发布现场,图源:泽南通义千问凭借不
9/19/2024 5:31:00 PM
机器之心
留子们用火星文写避雷帖,AI竟看懂了?我们实测:几乎全军覆没
AI好好用报道编辑:杨文这种用法也是够邪门的。留子们在写一种很新的差评。由于全球点评打卡平台,都有个自动翻译的功能,为了防止被店家骚扰,也为了给同胞避雷,身在海外的国人们,想出各种奇招优雅给差评。例如,打 5 分忽悠老板,再用中文加密:用中文谐音写了一堆差评,然后在结尾给个虚假好评,商家拿翻译器一翻,只看到一个早餐不错。还有人费老大劲儿,用米粒摆出「报吃」的汉字,中国人一看就懂:更有甚者,重启上古火星文,直接干翻各类翻译器。但是,最近有网友发现,这段如同计算机乱码的火星文差评,AI 竟然也能读懂啦。-1-「哈利・波
9/19/2024 5:28:00 PM
AI好好用
SiFive 推出 Intelligence XM 系列 RISC-V 架构 AI 数据流处理器
RISC-V 设计企业 SiFive 当地时间昨日宣布推出 Intelligence XM 系列 AI 数据流处理器。这一系列属于 SiFive 的 Intelligence 智能处理器 IP 核家族,该家族还包括 X390 等产品。SiFive 表示 Intelligence XM 系列搭载同时具有扩展性和高效能的 AI 计算引擎,并延续了 SiFive IP 产品在计算密集型应用中优秀的每瓦性能表现。AI在线了解到,SiFive Intelligence XM 系列的基本单元是 XM 集群,每个 XM 集群包含
9/19/2024 5:26:57 PM
溯波(实习)
型号齐全,智元发布全系列灵巧手,挑战高自由度
8月18日智元年度新品发布会上,智元机器人发布了19自由度(12主动)视触觉灵巧手,至此智元机器人已经形成全系列灵巧手产品,包含12自由度五指灵巧手、6自由度五指灵巧手、二指夹爪、OmniPicker。下面我们来回顾一下这一系列产品。1. 视触觉五指灵巧手,挑战高自由度高自由度五指灵巧手始终是学术界和工业界的关注焦点,结构和功能上与人手相仿,为通用任务而生。智元机器人此次发布的视触觉灵巧手包含19个自由度,其中主动自由度12个,集成基于MEMS原理的触觉感知和视触觉感知技术,升级后的灵巧手在物体操作和感知上都展现出
9/19/2024 5:18:00 PM
新闻助手
阿尔特曼称 o1 仅仅是“推理模型的 GPT-2”,黄仁勋表示“给你加速 50 倍”
AI 界最有影响力的两个人,同时出现在一场活动:OpenAI CEO 阿尔特曼,暗示了 o1 满血版将在接下来几个月发布。英伟达创始人黄仁勋,则表示新一代 Blackwell 架构 GPU 能给 o1 推理提速 50 倍。阿尔特曼把 o1 在推理模型里的地位比作语言模型中的 GPT-2 阶段。几年后人们将看到“推理模型的 GPT-4”,不过最近几个月就会有重大改进,新范式的进步曲线非常陡峭。L2“推理者”与 L1“聊天机器人”非常不同,大家还没找到该怎么用这些模型,我们也没决定该为 App 继续添加什么功能。不过最
9/19/2024 4:41:34 PM
清源
传音与联发科共建人工智能联合实验室,聚焦手机端侧 AI 技术创新
9 月 13 日,传音控股与联发科共建的人工智能联合实验室在深圳揭牌。双方将整合人工智能领域的优势技术资源,加速推进 AI 技术在智能终端的应用和普及。传音控股高级副总裁张祺、TEX AI 中心总经理史团委,联发科技计算与人工智能技术事业群副总经理陆忠立博士、无线产品软件开发部协理李绍鼎共同为实验室揭牌。据传音控股官方介绍,此次成立的人工智能联合实验室,将聚焦大型语言模型、Agent 智能体、AI 语音、影像等领域在手机端的应用创新,提供更多生成式 Al 的端侧部署和优化方案,共同探索面向大众的 AI 智能体服务和
9/19/2024 2:43:55 PM
汪淼
阿里通义万相视觉生成大模型升级,支持文生视频、图生视频等
在今日的 2024 云栖大会上,阿里云发布了通义万相 Wanx 视觉生成大模型的新升级,能力全面进化。通义万相除了此前的文生图能力,现已支持文生视频、图生视频等,还有插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化能力。据阿里云官方透露,通义万相累计创作图片数已达 7500 万 ,累计用户数已达 93 万 。通义万相官网显示,全新发布自研 AI 视频生成大模型,具备“强大的画面视觉动态生成能力”,擅长概念理解与组合生成,优化中式元素表现,同时支持多语言与可变分辨率生成。AI在线附体验链接:
9/19/2024 2:35:09 PM
汪淼
阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama
感谢在今天的 2024 云栖大会上,阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5,其中,旗舰模型 Qwen2.5-72B 号称性能超越 Llama 405B。Qwen2.5 涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架 100 多个模型。Qwen2.5 语言模型:0.5B、1.5B、3B、7B、14B、32B 以及 72B;Qwen2.5-Coder 编程模型:1.5B、7B 以及即将推出的 32B;Qwen2.5-Math 数
9/19/2024 2:21:51 PM
汪淼
字节音乐大模型炸场!Seed-Music发布,支持一键生成高质量歌曲、片段编辑等
高质量音乐生成、高灵活音乐编辑,Seed-Music 再次打开了 AI 音乐创作的天花板。放假期间,本 i 人又领教了被 e 人支配的恐惧。跟 e 人朋友出门玩,先被拉去饭局尬聊,再和陌生人组队打本,下面这首歌真是唱出了 i 人心声。后两天假期就舒服多了。通关了黑神话悟空还不过瘾,我在家补经典 86 版的《西游记》。无论多少次重温,还是会被大圣的魅力吸引。 这歌怎么样,是不是感觉斗战胜佛活灵活现,如在眼前?实际上,两首歌都并非真人所作,而是全靠字节最新发布的音乐大模型 ——Seed-Music。Seed-Music
9/19/2024 1:03:00 PM
机器之心
硕博招生将启!AI排名跻身前15,全球首所人工智能大学MBZUAI实力大增
全世界第一所人工智能大学 MBZUAI 全球招贤纳才。自 2019 年 10 月成立以来,全球第一所人工智能大学 MBZUAI 便吸引了整个学术界的关注,并已在多个 AI 领域取得亮眼的成果。今年 5 月,MBZUAI 建立了 Institute of Foundation Models,继去年 10 月份和 G42 共同开发了最先进的阿拉伯语大模型之后,又独立开发了领先的 K2 开源模型,成为全世界唯一一个能够自行训练开发 65B 规模大模型的大学,引领了新一代基础模型的研究。同时,计算生物学方向的生命大模型研究
9/19/2024 12:58:00 PM
机器之心
图森未来无人车:转型 AIGC 游戏是为了活下去
“最近出现了大量不实言论和报道,给图森未来造成很大影响”。时隔数年图森高层首次集体现身,包括陈默、吕程、郝佳男 —— 分别是董事长、CEO 和中国区 CEO。也是图森目前“硕果仅存”的领导层。今年年初以来,昔日无人驾驶第一股曝出一系列动向:2 月,失去所有国内自动驾驶合作伙伴;3 月,被曝停止所有研发和商业化活动;5 月,前 CTO 也是创始团队之一王乃岩被曝离职,加入小米汽车;图森也在此时和北美监管机构达成和解协议;8 月,图森发布公告,转向 AIGC 影视动画赛道;9 月,一封股东匿名举报信流出,直指现在的领导
9/19/2024 11:46:26 AM
汪淼
阿里 CEO 吴泳铭:AI 算力需求渗透率超 50%,最大的想象力不在手机屏幕
感谢今日举办的 2024 云栖大会开幕式上,阿里巴巴集团董事兼 CEO、阿里云智能集团董事长兼 CEO 吴泳铭表示,“在新增的算力市场和算力需求中,超过 50% 以上的需求现在都由 AI 驱动产生,AI 算力的需求渗透已经超过 50%,已经占据主导地位,未来这一趋势还会持续地扩大。”“AI 计算正在加速演进,成为整个计算体系的主导,无论是端侧的计算还是云端的计算,这都是一个非常明显的趋势,生成式 AI 对数字世界和物理世界的重构,将带来计算架构的根本性变化。”吴泳铭表示,“过去几十年 CPU 主导的计算体系,正在加
9/19/2024 10:54:47 AM
汪淼
全球首个多模态地理科学大模型“坤元”发布,中国科学院打造
中国科学院地理科学与资源研究所、中国科学院青藏高原研究所、中国科学院自动化研究所等单位 9 月 19 日正式发布全球首个多模态地理科学大模型“坤元”(Sigma Geography)。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力。研发团队完成了地理学全谱系高质量语料库构建、地理科学语言大模型构建、地理科学研究智导平台研发等工作,让“坤元”具备“懂地理”“精配图”“知人心”“智生图”等特点,实现了地理专业问题解答、地理学文献智能分析、地理数据资源查询、地理数据挖掘分析、专题地图
9/19/2024 10:49:11 AM
汪淼
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
看一眼菜品图就知道怎么做、能给植物看病、能把手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图像。与大型语言模型(LLMs)相比,大语言模型在处理和生成文本数据方面有专长,而多模态大模型能够处理非文本数据,如图像等等。根据多模态权威综合评测平台OpenCompass的数据,Ovis1.6-Gemma2
9/19/2024 10:47:00 AM
新闻助手
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
DeepMind
特斯拉