Tora
帕西尼发布第二代多维触觉人形机器人 TORA-ONE:双手集成近 2000 个自研 ITPU 传感单元
2024 世界机器人大会于 8 月 21 日在北京开幕,帕西尼感知科技发布了第二代人形机器人 TORA-ONE。第二代多维触觉人形机器人 TORA-ONE 双手集成近 2000 个自研的 ITPU 多维触觉传感单元,能捕捉并解析接触面上细微形变与多维度触感信息;本体自由度提升至 47 个,搭配 26 自由度的仿生灵巧手,支持自研的 VTLA-Model 视触觉多模态感知模型与 AI 视觉系统。▲ 第二代多维触觉人形机器人 TORA-ONEAI在线注意到,TORA-ONE 采用了高度模块化的设计理念,支持 1.46
8/23/2024 1:49:38 PM
沛霖(实习)
“神笔马良版 Sora”,阿里团队推出视频 AI 生成框架 Tora:画圈操控物体运动轨迹
阿里团队最新推出了 AI 视频生成框架 Tora,同时集成了文本、视觉和轨迹条件用于生成视频,是基于轨迹导向的扩散变换器(DiT)技术。Tora 由一个轨迹提取器(TE)、一个时空 DiT 和一个运动引导融合器(MGF)组成:TE 使用 3D 视频压缩网络将任意轨迹编码为分层时空运动补丁。MGF 将运动贴片集成到 DiT 模块中,以生成遵循轨迹的连贯视频。Tora 无缝契合 DiT 设计,支持制作最长 204 帧、720P 分辨率的视频,可以精确控制不同持续时间、宽高比和分辨率的视频内容。大量实验证明,Tora 在
8/6/2024 10:08:40 AM
故渊
阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律
你规定路线,Tora 来生成相应轨迹的视频。目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用 U-Net 架构 ,主要侧重于合成有限时长(通常约为两秒)的视频,并且分辨率和纵横比受到固定限制。Sora 的出现打破了这一限制,其采用 Diffusion Transformer(DiT)架构,不仅擅长制作 10 到 60 秒的高质量视频,而且还因其生成不同分辨率、各种纵横比、且遵守实际物理定律的能力而脱颖而出。可以说 Sora 是 DiT 架构最有利的证明,然而,基于 Transformer 的
8/4/2024 1:25:00 PM
机器之心
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind