Tora
帕西尼发布第二代多维触觉人形机器人 TORA-ONE:双手集成近 2000 个自研 ITPU 传感单元
2024 世界机器人大会于 8 月 21 日在北京开幕,帕西尼感知科技发布了第二代人形机器人 TORA-ONE。第二代多维触觉人形机器人 TORA-ONE 双手集成近 2000 个自研的 ITPU 多维触觉传感单元,能捕捉并解析接触面上细微形变与多维度触感信息;本体自由度提升至 47 个,搭配 26 自由度的仿生灵巧手,支持自研的 VTLA-Model 视触觉多模态感知模型与 AI 视觉系统。▲ 第二代多维触觉人形机器人 TORA-ONEAI在线注意到,TORA-ONE 采用了高度模块化的设计理念,支持 1.46
8/23/2024 1:49:38 PM
沛霖(实习)
“神笔马良版 Sora”,阿里团队推出视频 AI 生成框架 Tora:画圈操控物体运动轨迹
阿里团队最新推出了 AI 视频生成框架 Tora,同时集成了文本、视觉和轨迹条件用于生成视频,是基于轨迹导向的扩散变换器(DiT)技术。Tora 由一个轨迹提取器(TE)、一个时空 DiT 和一个运动引导融合器(MGF)组成:TE 使用 3D 视频压缩网络将任意轨迹编码为分层时空运动补丁。MGF 将运动贴片集成到 DiT 模块中,以生成遵循轨迹的连贯视频。Tora 无缝契合 DiT 设计,支持制作最长 204 帧、720P 分辨率的视频,可以精确控制不同持续时间、宽高比和分辨率的视频内容。大量实验证明,Tora 在
8/6/2024 10:08:40 AM
故渊
阿里「轨迹可控版Sora」,告别「抽卡」,让视频生成更符合物理规律
你规定路线,Tora 来生成相应轨迹的视频。目前,扩散模型能够生成多样化且高质量的图像或视频。此前,视频扩散模型采用 U-Net 架构 ,主要侧重于合成有限时长(通常约为两秒)的视频,并且分辨率和纵横比受到固定限制。Sora 的出现打破了这一限制,其采用 Diffusion Transformer(DiT)架构,不仅擅长制作 10 到 60 秒的高质量视频,而且还因其生成不同分辨率、各种纵横比、且遵守实际物理定律的能力而脱颖而出。可以说 Sora 是 DiT 架构最有利的证明,然而,基于 Transformer 的
8/4/2024 1:25:00 PM
机器之心
- 1
资讯热榜
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
LLM
字节跳动
Transformer
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构