这项
Meta 发布 Sapiens 视觉模型,让 AI 分析和理解图片 / 视频中人类动作
Meta Reality 实验室最新推出了名为 Sapiens 的 AI 视觉模型,适用于二维姿势预估、身体部位分割、深度估计和表面法线预测 4 种以人为中心的基本视觉任务。这些模型的参数数量各不相同,从 3 亿到 20 亿不等。它们采用视觉转换器架构,任务共享相同的编码器,而每个任务有不同的解码器头。二维姿势预估:这项任务包括检测和定位二维图像中人体的关键点。这些关键点通常与肘、膝和肩等关节相对应,有助于了解人的姿势和动作。身体部位分割:这项任务将图像分割成不同的身体部位,如头部、躯干、手臂和腿部。图像中的每个像
8/24/2024 2:36:02 PM
故渊
英伟达将在中东五国数据中心部署 AI 技术,首次在当地大规模推出产品
据路透社报道,卡塔尔电信集团 Ooredoo 首席执行官 Aziz Aluthman Fakhroo 当地时间 23 日在接受采访时表示,公司已经与英伟达签署协议,将在该公司于中东 5 个国家拥有的数据中心部署 AI 技术。此举意味着英伟达首次在中东地区大规模推出产品,Ooredoo 将成为该地区首家能够为其数据中心客户提供直接访问英伟达 AI 和图形处理技术权限的公司。此前,华盛顿曾限制向该地区出口美制尖端芯片。IT之家注:上文提到的 5 个中东国家包括卡塔尔、阿尔及利亚、突尼斯、阿曼、科威特。除此之外,Oore
6/24/2024 9:12:38 AM
清源
- 1
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
大模型
数据
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
腾讯
Stable Diffusion
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
研究
AI视频
大语言模型
生成
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
场景
深度学习
DeepMind
架构
生成式AI
编程
视觉
Transformer
预测
AI模型
伟达
亚马逊
MCP