Huggingface
Hugging Face 推出 “Pi-Zero”,AI机器人更容易构建和部署
近日,Hugging Face 与 Physical Intelligence 联合推出了 “Pi0”(Pi-Zero),这是首个将自然语言命令直接转化为物理动作的基础模型。 这一创新性发布吸引了广泛关注,Hugging Face 的首席研究科学家 Remi Cadene 在社交媒体上宣布,“ Pi0是最先进的视觉语言动作模型,能够将自然语言命令转化为自主行为。 ”“Pi0” 的推出标志着机器人领域的一次重大变革,类似于 ChatGPT 在文本生成领域的影响力。
Hugging Face研究人员构建OpenAI深度研究工具“开放”版本
人工智能开发平台 Hugging Face 最近宣布,他们已成功构建了OpenAI 深度研究工具的“开放”版本,旨在与 OpenAI 最近发布的深度研究工具进行竞争。 OpenAI 在一次活动中展示了其深度研究工具,这一工具能够通过爬取互联网信息,自动编制有关各种主题的研究报告。 但遗憾的是,该工具目前仅对订阅了 OpenAI 每月200美元的 ChatGPT Pro 计划的用户提供有限的使用权限。
Hugging Face 推出小巧AI模型,助力设备性能提升
近期,人工智能开发平台 Hugging Face 团队发布了两款新型 AI 模型,SmolVLM-256M 和 SmolVLM-500M。 他们自信地声称,这两款模型是目前为止体积最小的 AI 模型,能够同时处理图像、短视频和文本数据,尤其适合内存少于1GB 的设备如笔记本电脑。 这一创新让开发者在处理大量数据时,能够以更低的成本实现更高的效率。
300倍体积缩减!Hugging Face推SmolVLM模型:小巧智能,手机也能跑AI
Hugging Face 推出了一款令人瞩目的 AI 模型 ——SmolVLM。 这款视觉语言模型的体积小到可以在手机等小型设备上运行,且性能超越了那些需要大型数据中心支持的前辈模型。 SmolVLM-256M 模型的 GPU 内存需求不足1GB,性能却超过了其前代 Idefics80B 模型,这一后者的规模是其300倍,标志着实用 AI 部署的一个重大进展。
3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源
如果给小模型更长的思考时间,它们性能可以超越更大规模的模型。 最近一段时间,业内对小模型的研究热情空前地高涨,通过一些「实用技巧」让它们在性能上超越更大规模的模型。 可以说,将目光放到提升较小模型的性能上来有其必然性。
用Mac训练个机器人叠衣服,HuggingFace开源全套教程,开源AI机器人革命要来了?
这是机器人界的 Llama? 靠 100 条轨迹数据,在 Mac 上训练几个小时,就能拥有一个可以抓取乐高积木的机械臂,这是 HuggingFace 机器人科学家 Remi Cadene 晒出的一个实例。机器人的门槛可能并没有想象中那么高。Remi Cadene 之前是特斯拉人形机器人 Optimus(擎天柱)项目的成员,3 月份被挖去 HuggingFace,领导一个新的开源机器人项目 ——LeRobot,当时引发了一些轰动。LeRobot 基于有史以来最大规模的众包机器人数据集,它的代码库堪称机器人领域的「T
超越LLama2,通义千问登顶HuggingFace开源大模型排行榜榜首
12月8日消息,全球最大的开源大模型社区HuggingFace日前公布了最新的开源大模型排行榜,阿里云通义千问力压Llama2等国内外开源大模型登顶榜首。HuggingFace的开源大模型排行榜(Open LLM Leaderboard)是目前大模型领域最具权威性的榜单,收录了全球上百个开源大模型,测试维度涵盖阅读理解、逻辑推理、数学计算、事实问答等六大评测。通义千问(Qwen-72B)表现抢眼,以73.6的综合得分在所有预训练模型中排名第一。通义千问-72B登顶HuggingFace的Open LLM Leade
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉