Huggingface
从文本生成到指令编辑 OmniGen2重塑开源多模态模型应用场景
近日,VectorSpaceLab在Hugging Face平台正式开源全能多模态模型OmniGen2,以创新性双组件架构和强大的视觉处理能力,为研究者和开发者提供了高效的可控生成式AI基础工具。 这款模型由30亿参数的视觉语言模型(VLM)Qwen-VL-2.5与40亿参数的扩散模型组合而成,通过冻结的VLM解析视觉信号和用户指令,结合扩散模型实现高质量图像生成,在视觉理解、文本生成图像、指令引导图像编辑和上下文生成四大核心场景中展现出领先性能。 作为开源项目,OmniGen2的视觉理解能力继承自Qwen-VL-2.5的强大基础,可精准解析图像内容;其文本生成图像功能支持从文本提示生成高保真、符合美学标准的图像;在指令引导图像编辑领域,该模型以高精度完成复杂修改任务,性能达到开源模型中的前沿水平;而上下文生成能力更可灵活处理人物、物体、场景等多元输入,生成连贯新颖的视觉输出。
6/24/2025 11:00:41 AM
AI在线
OpenAI 推出开源客户服务代理框架,助力企业智能化转型
近日,OpenAI 发布了一款开源的客户服务代理示例,向开发者展示如何使用代理 SDK 构建智能的、工作流意识强的 AI 代理。 这一示例项目在 AI 代码分享平台 Hugging Face 上发布,采用 MIT 许可证,这意味着任何第三方开发者或用户都可以免费修改和使用这些代码,支持商业或实验用途。 这个客户服务代理示例展示了如何将航空相关请求路由到不同的专业代理,比如座位预订、航班状态、取消请求及常见问题解答。
6/19/2025 2:01:37 PM
AI在线
DeepSite V2升级!支持DeepSeek-R1-0528 模型,轻松生成3D网页动画,零代码也能玩转创意!
近日,DeepSite V2迎来重大更新,正式支持最新的 DeepSeek-R1-0528模型,为用户带来更强大的代码生成能力和实时预览体验。 AIbase编辑部整理了最新动态,深入剖析这一工具如何通过自然语言生成复杂网页代码,助力开发者与非专业用户实现创意落地。 体验地址: V2:AI驱动的网页生成利器DeepSite 是一款基于 DeepSeek 系列大模型的开源 AI 前端开发工具,由 Hugging Face 社区开发并托管。
6/19/2025 2:01:28 PM
AI在线
Groq携手Hugging Face挑战云服务巨头,AI 推理速度上新台阶
近日,人工智能推理初创公司 Groq 宣布了两项重磅消息,意在挑战亚马逊云服务(AWS)和谷歌等传统云计算服务提供商。 Groq 现在支持阿里巴巴的 Qwen332B 语言模型,并提供其完整的131,000-token 上下文窗口能力,这一技术优势在当前快速推理提供商中无出其右。 同时,Groq 也成为了 Hugging Face 平台的官方推理提供商,这意味着其技术将接触到全球数百万开发者。
6/17/2025 1:02:09 PM
AI在线
腾讯宣布混元3D 2.1大模型对外开源
在计算机视觉领域顶会之一CVPR2025上,腾讯宣布混元3D2.1大模型对外开源,此为首个全链路开源的工业级3D生成大模型,在行业内处于领先地位。 混元3D模型在知名开源社区和技术平台Hugging Face的下载量已超180万,开源效果获全球开发者认可。 此次升级的混元3D2.1模型在效果上有显著提升,上传首饰盒图片后,生成的3D首饰盒纹理清晰、质感细腻、光影一致。
6/16/2025 10:09:58 AM
AI在线
通义千问3大模型全球爆火:下载量超1250万,衍生模型13万+
据官方数据,阿里通义千问3大模型开源仅一个月,全球累计下载量已突破 1250万次,在 Hugging Face、魔搭社区、Ollama 等主流 AI 开源平台引发广泛关注。 目前,通义千问3共开放了 0.6B、8B、30B 和32B 四个尺寸的模型版本,各版本在上述平台下载量均突破百万,显示出强劲的全球开发者吸引力。 尤其在 Hugging Face 平台上,数据显示千问3不仅下载量领先,其衍生模型数量也已超过 13万个,跃居全球第一,反映出开发者社区围绕通义模型的高度活跃与创新热情。
6/9/2025 12:00:56 PM
AI在线
机械臂也能“接大模型”!Hugging Face LeRobot重磅开源,AI机器人研发门槛大降!
近日,Hugging Face推出的开源项目LeRobot引发了业界广泛关注。 这一项目通过整合最先进的机器学习算法和便捷的开发工具链,为开发者提供了一个高效、易用的机器人AI开发平台,堪称机器人领域的“Transformer时刻”。 统一接口,适配多款硬件LeRobot项目的一大亮点是其统一的硬件接口设计,能够无缝适配多种机器人硬件,包括机械臂、摄像头和电机等设备。
6/9/2025 11:00:56 AM
AI在线
谷歌悄然发布AI Edge Gallery:智能手机离线运行AI模型的创新突破
谷歌低调推出了一款名为Google AI Edge Gallery的实验性应用,标志着边缘计算和隐私优先的AI部署迈出了重要一步。 这款应用允许用户在智能手机上直接运行来自Hugging Face平台的开源AI模型,无需网络连接即可实现图像生成、文本处理、代码编辑等多项功能。 本地化AI的里程碑Google AI Edge Gallery通过谷歌的LiteRT(轻量运行时)技术,利用设备本地硬件运行AI模型,显著提升了数据隐私性和处理速度。
6/4/2025 10:01:29 AM
AI在线
Google AI Edge Gallery发布:Gemma 3n加持,本地AI应用开发从未如此简单!
在近期举办的Google I/O2025大会上,Google悄然推出了一款开源项目——Google AI Edge Gallery,一款完全本地运行的生成式AI应用,基于最新的Gemma3n模型,集成了多模态能力,支持文本、图片和音频输入。 这一项目以其高效的端侧AI性能和开源特性,为开发者提供了构建本地化AI应用的理想模板。 Google AI Edge Gallery:端侧AI的开源新标杆Google AI Edge Gallery是一款面向Android(iOS版本即将推出)的实验性应用,允许用户在本地设备上运行来自Hugging Face的多种开源AI模型,无需联网即可实现高效推理。
6/3/2025 11:00:54 AM
AI在线
谷歌推出AI Edge Gallery应用,实现离线智能手机AI处理
谷歌近期悄然推出了一款名为 AI Edge Gallery 的实验性 Android 应用,允许用户在不连接互联网的情况下直接在智能手机上运行复杂的人工智能模型。 这标志着谷歌在边缘计算和隐私保护方面迈出了重要一步。 AI Edge Gallery 应用支持用户从知名的 Hugging Face 平台下载和执行 AI 模型,能够实现图像分析、文本生成、编程辅助和多轮对话等功能,且所有数据处理均在本地完成,增强了用户的隐私保护。
6/3/2025 10:01:09 AM
AI在线
Hugging Face进军人形机器人市场:推出售价3000美元的开源机器人HopeJR
人工智能开发平台Hugging Face周四正式进军机器人硬件领域,发布了两款开源人形机器人产品,旨在打破大型科技公司对机器人技术的垄断。 两款新品各有特色该公司推出的两款机器人分别针对不同应用场景:HopeJR是一款全尺寸人形机器人,配备66个驱动自由度,具备完整的行走和手臂操作能力;Reachy Mini则是一款桌面级机器人,专注于头部运动、语音交互和AI应用测试。 在定价方面,HopeJR预计售价约3000美元,而Reachy Mini的价格区间为250-300美元,具体价格将根据关税情况调整。
5/30/2025 10:01:14 AM
AI在线
UIUC联手谷歌发布Search-R1 大模型学会边查百度边答题
最近AI圈炸出一项黑科技——让语言模型学会自己上网查资料!不仅考试分数暴涨41%,还解锁了"边推理边搜索"的究极形态。 今天带你们围观这场学术界的"作弊式进化",看完保证你想给自家AI办张网吧会员卡!论文地址: 主页:"人肉搜索插件"话说在某个月黑风高的实验室,一群教授盯着电脑屏幕集体瞳孔地震——他们家的AI做题时居然学会了"偷看小抄"!这波操作源自伊利诺伊大学的最新论文《Search-R1》,简单来说就是给语言模型装了个人工智障版"搜索引擎外挂"。 传统AI做题就像开卷考试:你先把维基百科塞它脑子里(RAG技术),结果这货要么翻错页,要么对着菜谱答高数题。
4/21/2025 6:00:37 PM
AI在线
Hugging Face上周最受欢迎模型榜单揭晓,AI创新热潮持续升温
Hugging Face近日公布了2025年4月第二周最受欢迎模型榜单,涵盖文本生成、图像生成到视频生成等多模态领域,凸显了AI技术的快速迭代与多元化应用。 据AIbase了解,本次榜单中的模型不仅展示了开源社区的创新活力,还反映了从低精度训练到多模态生成的技术趋势。 以下为榜单亮点解析,AIbase编辑团队为您带来专业解读。
4/21/2025 11:00:46 AM
AI在线
Reachy2机器人发布:互动自然,售价 7万美元
Hugging Face 宣布通过收购法国初创公司 Pollen Robotics,正式推出开源人形机器人 Reachy2。 这一消息在社交媒体和 AI 社区引发热烈讨论,被认为是人形机器人与生成式 AI 结合的重要里程碑。 作为专为 AI 研究和教育设计的“实验室伙伴”,Reachy2以其开源特性、先进功能和人性化设计,迅速成为全球顶尖实验室的关注焦点。
4/21/2025 9:00:47 AM
AI在线
WORLDMEM开源发布,革新长期一致性世界模拟技术
近日,WORLDMEM框架正式在Hugging Face平台开源发布,标志着长期一致性世界模拟技术的重要突破。 据AIbase了解,WORLDMEM通过引入记忆机制,解决了传统世界模拟模型在长期一致性与3D空间保持上的难题,为虚拟环境建模与交互预测提供了全新解决方案。 项目现已开放源代码,供全球开发者与研究人员免费使用,引发了AI与虚拟现实领域的广泛关注。
4/18/2025 3:00:39 PM
AI在线
Hugging Face 收购 Pollen Robotics,开启机器人新时代
在4月15日,知名开源大模型平台 Hugging Face 宣布收购 Pollen Robotics,正式迈入实体机器人领域。 尽管具体交易条款尚未公布,但此次收购将使 Pollen Robotics 的大约20名员工加入 Hugging Face。 这是该公司迄今为止规模最大的一次人员收购,表明其在扩展业务领域方面的雄心。
4/16/2025 4:01:05 PM
AI在线
知名开源大模型平台Hugging Face进军机器人领域,收购Pollen Robotics
近日,人工智能开发平台 Hugging Face 正式宣布收购法国人形机器人初创公司 Pollen Robotics,标志着其进军机器人领域的战略布局。 这笔交易的具体尚未透露,但引发了广泛关注。 Pollen Robotics 成立于2016年,由马修・拉皮埃尔和皮埃尔・鲁安奈两位工程师创立。
4/16/2025 3:01:05 PM
AI在线
人工智能开发平台Hugging Face 收购 Pollen Robotics,加速开源机器人发展
人工智能开发平台Hugging Face宣布收购法国机器人初创公司Pollen Robotics,交易金额未披露。 此举标志着Hugging Face首次进军硬件领域,旨在推动开源机器人技术在全球的普及与发展。 Pollen Robotics成立于2016年,总部位于法国波尔多,以开发开源人形机器人Reachy2闻名。
4/15/2025 12:02:18 PM
AI在线
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用