阿里模型
阿里开源最新多模态模型 Qwen2.5-VL-32B:主打视觉语言,数学推理也很强
此前开源家族视觉语言模型 Qwen2.5-VL 包括 3B、7B 和 72B 三种尺寸。这一次的 32B 版本进一步兼顾尺寸和性能,可在本地运行。
3/25/2025 9:26:54 AM
汪淼
阿里万相视频生成大模型宣布开源:8.2GB 显存就能跑,测试超越 Sora
此次开源采用最宽松的 Apache2.0 协议,14B 和 1.3B 两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在 Github、HuggingFace 和魔搭社区下载体验。
2/25/2025 10:49:15 PM
汪淼
- 1
资讯热榜
GPT-5 登场?OpenAI 预告北京时间明天凌晨 1 时直播
月之暗面开源 Kimi-K2:万亿参数,超强Agent,全线 SOTA
19种玩法超全总结!即梦 AI 垫图指南(附提示词)
AI Programming Tools Gradually Shift to Terminal Interface, Future Development May Be Transformed Completely!
Moon's Dark Side Kimi K2 API is Slow, Being Optimized Intensively!
Apple MLX Supports NVIDIA CUDA, AI Developers Benefit from Cost and Efficiency
ChatGPT 有望原生支持编辑 Excel 和 PPT 文件,OpenAI 挑战微软 Office
揭秘大模型的魔法:从Transformer架构开始,一步步揭开它的神秘面纱
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
Anthropic
英伟达
代码
智能体
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
生成式
腾讯
苹果
LLM
神经网络
AI新词
3D
Claude
研究
生成
机器学习
AI for Science
计算
xAI
人形机器人
Sora
AI视频
Agent
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
预测
大型语言模型
深度学习
伟达
RAG
Transformer
具身智能
视觉
神器推荐
亚马逊
视频生成
AGI
Copilot
DeepMind
模态
LLaMA
文本