阿里通义
阿里发布万相 2.6 系列模型,上线国内首个角色扮演功能
AI在线 12 月 16 日消息,阿里发布新一代万相 2.6 系列模型,该系列模型面向专业影视制作和图像创作场景进行了全面升级,全新的万相 2.6 是国内首个支持角色扮演功能的视频模型。 该模型同时支持音画同步、多镜头生成及声音驱动等功能,是全球功能最全的视频生成模型。 万相 2.6 已同步上线阿里云百炼、万相官网。
12/16/2025 1:59:26 PM
远洋
6B文生图模型,上线即登顶抱抱脸
梦瑶 发自 凹非寺. 量子位 | 公众号 QbitAI6B小模型,首日下载量高达50万次,上线不到两天直接把HuggingFace两个榜单都冲了个第一。 它就是阿里通义的全新图像模型:Z-Image。
12/1/2025 4:59:22 PM
梦瑶
Wan2.2-Animate又火了!5分钟让抠脚大汉秒变高冷女神
更多作者文章:最近,一个视频在推上传疯了。 当视频在手机上无法加载,可前往PC查看。 一张美女照片,加上一条自己录制的视频,就能生成一张极其自然的换脸视频,表情和动作复刻的都很好。
10/31/2025 1:45:03 AM
数字生命卡兹克
WebResearcher:从线性累积到迭代进化,重塑AI研究范式的三大支柱
大家好,我是肆〇柒。 本文一篇来自阿里巴巴通义实验室(Tongyi Lab, Alibaba Group)的研究,是通义 Deepresearch 发布的系列研究之一。 这篇论文不仅推出了一个名为WebResearcher的新型AI智能体,更重要的是,它提出了一种名为"IterResearch"的全新范式,期望从根本上解决长程推理任务中的核心瓶颈。
9/24/2025 10:24:57 AM
肆零柒
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
9 月 23 日消息,又是熟悉的深夜,阿里云今日发布并开源了全新的 Qwen3-Omni、Qwen3-TTS,以及对标谷歌 Nano Banana 图像编辑工具的 Qwen-Image-Edit-2509。 Qwen3-Omni 是业界首个原生端到端全模态 AI 模型,能够处理文本、图像、音频和视频多种类型的输入,并可通过文本与自然语音实时流式输出结果,解决了长期以来多模态模型需要在不同能力之间进行权衡取舍的难题。 Qwen3-Omni 是原生端到端的多语言全模态基础模型,其核心特性主要包括:跨模态最先进表现:通过早期以文本为核心的预训练和混合多模态训练,模型具备原生多模态能力。
9/23/2025 9:33:10 AM
问舟
阿里通义Fun-ASR语音模型升级 垂直领域识别率跃升超15%
阿里通义正式推出新一代端到端语音识别大模型Fun-ASR,该模型通过强化上下文感知与高精度转写能力,在家装、保险等垂直行业场景中实现语音识别准确率超15%的突破性提升。 实测数据显示,保险行业准确率较前代提升18%,家装、畜牧等领域增幅达15%-20%。 作为大语言模型驱动的语音识别算法,Fun-ASR采用自研语音算法与Qwen3监督微调技术,结合前沿模型架构与文本模态对齐技术,在保持语言处理优势的同时,集成RAG检索增强方案,支持超1000个自定义热词导入。
8/24/2025 4:02:03 PM
AI在线
LiblibAI接入阿里通义大模型 推出10秒AI视频生成功能
近日,国内AI图像创作领域的领军平台LiblibAI宣布一项重大举措——接入阿里通义系列大模型,这一动作显著提升了其AI创作能力,为用户带来了更强大的创作工具。 此次接入后,基于万相最新开源模型,LiblibAI推出了文生视频和图生视频功能。 用户只需输入文本提示词,或者上传图片,就能快速生成10秒短视频。
3/24/2025 6:00:40 PM
AI在线
阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”
3月13日,阿里巴巴正式推出其AI旗舰应用——新夸克。 这款全新升级的夸克基于阿里通义领先的推理及多模态大模型,打造了一个无边界的“AI超级框”,为用户带来全新的AI体验。 新夸克的创新之处在于将AI对话、深度思考、深度搜索、深度研究和深度执行等功能整合到一个极简的“AI超级框”中,一站式满足用户多样化的需求。
3/13/2025 11:29:00 AM
AI在线
阿里通义新视频生成和编辑模型VACE 可控制运动轨迹、替换主体等
是否还在感叹视频制作门槛高,后期编辑太烧脑?别担心,阿里通义Wan团队再次出手,推出了他们最新的重量级模型All-in-One视频生成和编辑模型——VACE。 VACE最引人注目的能力之一,便是其强大的按条件生成视频功能。 这意味着,你只需要用文字描绘出心中的场景,VACE就能迅速将你的想象变为现实。
3/13/2025 10:30:00 AM
AI在线
消息称字节跳动 8 位数年薪挖走阿里通义千问技术负责人周畅,十多个人跟着跳槽
原阿里通义千问大模型技术负责人周畅(花名:钟煌)于 7 月 18 日被曝将离职创业,然而在 10 月 23 日,就有消息称周畅已经低调加入了字节跳动。(第一财经)
12/6/2024 1:26:57 PM
汪淼
神级模型 In-Context LoRA 爆火!10种场景精准出图!
大家好,我是花生~. 阿里通义实验室在月初推出的一个新开源项目 In-Context(上下文) LoRA 最近越来越火了,因为大家发现它实在太好用了,无论是保持人物/场景一致性,还是进行服装、风格、Logo、字体样式、页面版式的学习迁移,效果都非常不错,一下就解决了很多大家之前头疼的问题。 目前 In-Context LoRA 已经在摄影、电商设计、样机制作、头像生成等方面有了落地应用,极大满足了大家对精准控制出图的需求,那今天我们就一起来看看 In-Context LoRA (以下简称 IC LoRA)究竟有哪些神奇之处。
11/21/2024 1:39:32 AM
夏花生
谨以此文,向飞天奖的AI整活视频「致敬」
AI好好用报道编辑:杨文5款对口型的AI产品,总有一款适合你。AI 最大的受害者,原来是娱乐圈的明星们。咋回事呢?前段时间,飞天奖官方整了个花活儿,让明星和电视剧中的 AI 角色合唱了一首《中国梦・我的梦》。那效果,简直一言难尽……(视频来源:B 站博主神仙颜颜_)视频链接:「扎心」:这个东西一端上来就有种淡淡的疯感。台下明星笑得最真心的一次。天呐唐嫣那个... 我都想替她报警了。每一个都好离谱又恐怖,李沁都没牙齿了。不会整就不要整啊,太抽象了,我真的是哈哈哈哈哈哈哈。第一个胡歌出来我就没绷住。笑死我了,满脑子都是
10/8/2024 6:14:00 PM
AI好好用
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉