AI在线 AI在线

阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片

该工具可应用于风格化写真、分镜制作、室内设计等场景。该模型已面向全球开发者开源,其局部风格化功能已上线通义App。

阿里云通义万相团队本周推出了全新的图像编辑模型 ACE,通过一句话,用户即可生成图片和修改图片。该工具可应用于风格化写真、分镜制作、室内设计等场景。该模型已面向全球开发者开源,其局部风格化功能已上线通义 App。

据官方介绍,ACE 模型可同时支持文生图和图像编辑,用户输入口语化指令可完成可控视觉编辑、元素编辑、区域重绘编辑、分层编辑(AI在线注:如下图,将图中特定对象进行风格化处理)等任务,仅用对话的方式就能实现 PS 的功能,例如输入文字即可一键除水印、修改证件照背景等。

阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片

该团队提出了 Long-context Condition Unit 模块(LCU),能支持通用编辑任务所需的各种多模态条件输入,并且搭建了全面的编辑成对数据构造链路和指令集生成链路,最终达到精准、高质量的图像指令编辑效果。

阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片

开源地址:

  • 魔搭社区:https://www.modelscope.cn/models/iic/ACE-0.6B-1024px

  • Github:https://github.com/ali-vilab/ACE

  • Huggingface:https://huggingface.co/spaces/scepter-studio/ACE-Chat

相关资讯

消息称“通义”应用团队从阿里云分拆,并入阿里智能信息事业群

有知情人士称,此次调整包括通义 To C 方向的产品经理,以及相关的工程团队,一并调整至阿里智能信息事业群。(智能涌现)
12/18/2024 10:48:13 AM
汪淼

AI 发现16万种新RNA病毒成果登上《Cell》后,我们和阿里云算法专家贺勇聊了聊

近期,AI for Science 领域的惊喜不断,持续在物理、化学、生物领域开花结果。 不仅诺贝尔物理和化学奖双双颁给 AI 领域的科学家,阿里云与中山大学的科研也带来了RNA病毒寻找的突破,国际顶级学术期刊《Cell》收录了这一研究论文。 《基于人工智能探索和记录隐藏的RNA病毒世界》论文提出深度学习模型"LucaProt",用于快速准确判别RNA病毒,颠覆传统病毒发现方法。
10/15/2024 3:18:00 PM
王轶群

千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4

10 月 31 日,阿里云正式发布千亿级参数大模型通义千问 2.0。在 10 个权威测评中,通义千问 2.0 综合性能超过 GPT-3.5,正在加速追赶 GPT-4。当天,通义千问 APP 在各大手机应用市场正式上线,所有人都可通过 APP 直接体验最新模型能力。过去 6 个月,通义千问 2.0 在性能上取得巨大飞跃,相比 4 月发布的 1.0 版本,通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过 GPT-3.5,加速追赶 GPT-4。
10/31/2023 3:32:00 PM
机器之心

通义千问2.0正式亮相,阿里云全面升级AI基础设施,中国大模型公司一半跑在阿里云上

10 月 31 日,在 2023 云栖大会上,阿里云 CTO 周靖人表示,面向智能时代,阿里云将通过从底层算力到 AI 平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵 AI 时代最开放的云。在现场,周靖人公布了云计算基础能力的最新进展,升级了人工智能平台,并发布千亿级参数规模的大模型通义千问 2.0,以及一站式模型应用开发平台阿里云百炼,阿里云已初步建成 AI 时代全栈的云计算体系。
10/31/2023 3:13:00 PM
机器之心

阿里大模型产品“通义听悟”升级:超长视频自由问,还会做思维导图

感谢今日阿里大模型产品“通义听悟”发布多项新功能,上线音视频问答助手“小悟”、一键 AI 改写、思维导图生成等六大功能。通义听悟接入通义千问大模型,融合了十多项 AI 功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT 提取等,并支持标重点、记笔记。通义听悟本次升级上新了六大功能点,其中最重磅的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问
3/19/2024 2:47:37 PM
远洋

阿里云 x 联发科,天玑 9300 等手机芯片适配端侧通义千问大模型

感谢联发科宣布已成功在天玑 9300 等旗舰芯片上部署通义千问大模型,首次实现大模型在手机芯片端深度适配。通义千问在离线情况下运行多轮 AI 对话。阿里云方面表示,将和联发科深度合作,向全球手机厂商提供端侧大模型解决方案。IT之家注意到,通义千问目前已开源 18 亿、70 亿、140 亿、720 亿参数等大语言模型,以及视觉理解、音频理解多模态大模型。阿里云在去年 10 月还发布了通义千问 2.0,模型参数达到千亿级别。联发科自己也在研发大语言模型,曾推出开源的 MR Breeze-7B 模型,擅长处理繁体中文和英
3/28/2024 9:08:31 AM
汪淼

阿里云全面推行 AI 写代码,未来 20% 代码由通义灵码编写

阿里云正在内部全面推行 AI 编程,使用通义灵码辅助程序员写代码、读代码、查 BUG、优化代码等。阿里云还专门给通义灵码分配了一个正式的员工工号 ——AI001。据阿里云相关人士透露:“公司未来 20% 的代码将由通义灵码编写,但程序员仍然是研发的核心,他们将有更多时间专注于系统设计以及核心业务开发工作。”据介绍,传统开发模式下,程序员每天需要耗费大量精力编写重复性代码、调试优化、编写代码注释等基础工作,大幅挤压了核心业务代码编写的时间。在阿里云内部,通义灵码已在各个开发环节担任代码助理角色。以 API 开发测试工
4/2/2024 10:35:43 AM
远洋

阿里通义千问开源 320 亿参数模型,已实现 7 款大语言模型全开源

感谢4 月 7 日,阿里云通义千问开源 320 亿参数模型 Qwen1.5-32B。IT之家注意到,通义千问此前已开源 5 亿、18 亿、40 亿、70 亿、140 亿和 720 亿参数 6 款大语言模型。此次开源的 320 亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡。例如,相比通义千问 14B 开源模型,32B 在智能体场景下能力更强;相比通义千问 72B 开源模型,32B 的推理成本更低。通义千问团队希望 32B 开源模型能为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了 7 款大语
4/8/2024 11:50:26 AM
远洋

阿里云通义千问 2.5 大模型发布,号称“多项能力赶超 GPT-4”

感谢在今日上午的阿里云 AI 智领者峰会-北京站活动中,通义千问 2.5 大模型发布,号称多项能力赶超 GPT-4。据阿里云官方介绍,通义大模型通过阿里云服务企业超 9 万,通义开源模型累计下载量突破 700 万。通义落地应用进程加速,现已进入 PC、手机、汽车等领域。在活动现场,阿里云正式发布通义千问 2.5,号称“能力升级,全面赶超 GPT-4”,在中文语境下,文本理解、文本生成、知识问答 & 生活建议、闲聊 & 对话和安全风险等多项能力上赶超 GPT-4。此外,通义千问 2.5 相比通义千问 2.1 有多项能
5/9/2024 11:18:49 AM
汪淼

阿里云:微博已接入通义大模型,应用于明星陪聊、虚拟角色等场景

感谢据“阿里云”公众号今日推文,微博 COO(IT之家注:首席运营官)、新浪移动 CEO 王巍表示,AIGC 发展速度远超想象,包括通义 2.5 在内,行业已涌现出不少大模型。同时他指出,大模型开源势不可挡,“阿里云开源 1100 亿参数规模大模型,是非常了不起的。”。王巍表示,微博是通义大模型最早的外部客户之一,并已在多个场景广泛落地。“大语言模型就像百科全书,一个国家有几本就够了,我们不需要做 100 个大模型,这其实是很大的资源浪费。我更倾向于使用阿里云‘通义千问’这类基础大模型,同时利用我们的自有数据,以更
5/17/2024 4:33:29 PM
清源

通义千问宣布“GPT-4 级”主力模型 Qwen-Long 降价 97%,一元 200 万 tokens

字节跳动 5 月 15 日正式发布了豆包大模型,宣布大模型价格进入“厘时代”,号称“比行业便宜 99.3%”。今日,阿里云紧随其后抛出重磅炸弹:通义千问 GPT-4 级主力模型 Qwen-Long 宣布降价,API 输入价格从 0.02 元 / 千 tokens 降至 0.0005 元 / 千 tokens,降幅 97%。简单来说,1 块钱可以买 200 万 tokens,相当于 5 本《新华字典》的文字量。这款模型最高支持 1 千万 tokens 长文本输入,降价后约为 GPT-4 价格的 1/400。参考IT之
5/21/2024 10:41:25 AM
问舟

阿里云拿下高奢品牌 LV 母公司五年长期合约,整合通义千问 AI 技术

感谢LV 高奢品牌母公司酩悦・轩尼诗-路易・威登集团(LVMH)宣布将和阿里巴巴进一步深化合作,在延长五年合作伙伴关系的基础上,通过阿里云及通义模型来优化高端零售体验。LVMH 集团自 2019 年起开始采用阿里云支持业务发展,目前正在利用阿里云的一站式数据管理工具 Dataphin 支持“LVMH ATOM”项目,为中国客户提供个性化服务。此外,LVMH 集团和阿里云还在云计算和大数据领域展开了合作。此次合作关系延长是在天猫与蒂芙尼和尚美巴黎和奢侈品零售业务整合之后展开。IT之家从公告获悉,阿里巴巴将阿里云的生成
5/22/2024 6:40:58 PM
汪淼

阿里云推出首个 AI 程序员,具备架构师、开发 / 测试工程师等岗位技能

在今天的阿里云上海 AI 峰会上,阿里云推出首个“AI 程序员”,具备架构师、开发工程师、测试工程师等岗位技能,能完成任务分解、代码编写、测试、问题修复、代码提交整个过程,号称最快“分钟级”完成应用开发。据介绍,该“AI 程序员”是基于通义大模型构建的多智能体,包含任务分解、编码、测试等不同板块,与“通义灵码”有所不同。在收到用户需求后,“AI 程序员”就可实现软件开发“一条龙”:理解需求-拆分任务-编写代码-识别并解决报错-提交代码。 据IT之家此前报道,阿里云去年 11 月推出了 AI 编程工具通义灵码,兼容 
6/21/2024 1:39:41 PM
清源

阿里云通义灵码 AI 编程助手上线微软 Visual Studio 插件市场,个人专业版限时免费

通义灵码是阿里云出品的一款基于通义大模型的智能编码辅助工具,提供行级 / 函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力,支持 Java、Python、Go、C 等 200 多种编程语言。通义灵码 6 月 20 日宣布上线了微软 Visual Studio 插件市场,该工具此前已上线了 Visual Studio Code、JetBrains IDEs 等主流编程工具,全渠道下载量超 350 万。Visual Studio(VS)是微软推出的一款集
6/24/2024 10:58:24 AM
汪淼

AI拜年火了,通义千问上线一张照片生成拜年视频

2月5日,春节将至年味渐浓,阿里云通义千问APP上线多项免费新应用,涵盖全家福、拜新年、万物成龙等图像生成的新玩法,共提供超300套照片模板,用户上传照片即可生成全家福、团圆照、拜年照、千里江山主题照;此外,一个月前火爆全网的全民舞王应用也迎来上新,用户可通过一张照片生成拜年视频,用更轻松、接近真人出镜的方式向亲朋好友传递新年的美好祝福。足不出户即可免费「拍」全家福春节是中国人约定俗成的团圆时刻。AI大模型技术正在让人们突破时空阻碍,用最便捷的方式相聚、庆祝,春节团圆的仪式感拉满。在通义千问APP照相馆应用的全家福
2/5/2024 12:06:00 PM
新闻助手

阿里通义千问重磅升级:免费开放1000万字长文档处理功能

3月22日消息,阿里通义千问重磅升级,向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。即日起,所有金融、法律、科研、医疗、教育等领域的专业人士,都可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。比如在金融领域,上传一份公司财报,通义千问即可自动提取和总结公司各业务的营收情况和利润增长等核心信息,生成公司整体业绩表现的总结。上传公司不同时期的财报后,通义千问可生成公司在这一阶段内的业务变化、业绩趋势并进行财报
3/22/2024 6:51:00 PM
新闻助手

通义千问首次落地天玑9300移动平台!阿里云携手MediaTek探索端侧AI智能体

3月28日,阿里云与知名半导体公司MediaTek联合宣布,通义千问18亿、40亿参数大模型已成功部署进天玑9300移动平台,可离线流畅运行即时且精准的多轮AI对话应用,连续推理功耗增量不到3W,实现手机AI体验的大幅提升。这是通义大模型首次完成芯片级的软硬适配,仅依靠终端算力便能拥有极佳的推理性能及功耗表现,标志着Model-on-Chip的探索正式从验证走向商业化落地新阶段。端侧AI是大模型落地的极具潜力的场景之一。利用终端算力进行AI推理,可大幅降低推理成本、保证数据安全并提升AI响应速度,让大模型可以更好地
3/28/2024 9:34:00 AM
新闻助手

通义千问开源320亿参数模型,已实现7款大语言模型全开源

4月7日消息,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数的6款大语言模型并均已升级至1.5版本,其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实
4/8/2024 9:32:00 AM
新闻助手
  • 1