AI在线 AI在线

通义千问2.0正式亮相,阿里云全面升级AI基础设施,中国大模型公司一半跑在阿里云上

10 月 31 日,在 2023 云栖大会上,阿里云 CTO 周靖人表示,面向智能时代,阿里云将通过从底层算力到 AI 平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵 AI 时代最开放的云。在现场,周靖人公布了云计算基础能力的最新进展,升级了人工智能平台,并发布千亿级参数规模的大模型通义千问 2.0,以及一站式模型应用开发平台阿里云百炼,阿里云已初步建成 AI 时代全栈的云计算体系。

通义千问2.0正式亮相,阿里云全面升级AI基础设施,中国大模型公司一半跑在阿里云上

智能时代的云计算技术体系

全面升级 AI 基础设施

大模型是本轮 AI 浪潮的核心技术,基础模型的质量很大程度决定了 AI 产业化的前景。训练大模型是囊括了算力底座、网络、存储、大数据、AI 框架、AI 模型等复杂技术的系统性工程,只有强大的云计算体系才能训练出高质量的大模型。

周靖人表示,2009 年阿里云就提出 “数据中心是一台计算机” 的理念,今天,AI 时代更加需要这样的技术体系。作为一台超级计算机的云计算,可高效连接异构计算资源,突破单一性能芯片瓶颈,协同完成大规模智能计算任务。

为了保证大模型训练的稳定互联和高效并行计算,阿里云全新升级了人工智能平台 PAI。PAI 底层采用 HPN 7.0 新一代 AI 集群网络架构,支持高达 10 万卡量级的集群可扩展规模,超大规模分布式训练加速比高达 96%,远超业界水平;在大模型训练任务中,可节省超过 50% 算力资源,性能全球领先。

通义千问2.0正式亮相,阿里云全面升级AI基础设施,中国大模型公司一半跑在阿里云上

阿里云全面升级 AI 基础设施

阿里云通义大模型系列就是基于人工智能平台 PAI 训练而成。除了通义大模型,中国一半大模型公司跑在阿里云上,百川智能、智谱 AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型。

百川智能创始人兼 CEO 王小川表示,“百川成立仅半年便发布了 7 款大模型,快速迭代背后离不开云计算的支持。” 百川智能和阿里云进行了深入合作,在双方的共同努力下,百川很好地完成了千卡大模型训练任务,有效降低了模型推理成本,提升了模型部署效率。

阿里云已成为中国大模型的公共 AI 算力底座。截至目前,中国众多头部主流大模型都已通过阿里云对外提供 API 服务,包括通义系列、Baichuan 系列、智谱 AI ChatGLM 系列、姜子牙通用大模型等。

随着 AI 产业化逐步深入,必将迎来大规模智能算力需求爆发。阿里云已在全球 30 个地域建设了 89 个云计算数据中心,提供 3000 余个边缘计算节点,云计算的低延时、高弹性优点将发挥得淋漓尽致。今年,阿里云成功支撑火爆全网的妙鸭相机短时间高强度的流量爆发。

走向自动驾驶的云

周靖人说:“随着大模型技术与云计算本身的融合,我们希望未来的云可以像车一样也能够自动驾驶,大幅提升开发者使用云的体验。”

据悉,阿里云上有超过 30 款云产品接入了大模型能力,例如阿里云大数据治理平台 DataWorks 新增了全新的交互形态 ——Copilot,用户只需用自然语言输入即可生成 SQL,并自动执行相应的数据 ETL 操作,整体开发与分析可提效 30% 以上,堪比 “自动驾驶”。

阿里云容器、数据库等产品上也提供了类似的开发体验,可实现 NL2SQL、SQL 注释生成 / 纠错 / 优化等功能,未来这些能力还将集成到阿里云其他产品上。

更好的大模型,加速应用创新

在 2023 云栖大会现场,周靖人公布了阿里自研大模型的最新进展,发布千亿级参数规模的通义千问 2.0。通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2,加速追赶 GPT-4。

通义千问2.0正式亮相,阿里云全面升级AI基础设施,中国大模型公司一半跑在阿里云上

通义千问 2.0 千亿级参数规模大模型发布

千行百业都想借助大模型实现生产和服务方式的变革,但大模型使用的高门槛把大部分人挡在了技术浪潮之外。不论是定制专属大模型,还是基于大模型构建创新应用,都有很高的人才、技术、资金要求。

在云栖大会现场,周靖人发布一站式大模型应用开发平台 —— 阿里云百炼,该平台集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在 5 分钟内开发一款大模型应用,几小时即可 “炼” 出一个企业专属模型,开发者可把更多精力专注于应用创新。

为推动大模型更易在千行百业集成落地,阿里云基于通义 “打样” 了 8 个行业大模型,并在现场公布进展:个性化角色创作平台通义星尘、智能投研助手通义点金、AI 阅读助手通义智文等首次亮相;智能编码助手通义灵码已在阿里云内部大规模采用,广受好评;工作学习 AI 助手通义听悟每天处理 5 万余个音视频,累积用户超 100 万。

大模型正引发千行百业的新一轮创新,目前,央视网、朗新科技、亚信科技等企业已率先在阿里云百炼上开发专属模型和应用,朗新科技在云上训练出电力专属大模型,开发 “电力账单解读智能助手”“电力行业政策解析 / 数据分析助手”,为客户接待提效 50%、降低投诉 70%。

用坚定的开放,共促生态繁荣

“促进中国 AI 生态繁荣,是阿里云的首要目标。阿里云将坚定打造 AI 时代最开放的大模型平台,我们欢迎所有大模型接入阿里云百炼,共同向开发者提供 AI 服务。” 周靖人表示。

阿里云是国内最早开源自研大模型的科技公司,掀起中国大模型开源浪潮。目前,阿里云已开源通义千问 7B、14B 版本,下载量突破百万。在现场,周靖人宣布通义千问 72B 模型即将开源,将成为中国参数最大的开源模型。

除了与开发者共享自研新技术,阿里云还大力支持三方大模型发展。在阿里云魔搭社区上,百川智能、智谱 AI、上海人工智能实验室、IDEA 研究院等业界顶级玩家,都开源首发他们的核心大模型,阿里云则为开发者们 “尝鲜” 大模型提供免费 GPU 算力,截至目前已超 3000 万小时。

通义千问2.0正式亮相,阿里云全面升级AI基础设施,中国大模型公司一半跑在阿里云上

阿里云魔搭社区模型下载量突破 1 亿

周靖人透露,魔搭社区现已聚集 2300 多款 AI 模型,吸引 280 万名 AI 开发者,AI 模型下载量突破 1 亿,成为中国规模最大、开发者最活跃的 AI 社区。

2023 云栖大会上,阿里云宣布了一项重磅计划:“云工开物计划”,给中国所有大学生每人送一台云服务器。此外,阿里云还将为签约高校提供更大规模的算力资源支持,助力中国青年学者和学子攀登科研高峰。目前,清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学、华南理工大学等高校已首批达成合作。

相关资讯

阿里通义发布最新模型Qwen3-235B-A22B-Instruct-2507-FP8,AI 技术再升级!

阿里通义千问近期宣布了其旗舰产品 Qwen3模型的最新更新,推出了一个名为 Qwen3-235B-A22B-Instruct-2507-FP8的新版本。 这一新版本的亮点在于它采用了非思考模式(Non-thinking),并且大幅提升了长文本处理的能力,扩展到256K 的文本长度。 这一升级无疑将大幅提升模型的应用潜力,特别是在需要处理大量信息的场景中。
7/22/2025 11:02:53 AM
AI在线

阿里模型三连发闪耀WAIC,中国开源模型“周级迭代”引领AI新变革

7月27日,世界人工智能大会(WAIC),阿里巴巴携最新开源的三款大模型重磅亮相,成为全场焦点。 在由阿里云主办的 “开源·开放:阿里云Agent应用生态论坛”上,阿里云副总裁、大数据和智能实验室负责人叶杰平表示:“三年前,在世界人工智能大会上,我们正式发布了通义大模型,并承诺将核心模型开源开放。 如今,通义千问已实现全尺寸、全模态的全面开源,真正打破了开源与闭源模型之间的技术壁垒。
7/27/2025 10:33:00 AM
机器之心

阿里云通义千问 2.5 大模型发布,号称“多项能力赶超 GPT-4”

感谢在今日上午的阿里云 AI 智领者峰会-北京站活动中,通义千问 2.5 大模型发布,号称多项能力赶超 GPT-4。据阿里云官方介绍,通义大模型通过阿里云服务企业超 9 万,通义开源模型累计下载量突破 700 万。通义落地应用进程加速,现已进入 PC、手机、汽车等领域。在活动现场,阿里云正式发布通义千问 2.5,号称“能力升级,全面赶超 GPT-4”,在中文语境下,文本理解、文本生成、知识问答 & 生活建议、闲聊 & 对话和安全风险等多项能力上赶超 GPT-4。此外,通义千问 2.5 相比通义千问 2.1 有多项能
5/9/2024 11:18:49 AM
汪淼
  • 1