阿里云
从 DeepSeek 火热,到李飞飞团队新成果,“幕后高手”竟是它
最近 AI 大模型领域可以说是热点话题不断,DeepSeek 的热潮还未消退,国内李飞飞团队提出的一种模型训练新方法又在行业里引发热议
2/7/2025 2:13:55 PM
汐元
阿里云确认:李飞飞团队 s1 模型基于 Qwen2.5-32B-Instruct 模型训练
李飞飞团队 s1 模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。对此,新浪科技向阿里云方面求证,阿里云方面确认了这一消息。
2/6/2025 10:05:22 PM
浩渺
全球第一:阿里云宣布通义千问 Qwen2.5-Max 数学及编程能力登顶最新 AI 大模型榜单
1 月 29 日新年之际,阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型,号称在多个基准测试中超越 DeepSeek V3 登竞争对手。
2/5/2025 6:42:42 PM
问舟
多个平台纷纷上线 DeepSeek 大模型,推动人工智能技术革新
近日,多个中国云服务平台集中上线了 DeepSeek 大模型,标志着这一新兴技术在国内的广泛应用。 参与此次上线的有百度智能云、华为云、阿里云、腾讯云、360数字安全以及云轴科技等企业,用户们可以在各大平台上体验 DeepSeek-R1、DeepSeek-V3等先进模型。 在上线发布会当天,百度智能云宣布其千帆平台已正式上架 DeepSeek-R1和 DeepSeek-V3模型,并推出了超低价格方案,用户还可以享受限时免费的服务体验。
2/5/2025 9:50:00 AM
AI在线
DeepSeek 登陆阿里云,支持云上一键部署 V3、R1 模型
阿里云计算有限公司昨日发文官宣,阿里云 PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1。
2/4/2025 8:37:12 AM
归泷(实习)
阿里云通义开源Qwen2.5-VL,视觉AI超越Claude 3.5
阿里云通义千问开源了全新的视觉模型Qwen2.5-VL,并推出了3B、7B和72B三个尺寸版本。 其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,超越了GPT-4o与Claude3.5。 阿里云官方介绍称,新的Qwen2.5-VL能够更准确地解析图像内容,并突破性地支持超过1小时的视频理解。
1/29/2025 10:15:00 AM
AI在线
通义千问 Qwen 2.5-Max 超大规模 MoE 模型发布:号称优于 Deepseek V3 等竞品,暂未开源
据介绍,通义千问 Qwen 2.5-Max 使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。
1/29/2025 3:15:06 AM
问舟
阿里云 Qwen2.5-1M 开源发布:100万上下文长度模型登场
继 DeepSeek R1之后,阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M,再次引发业界关注。 此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。 这是通义千问首次推出能够原生支持百万Token上下文长度的模型,并在推理速度上实现了显著提升。
1/27/2025 11:08:00 AM
AI在线
阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码
通义万相 2.1 还支持复杂运镜,可还原碰撞、反弹、切割、挤压等真实世界的物理规律,例如雨滴落在伞上会溅起水花。
1/10/2025 11:03:37 AM
问舟
阿里云通义灵码 AI 程序员全面上线,宣称 10 分钟完成网页开发及美化
通义灵码 AI 程序员全面上线,同时支持 VS Code、JetBrains IDEs,前端后端开发全覆盖,宣称“全程对话协作实现从 0 到 1 完成复杂编码任务”。
1/8/2025 6:35:43 PM
沛霖(实习)
传音控股与阿里云达成合作,通义千问大模型搭载于前者旗下 AI 手机
传音控股(以下简称传音)已与阿里云达成合作,通义千问大模型已经搭载在传音旗下科技品牌 TECNO 推出的 AI 手机 PHANTOM V Fold2 中,打造了深度本地化的“实用型 AI”。通过机身上特定的 AI 按键,用户可一键调用端侧大模型,在离线环境中依然可以流畅运行多轮 AI 对话,并实现文档及通话摘要。
1/7/2025 2:58:32 PM
远洋
阿里云与黑芝麻智能完成大模型车载芯片级适配
阿里云今日宣布与黑芝麻智能达成深度合作,通义千问 15 亿、30 亿参数大模型已成功在黑芝麻智能武当 C1200 家族芯片上完成部署,在离线推理场景可实现多轮流畅对话。未来通义大模型将通过斑马智行新版车机系统,向车端用户提供智能座舱体验。
1/2/2025 8:03:30 PM
浩渺
阿里云与零一万物达成战略合作,成立“产业大模型联合实验室”
阿里云和大模型企业零一万物今日达成模型平台业务的战略合作,双方将成立“产业大模型联合实验室”,联手加速大模型从技术到应用的落地,进一步扩大产业大模型的生态整合。
1/2/2025 4:09:48 PM
汪淼
消息称“通义”应用团队从阿里云分拆,并入阿里智能信息事业群
有知情人士称,此次调整包括通义 To C 方向的产品经理,以及相关的工程团队,一并调整至阿里智能信息事业群。(智能涌现)
12/18/2024 10:48:13 AM
汪淼
阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片
该工具可应用于风格化写真、分镜制作、室内设计等场景。该模型已面向全球开发者开源,其局部风格化功能已上线通义App。
11/30/2024 10:20:36 PM
清源
AI 发现16万种新RNA病毒成果登上《Cell》后,我们和阿里云算法专家贺勇聊了聊
近期,AI for Science 领域的惊喜不断,持续在物理、化学、生物领域开花结果。 不仅诺贝尔物理和化学奖双双颁给 AI 领域的科学家,阿里云与中山大学的科研也带来了RNA病毒寻找的突破,国际顶级学术期刊《Cell》收录了这一研究论文。 《基于人工智能探索和记录隐藏的RNA病毒世界》论文提出深度学习模型"LucaProt",用于快速准确判别RNA病毒,颠覆传统病毒发现方法。
10/15/2024 3:18:00 PM
王轶群
JetBrains与阿里云战略合作发布JetBrains AI Assistant:聚焦中国市场开发者,实现开发效率代际提升
9月19日,全球知名的软件开发工具提供商JetBrains在2024云栖大会上正式发布基于阿里云通义大模型的JetBrains AI Assistant,标志着JetBrains在完善其开发工具产品生态方面迈出了重要一步。 JetBrains AI Assistant与多款JetBrains产品深度集成,能够以高度的适配性完成代码生成与重构、回答和解释代码相关问题、撰写文档和提交信息等工作,助力中国本土开发者提升效率和代码质量,实现生产力的全面跃升,释放出更多的时间和精力去探索新的技术领域和创新思路。 图 | 发布仪式合影JetBrains中国区总裁李玥萱表示,“中国市场在JetBrains的全球版图中占据举足轻重的地位。
9/23/2024 10:43:00 AM
吴华秀
真·AI程序员来了,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
5 分钟就能完成真人程序员一天的工作量。太轻松了。在 AI 程序员的帮助下,一个几乎没有专业编程经验的初中生,在人头攒动的展台上从零开始,两分钟就做出了一个倒计时网页。他需要做的,只是输入包含几句话的提示词。数秒钟后,大模型就生成了代码,还列出了环境需求,复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目,而是人人都可以尝试的事。在大模型的帮助下,代码正在成为低门槛的设计工具。昨天,阿里云完成了「可能是历史上最大规模的模型开源发布」,开源了通义千问 Qwen2.5 系列模型,又在云栖大会的年度重磅发布中
9/20/2024 1:41:00 PM
机器之心
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用