AI在线 AI在线

Qwen

Qwen和DeepSeek为何都选YaRN?

这篇文章,我们还是从面试官的视角出发,一起来分析一下,如果你在面试现场被问到这个题目,应该如何回答? 1.面试官心理分析首先还是分析一下面试官的心理,面试官问这个问题,主要是想考察三点:第一,你知不知道长度外推这个概念? 很多同学可能听都没听过这个概念,那这个问题当然也就无从答起了。
6/6/2025 1:26:00 AM
丁师兄

互联网女皇最新报告:全球 AI 竞争格局生变 中国与开源AI全面突围

硅谷投资人Mary Meeker最新发布的AI报告揭示:全球AI竞争格局正经历深刻重塑。 中国力量与开源浪潮正在撼动OpenAI等头部公司主导的生态,全球进入“群雄逐鹿”的新阶段。 中国AI:性能逼近国际一线,产业融合爆发报告指出,中国在大型语言模型发布节奏上正快速逼近美国,DeepSeek、阿里Qwen、百度文心一言等模型在代码生成与数学推理等核心任务中表现优异。
6/5/2025 3:00:56 PM
AI在线

我国水利标准 AI 大模型正式发布,采用海量知识库 + DeepSeek / Qwen 双模型

我国水利标准AI大模型正式发布,采用海量知识库+DeepSeek/Qwen双模型,实现水利标准全生命周期数字化、智能化管理。查重比对准确率超96.7%,标准编制效率提高2.5倍。#水利科技##AI大模型#
6/3/2025 10:04:47 AM
远洋

TCL联手阿里云深度布局AI赛道,半导体显示专家大模型"星智"正式亮相

家电巨头TCL与云计算龙头阿里云正式宣布达成全栈AI战略合作,这一合作将重点围绕半导体显示和智能终端两大核心领域展开。 双方计划充分利用阿里云在"云 AI"方面的技术优势,联合开发面向垂直行业的专业大模型解决方案。 在技术研发层面,TCL与阿里云将基于Qwen3、Qwen-VL、QwQ等先进模型,持续优化升级半导体显示专家大模型——星智X-Intelligence。
5/22/2025 5:00:55 PM
AI在线

通义千问 Qwen 免费上线 AI“深入研究”:十几分钟完成数小时任务

通义千问 Qwen 官方公众号昨日(5 月 13 日)发布博文,宣布推出 Deep Research (深入研究),该智能助理系统能够逐步规划复杂的研究任务,综合大量在线信息,并协助用户完成复杂的科研任务。
5/14/2025 10:42:06 AM
故渊

免费开放!通义千问Qwen上线「深入研究」Deep Research功能

在数字化时代,面对海量信息和高强度的任务压力,系统地研究一件事变得费时且难以聚焦。 为了解决这一问题,Qwen团队推出了一款名为“Deep Research”的智能助理系统,旨在帮助用户梳理复杂问题,快速理清头绪,并生成条理清晰、数据可信的研究报告。 “Deep Research”是一个强大的智能助理系统,它能够逐步规划复杂的研究任务,综合大量在线信息,并协助用户完成复杂的科研任务。
5/14/2025 8:00:42 AM
AI在线

阿里MNN神更新!移动端开源多模态AI支持Qwen-2.5,文本图像语音全搞定!

阿里巴巴开源项目MNN(Mobile Neural Network)发布了其移动端多模态大模型应用MnnLlmApp的最新版本,新增对Qwen-2.5-Omni-3B和7B模型的支持。 这款完全开源、运行于移动端本地的大模型应用,支持文本到文本、图像到文本、音频到文本和文本到图像生成等多种模态任务,以其高效性能和低资源占用引发开发者广泛关注。 AIbase观察到,MNN的此次更新进一步推动了多模态AI在移动端的普及。
5/13/2025 10:01:07 AM
AI在线

阿里通义千问 2.5-Omni-3B AI 全模态登场:7B 版 90% 性能,显存占用减少 53%

阿里巴巴持续发力 AI 领域,其 Qwen 团队于 3 月发布 Qwen2.5-Omni-7B 模型后,昨日(4 月 30 日)再次发布 Qwen2.5-Omni-3B,目前可以在 Hugging Face 上开放下载。
5/1/2025 10:30:28 AM
故渊

Qwen3正式发布,优化编码与代理能力,强化MCP支持引领AI新潮流

阿里云Qwen团队宣布Qwen3系列模型正式发布,以卓越的编码能力、增强的代理功能和对Model Context Protocol(MCP)的深度支持,掀起AI社区热潮。 据AIbase了解,Qwen3涵盖从0.6B到235B-A22B的多种模型规模,优化了数学推理、代码生成和多模态任务,性能直追GPT-4o与Gemini-2.5-Pro。 社交平台上的讨论显示,Qwen3的MCP集成与开源策略备受期待,相关细节已通过Hugging Face与Qwen官网公开。
4/29/2025 9:00:40 AM
AI在线

阿里全模态Qwen2.5-Omni技术报告万字解读!

Qwen 团队最近发布了一款统一多模态大模型 Qwen2.5-Omni,开放了 7B 版本的权重。 能够同时处理文本、图像、音频和视频输入,并以流式方式生成文本和语音响应。 下面来详细看下:开源地址:论文地址:: 地址: Face:::官方体验:::在日常生活中,人类能够同时感知视觉和听觉信息,并通过大脑处理这些信息后,以书写、说话或使用工具等方式进行反馈,从而与世界上的各种生物进行信息交流并展现智能。
4/14/2025 12:20:00 AM
Goldma

阿里巴巴发布最新视觉推理模型 QVQ-Max

2025 年 3 月 28 日,阿里巴巴旗下的AI研究团队Qwen再次掀起波澜,于凌晨三点正式发布了其最新的视觉推理模型——QVQ-Max。 这一消息迅速在业界引发热烈讨论,众多科技爱好者和行业专家纷纷表达了对这一全新AI模型的期待与关注。 QVQ-Max:视觉与推理的突破性结合根据阿里巴巴Qwen团队的官方公告,QVQ-Max是一款仍在不断进化中的视觉推理模型。
3/28/2025 8:40:00 AM
AI在线

阿里开源最新多模态模型 Qwen2.5-VL-32B:主打视觉语言,数学推理也很强

此前开源家族视觉语言模型 Qwen2.5-VL 包括 3B、7B 和 72B 三种尺寸。这一次的 32B 版本进一步兼顾尺寸和性能,可在本地运行。
3/25/2025 9:26:54 AM
汪淼

为什么 Qwen 能自我改进推理,Llama 却不行?斯坦福找到了原理

给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行? 当遇到困难问题时,人类会花时间深入思考以找到解决方案。 在 AI 领域,最近的一些大语言模型在通过强化学习进行自我改进训练时,也已经开始表现出类似的推理行为。
3/6/2025 6:00:00 AM
机器之心

为什么Qwen能自我改进推理,Llama却不行?斯坦福找到了原理

虽然 Qwen「天生」就会检查自己的答案并修正错误。 但找到原理之后,我们也能让 Llama 学会自我改进。 给到额外的计算资源和「思考」时间,为什么有的模型能好好利用,把性能提升一大截,而有的模型就不行?
3/5/2025 2:54:00 PM
机器之心

阿里千问(Qwen)衍生模型数量破 10 万,位居全球开源模型榜首

全球最大 AI 开源社区 Hugging Face 数据显示,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破 10 万,持续领先美国 Llama 等开源模型,稳居全球最大开源模型榜首。
2/25/2025 4:08:38 PM
清源

阿里 Qwen Chat 平台上线“深度思考”功能:基于 QwQ-Max-Preview 推理模型,支持联网搜索

今日阿里 Qwen 团队在 Qwen Chat 平台上线了“深度思考 (QwQ)”功能。深度思考 (QwQ) 由 QwQ-Max-Preview 支持,这是一个基于 Qwen2.5-Max 的推理模型,擅长数学理解、编程、AI 智能体等。目前,“深度思考 (QwQ)”仍处于预览阶段,团队表示模型仍在持续优化中。IT之家注意到,该模型不仅具备推理能力,还支持联网搜索功能。
2/25/2025 11:16:26 AM
远洋

国家超算平台推AI伙伴计划:三月免费开放DeepSeek API

国家超算互联网平台近日宣布启动"AI生态伙伴加速计划",面向企业用户推出一系列优惠举措,包括提供为期3个月的DeepSeek API接口免费使用权限,并配套千万卡时的算力资源池支持。 据了解,该平台已完成DeepSeek满血版模型镜像的部署工作。 目前平台已实现与全国14个省份超过20家超算和智算中心的互联互通,汇集各类算力商品逾6500款,其中AI模型服务近240款。
2/12/2025 9:28:00 AM
AI在线

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。 在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。
2/11/2025 2:25:00 PM
AI在线