AI在线 AI在线

通义千问

多模态大模型,阿里通义千问能和GPT-4V掰手腕了

通义千问的图像推理能力,最近有了大幅提升。2024 年,大模型领域要卷什么?如果没有思路的话,不妨看看各家大厂都在押注什么方向。最近一段时间,先是 OpenAI 推出 GPT-4V,让大模型拥有了前所未有的图像语义理解能力。谷歌随后跟上,发布的 Gemini 成为了业界第一个原生的多模态大模型,它可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。很明显,新的方向就是多模态。继 GPT-4 在语言方向的里程碑式突破之后,业界普遍认为「视觉」是下一个爆发的赛道。毕竟人类的五感之中有 80
1/26/2024 2:53:00 PM
机器之心

马斯克也逃不过「科目三」,阿里这个应用都要把外国人馋哭了

阿里开年整新活了。最近,不少社交平台都被一种名为「科目三」的舞蹈视频刷屏了,摇花手、半崴不崴的脚,配合着节奏鲜明的音乐,这一舞蹈动作遭全网模仿。对于有点舞蹈功底的人来说,学会「科目三」并不是一件很难的事,但对于四肢不是很协调的小伙伴而言,这可真是有点难度了。为了让广大网友学会这个舞蹈,还有人出了保姆级分解教程,声称几分钟速成大摇子。其实,对于想要跳舞的你来说,根本不用真人出镜,一张照片就能化身舞蹈达人。不信,你看,一位小姐姐正在你面前大秀舞技视频链接:,不,不,不!眼见不一定为真,其实这是根据照片生成的,而且只需一
1/4/2024 2:50:00 PM
机器之心

720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑

目前,通义千问开源全家桶已经有了 18 亿、70 亿、140 亿、720 亿参数量的 4 款基础开源模型,以及跨语言、图像、语音等多种模态的多款开源模型。「Qwen-72B 模型将于 11 月 30 日发布。」前几天,X 平台上的一位网友发布了这样一则消息,消息来源是一段对话。他还说,「如果(新模型)像他们的 14B 模型一样,那将是惊人的。」有位网友转发了帖子并配文「千问模型最近表现不错」。这句话里的 14B 模型指的是阿里云在 9 月份开源的通义千问 140 亿参数模型 Qwen-14B。当时,这个模型在多个权
12/1/2023 3:07:00 PM
机器之心