AI在线 AI在线

全球首个原生多模态架构 NEO 横空出世,视觉与语言完美融合

在人工智能领域的最新动态中,Ilya Sutskever 的最新声明掀起了一场巨变。 他表示,单靠扩大模型规模的时代已经结束,未来的突破将来自于更智能的架构设计。 对此,整个 AI 界都感受到了深刻的转变,因为过往几年的发展路径似乎陷入了数据与参数的 “唯规模论”,然而这一方式正面临逐渐减弱的收益。

在人工智能领域的最新动态中,Ilya Sutskever 的最新声明掀起了一场巨变。他表示,单靠扩大模型规模的时代已经结束,未来的突破将来自于更智能的架构设计。对此,整个 AI 界都感受到了深刻的转变,因为过往几年的发展路径似乎陷入了数据与参数的 “唯规模论”,然而这一方式正面临逐渐减弱的收益。

在这一背景下,由中国研究团队打造的开源原生多模态架构 NEO 应运而生。与之前主流的多模态模型,如 GPT-4V 和 Claude 3.5 等的拼接方式不同,NEO 从根本上重新定义了视觉与语言的关系。传统的多模态模型通常将视觉编码器与语言模型分开,二者在数据层面粗暴地拼接在一起,导致信息传递不够顺畅。而 NEO 则通过创建一个统一的模型,使视觉与语言从一开始就紧密结合,犹如两者血脉相连。

NEO 的核心创新在于三大技术突破。首先,它引入了原生图块嵌入技术,允许 AI 直接从像素开始构建高保真的视觉表征,提升了图像细节的捕捉能力。其次,NEO 开发了原生三维旋转位置编码,利用高频和低频的不同组合,准确地处理图像和文本中的位置关系,形成一个智能的时空坐标系。最后,原生多头注意力机制使得视觉与语言的信息可以在同一个框架下进行交流,极大增强了模型对复杂语义的理解能力。

令人惊讶的是,NEO 在仅用传统模型十分之一的训练数据的情况下,便在多项评测中追平甚至超越了许多旗舰级对手。这一成果不仅证明了原生架构的有效性,也标志着 AI 模型发展的新方向。

相关资讯

干完几星期家务,1X新款人形机器人亮相,和冰箱一样安静

家用人形机器人的未来是这样。 具身智能领域又传出新消息。 来自挪威的机器人创业公司 1X 于上周五发布了最新家用机器人 Neo Gamma。
2/22/2025 2:02:00 PM
机器之心

OpenAI 投资新材料应用!挪威 1X 公司推出新款家用机器人

近日,挪威人形机器人公司1X Technologies(简称1X)发布了其最新款家用机器人 Neo Gamma,标志着家用机器人技术迈出了重要一步。 与之前的原型不同,Neo Gamma 将进行有限的家庭测试,旨在让用户体验更加人性化的智能服务。 1X 公司在设计 Neo Gamma 时特别注重减少机器人与人接触时可能带来的伤害。
2/25/2025 10:06:00 AM
AI在线

Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent

Flowith正式发布Agent NEO,号称全球首个支持无限步骤、无限上下文、无限工具的AI智能代理。 这款由10人小团队在云南Vibe Hackathon中诞生的创新产品,凭借其强大的云端执行能力和多模态协作功能,迅速引发全球开发者社区的热议。 AIbase综合最新社交媒体动态,深入解析Agent NEO的技术突破及其对AI生产力工具领域的深远影响。
5/20/2025 5:00:45 PM
AI在线