应用
2B参数性能超Mistral-7B:面壁智能多模态端侧模型开源
千元机也能本地运行。在大模型不断向着大体量方向前进的同时,最近一段时间,人们在优化和部署方面也取得了成果。2 月 1 日,面壁智能联合清华 NLP 实验室在北京正式发布了旗舰端侧大模型「面壁 MiniCPM」。新一代大模型被称为「性能小钢炮」,直接拥抱终端部署,同时也具有同量级最强的多模态能力。面壁智能本次提出的 MiniCPM 2B 参数量仅有 20 亿,使用 1T token 的精选数据训练。这是一个参数量上与 2018 年 BERT 同级的模型,面壁智能在其之上实现了极致的性能优化与成本控制,让该模型可以「越
2/2/2024 5:13:00 PM
机器之心
中国初创Xreal获新融资,以699 美元提供Apple Vision Pro风格的XR体验
机器之能报道编辑:SIA毫无疑问,苹果将在 2024 年成为空间计算热议的中心,中国厂商又会带给大家什么样的惊喜?据彭博社报道,中国增强现实(AR)设备制造商 Xreal 正在以超过 10 亿美元的估值筹集新资金,该公司已在一轮保密战略融资中筹集了 6000 万美元,以扩大其可穿戴 AR 设备的消费产品线。Xreal 在今年消费电子展上推出了最新产品 Xreal Air 2 Ultra —— XREAL Air 2 系列中的顶级型号(该系列其他型号包括 XREAL Air 2 和 XREAL Air 2 Pro),
2/2/2024 2:45:00 PM
机器之能
个性经济时代,MiniMax 语音大模型如何 To C?
大约一个月前,距离 GPT Store 上线还有两周,一位名为 Kyle Tryon 的国外开发者在个人博客上分享了其基于 ChatGPT Plus 开发的三个 Agent(又称“GPTs”),其中一个 Agent 是关于美国费城旅游出行的个人指南“PhillyGPT”,它能访问当地 SEPTA 公共交通 API,为个人提供费城当地的实时天气、旅游资讯、文艺演出活动、出行路线、公交车站与地标数据、预计抵达时间等等。 具体可访问 PhillyGPT 链接:,实际是人们对于 GPT 时代 C 端个性消费产品的真正想象。 无独有偶,1 月 11 日 OpenAI 正式上线 GPT Store 后,公布 300 万个 GPTs 之余,也将与用户日常消费活动息息相关的徒步路线指南“AllTrails”放在推荐榜单上。
2/2/2024 2:22:00 PM
王悦
Midjourney Niji 6 重磅更新!风格全面升级,支持文本生成!
大家好我是花生~
在 V6 模型推出 1 个多月后,Midjourney 终于在昨天上线了 Niji 6 模型,其出图质量与 Niji 5 相比有了很大的提升,风格感也变得更强了,今天我们一起来看看 Niji 6 的特性以及相关使用技巧~
上期回顾:Niji 本身就是一个“动漫风”模型,可以生成高质量的二次元图像以及插画,这点大家在使用过程中肯定都有感受到。而在生成非动漫主题的图像时,Niji 模型也偏向于将其处理成插画风,并赋予图像一种鲜明的风格,或者是朦胧梦幻,或者是绚烂多彩,让原本偏写实的图像更具美感。
下图
2/2/2024 6:11:18 AM
夏花生
品牌设计实战! AI 产品 Perplexity 是如何重塑品牌的?
编者按:一个 AI 的品牌要如何进行视觉和体验设计?知名设计机构 Smith & Diction 接到来自新锐 AI 平台 Perplexity 的品牌设计订单,看看他们是怎么落地设计的。
当来自 Perplexity 的 Henry 和 Phi 找上我们的时候,直言「我们希望让我们的品牌感觉上,像斯堪的纳维亚的地铁系统一样,干净清爽,周密成熟,但是以一种润物细无声的方式来呈现」。他们不想给人太过浮华、现代或年轻化的印象。结合产品的功能气质,他们希望产品看起来像承载事实的容器。
通常,这样的风格不是我们 S&D 的
2/2/2024 5:03:30 AM
陈子木
蚂蚁集团NextEvo全面开源AI Infra技术,可实现大模型训练“自动驾驶”
近日,蚂蚁集团AI创新研发部门NextEvo全面开源AI Infra技术,可帮助大模型千卡训练有效时间占比超过95%,能实现训练时“自动驾驶”,这推动了AI研发效率。图:蚂蚁集团的自动化分布式深度学习系统DLRover现已全面开源该技术框架名为DLRover,目标在于大规模分布式训练的智能化。目前很多企业的训练作业都是跑在混合部署的集群中,运行环境复杂多变,不管多么“崎岖的地形”,DLRover都可以“轻松行驶”。2023 年大模型技术的发展,带来了工程实践的爆发,如何管理数据,提高训练和推理效率,最大化利用现有算
2/1/2024 6:50:00 PM
新闻助手
“千帆杯”第一期赛题公布!一起探索 AI 原生应用的时间魔法
提到“春节”,你首先会想到什么?热气腾腾的年夜饭,大门前福气满满的春联,摩肩接踵的车站,还是一眼看不到排队尽头的游玩景点?不知从什么时候起,各大主题乐园不再只是为孩子打造的童话世界,也俨然成为了成年人的理想国。无数的成年人换上霍格沃茨制服,挑选自己的魔杖,逃离“麻瓜世界”,前往环球影城;许多成年的迪士尼粉丝,也蜂拥至上海迪士尼乐园,在全球首个“疯狂动物城主题园区”亦或是香港迪士尼乐园的全球首个“冰雪奇缘主题园区”,寻找自己的快乐。春节将至,热门主题乐园也会成为大家过节的经典选项,巨大的客流量,也意味着排队,将为主题
2/1/2024 5:19:00 PM
新闻助手
亚马逊部署超过750,000+ 台机器人,工业创新基金投资生成式AI
机器之能报道编辑:吴昕亚马逊工业创新基金有了新趋势。新负责人表示进一步支持生成式 AI,他们甚至投资了一家未公开的生成式 AI 初创公司,称该公司的技术可能会对机器人技术产生重大影响。2013 年,亚马逊只有 1000 台机器人。十年过去了,今天的亚马逊已经部署了超过 750,000 个机器人来解锁 AI 机会。他们正在测试各种先进的机器人技术,不仅关乎效率,更是在重塑人类和机器的协作方式。亚马逊已经部署了超过 750,000 个机器人来解锁 AI 机会2022 年,亚马逊设立一项 10 亿美元的工业创新基金,
2/1/2024 5:00:00 PM
机器之能
小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜
只需一张照片,整个过程无需训练 LoRA 模型,多风格 AI 写真即刻呈现!最近,有一群来自小红书的 95 后神秘团队,自称 InstantX,搞了个大动作 —— 开源「InstantID」项目。InstantID 凭借着高质量的图像生成能力,在开源界掀起了一股热潮:不仅获得了众多技术大佬的点赞,更是在 GitHub 热榜上迅速飙升,成为焦点。这个「出片神器」,让用户只需上传一张照片,就能轻松定制出多种风格的 AI 写真。对,你没看错。如图左侧所示,与之前爆火的妙鸭相机至少需要上传 20 张照片不同的是,Insta
2/1/2024 2:51:00 PM
机器之心
刚刚,字节版GPTs「扣子」上线了
大玩家终于正式下场。在持续一年的大模型热潮之后,「智能体」成为了科技公司们新的押注方向之一。近日,字节跳动正式推出「Coze 扣子」AI Bot 开发平台。任何用户都可以快速、低门槛地搭建自己的 Chatbot,且平台支持用户将其一键发布到飞书、微信公众号、豆包等渠道。链接:,除了可以创建自己的 Chatbot,Coze 官方还提供了 Bots 商店和插件。如以下按照热度精选的 Bots,包含娱乐、创意、学习等各类产品,甚至我们注意到还有「马歇尔音箱粉丝」这个选项。机器之心挑选了一些已有的 Bot 试了试,看看上手
2/1/2024 2:45:00 PM
机器之心
赶超Gemini Pro,提升推理、OCR能力的LLaVA-1.6太强了
去年 4 月,威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学研究者共同发布了 LLaVA(Large Language and Vision Assistant)。尽管 LLaVA 是用一个小的多模态指令数据集训练的,却在一些样本上展示了与 GPT-4 非常相似的推理结果。10 月,LLaVA-1.5 重磅发布,通过对原始 LLaVA 的简单修改,在 11 个基准上刷新了 SOTA。现在,研究团队宣布推出 LLaVA-1.6,主要改进了模型在推理、OCR 和世界知识方面的性能。LLaVA-1.6 甚至在多项基准测
2/1/2024 2:41:00 PM
机器之心
无注意力大模型Eagle7B:基于RWKV,推理成本降低10-100 倍
Eagle 7B 可将推理成本降低 10-100 倍。在 AI 赛道中,与动辄上千亿参数的模型相比,最近,小模型开始受到大家的青睐。比如法国 AI 初创公司发布的 Mistral-7B 模型,其在每个基准测试中,都优于 Llama 2 13B,并且在代码、数学和推理方面也优于 LLaMA 1 34B。与大模型相比,小模型具有很多优点,比如对算力的要求低、可在端侧运行等。近日,又有一个新的语言模型出现了,即 7.52B 参数 Eagle 7B,来自开源非盈利组织 RWKV,其具有以下特点:基于 RWKV-v5 架构构
2/1/2024 2:37:00 PM
机器之心
最强开源多模态生成模型MM-Interleaved:首创特征同步器
过去几个月中,随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出,「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩目的焦点。想象一下,AI 不仅会聊天,还长了「眼睛」,能看懂图片,甚至还会通过画画来表达自己!这意味着,你可以和它们谈天说地,分享图片或视频,它们也同样能用图文并茂的方式回应你。最近,上海人工智能实验室联合香港中文大学多媒体实验室(MMLab)、清华大学、商汤科技、多伦多大学等多家高校、机构,共同发布了一个多才多艺的最强开源多模态生成模型 MM-Interleaved,
2/1/2024 2:34:00 PM
机器之心
Mistral-Medium意外泄露?冲上榜单的这个神秘模型让AI社区讨论爆了
「我现在 100% 确信 Miqu 与 Perplexity Labs 上的 Mistral-Medium 是同一个模型。」近日,一则关于「Mistral-Medium 模型泄露」的消息引起了大家的关注。泄露传闻与一个名为「Miqu」的新模型有关,在评估语言模型情商的基准 EQ-Bench(EQ-Bench 与 MMLU 的相关性约为 0.97、与 Arena Elo 的相关性约为 0.94)上, Miqu 直接吊打了除 GPT-4 之外的所有大模型,而且它的得分与 Mistral-Medium 非常接近:图源::
1/31/2024 3:09:00 PM
机器之心
陶哲轩上新项目:Lean中证明素数定理,研究蓝图都建好了
借助 Lean,陶哲轩又开始了新的项目。「由 Alex Kontorovich 和我领导的一个新的 Lean 形式化项目刚刚正式宣布,该项目旨在形式化素数定理(prime number theorem,PNT)的证明,以及伴随而来的复分析和解析数论的支持机制,并计划给出进一步的结果如 Chebotarev 密度定理。」著名数学家陶哲轩在个人博客中写道。素数定理是数学中的一个重要定理,描述了素数在自然数中的分布规律,该定理在数论中是一个比较重要的研究方向。形式化证明本质上是一种计算机程序,但与 C 或 Pytho
1/31/2024 3:05:00 PM
机器之心
将多模态大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B
对于大型视觉语言模型(LVLM)而言,扩展模型可以有效提高模型性能。然而,扩大参数规模会显著增加训练和推理成本,因为计算中每个 token 都会激活所有模型参数。基于此,来自北京大学、中山大学等机构的研究者联合提出了一种新颖的 LVLM 训练策略 ——MoE-Tuning。MoE-Tuning 可以构建参数数量惊人但计算成本恒定的稀疏模型,并有效解决通常与多模态学习和模型稀疏性相关的性能下降问题。该研究还提出了一种基于 MoE 的新型稀疏 LVLM 架构 ——MoE-LLaVA 框架。该框架独特地在部署过程中通过路
1/31/2024 3:01:00 PM
机器之心
多模态LLM多到看不过来?先看这26个SOTA模型吧
多模态大型语言模型进展如何?盘点 26 个当前最佳多模态大型语言模型。当前 AI 领域的关注重心正从大型语言模型(LLM)向多模态转移,于是乎,让 LLM 具备多模态能力的多模态大型语言模型(MM-LLM)就成了一个备受关注的研究主题。近日,腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布了一份综述报告,全面梳理了 MM-LLM 的近期进展。文中不仅总结了 MM-LLM 的模型架构和训练流程,而且还梳理了 26 个当前最佳的 MM-LLM。如果你正考虑研究或使用 MM-LLM,不妨考
1/31/2024 2:56:00 PM
机器之心
伯克利开源高质量大型机器人操控基准,面对复杂自主操控任务不再犯难
随着人工智能和机器人技术的迅速发展,功能操控(Functional Manipulation)在机器人学中的重要性愈加突出。传统的基准测试已无法满足目前机器人对复杂操控任务的需求,呼吁新的操控基准(Functional Manipulation Benchmark)出现。概述机器人操控面临两个主要挑战:机器人如何智能地处理复杂的接触动力学以及如何应对环境和物体的多样性。针对这些挑战,机器人学习技术被视为关键的解决手段。因此,该领域需要一个全面易得的框架,提供有挑战性的实际任务、高质量数据、易于复制的设置,集合了基线
1/31/2024 2:51:00 PM
机器之心
资讯热榜
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
蚂蚁集团携手北医三院成立AI医疗联合实验室 打造专属AI就医助理
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇
心理学家警告:与 AI 聊天可能导致严重心理健康问题
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
AI新词
芯片
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视频生成
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用