面壁智能
全新音频评测工具 UltraEval-Audio 上线,助力音频模型研发!
在音频技术飞速发展的今天,如何对音频模型进行有效评测已成为研究者们的重要课题。 近日,清华大学 NLP 实验室、OpenBMB 与面壁智能联合推出了 UltraEval-Audio,这是一个专为音频模型设计的全新测评框架。 该框架不仅为音频大模型的评测奠定了系统化的基础,还以开箱即用的形式,为研究人员提供了一站式的解决方案。
清华与 OpenBMB 联合推出 UltraEval-Audio:音频模型评测新框架开源发布
近日,清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio,这是一个专为音频模型设计的测评框架。 UltraEval-Audio 不仅为音频大模型领域建立了一整套完整的评测方法论,还将这一体系具体化为一个开箱即用的工程框架,从而完善了音频评测的整体结构。 UltraEval-Audio 的最新版本 v1.1.0在原有 “一键测评” 功能的基础上,增加了热门音频模型的一键复现能力,并扩展了对文本转语音(TTS)、自动语音识别(ASR)、编解码(Codec)等专业模型的支持。
面壁智能完成数亿元融资!端侧大模型加速落地,吉利、长安、大众已上车
端侧AI赛道再迎重磅加注。 面壁智能今日宣布已完成数亿元新一轮融资,由京国瑞、国科投资、中金保时捷基金、米聚资本与和基投资联合参投。 本轮融资将全力推进端侧高效大模型的研发与生态建设,进一步巩固其在国内边缘智能领域的先发优势。
加速端侧大模型进化:面壁智能获数亿元新融资,深度布局智能座舱与终端生态
国内领先的大模型初创企业面壁智能宣布完成数亿元人民币的新一轮融资。 本轮投资方阵容强大,包括京国瑞、国科投资、中金保时捷基金、米聚资本及和基投资。 据了解,本轮募集资金将核心用于持续加大在端侧高效大模型领域的研发投入,进一步巩固其在终端智能市场的技术领先地位。
北京国资助力!面壁智能大模型融资再创佳绩,落地汽车、手机等领域
在人工智能领域持续升温的大背景下,北京国有资本再度出手,助力面壁智能完成新一轮融资。 自今年8月国务院发布《关于深入实施 “人工智能 ” 行动的意见》以来,国内端侧大模型领域的首笔公开融资便浮出水面。 面壁智能此次融资金额达到数亿元,由北京市属国有投资平台 “京国瑞” 及创投基金 “米聚合基” 等共同参与,资金将主要用于提升端侧大模型的研发及商业化进程。
AI 的下一个战场:小模型崛起
过去一段时间,大模型行业经历了一场风切变。 八月初,腾讯官宣“混元系列小模型”落地,不久后,阿里跟进了两款通义Qwen3-4B。 起初,大家以为只是国内大厂对轰,互秀肌肉罢了。
多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快
今天,我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长! 高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。 MiniCPM-V 4.5 亮点一览 ?
大模型热度退潮,真正的技术创新者开始被「看见」
“过去两年中国的大模型投资并不是投技术,而是套着投技术的壳投商业模式。 硅谷的投资人投 OpenAI 是投技术。 ”一位投资人对 AI 科技评论表示。
面壁智能 MiniCPM 4 与 Intel 全面适配,实现 AI PC 2.2 倍长文本推理优化
面壁智能于本月 6 日晚发布端侧大模型 MiniCPM 4.0。面壁智能官方今日发文称,面壁 MiniCPM 4 与 Intel 全面适配,结合英特尔加速套件与 KV Cache 内存增强技术,实现 AI PC 2.2 倍长文本推理优化。
面壁智能推出MiniCPM 4.0端侧大模型 可实现220倍速度提升
6月6日,面壁智能正式推出其最新力作——MiniCPM4.0系列模型,这一系列被誉为“有史以来最具想象力的小钢炮”,不仅在端侧性能上实现了飞跃,更在技术创新上树立了新的标杆。 MiniCPM4.0系列包含两款重量级产品:一款是8B闪电稀疏版,以其创新稀疏架构掀起高效风暴;另一款则是仅0.5B的轻巧灵动版,被誉为“最强小小钢炮”。 这两款模型在速度、效能、性能及落地应用上均展现出卓越表现。
面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王
该公司称新模型通过自研 CPM.cu 推理框架,在极限场景下实现最高 220 倍提速,常规 5 倍提速,支持在 vLLM、SGLang、LlamaFactory 等框架部署。
面壁智能 CEO 李大海:汽车比手机更适合端侧模型落地
李大海指出,因为汽车这个场景,用户的手天然就会在方向盘上,用户更需要用语音去跟座舱交互,同时座舱也有更多的传感器能够去感知环境。相比之下,手机反而没有这样的条件,所以,汽车反而是端侧模型落地更好的产品。(新浪科技)
独家对话刘知远:AGI 是一场技术理想与商业现实的「持久战」
DeepSeek 以迅雷不及掩耳之势出圈后,中国大部分的大模型团队都被打得措手不及,只有一家公司因为底层技术和 AGI 思想路径与 DeepSeek 相近而暂时“逃过一劫”,这家公司就是:面壁智能。 作为中国最早的一批大模型团队之一,面壁智能成立于 2022 年 8 月,其创始团队从 2021 年就主力参与北京智源人工智能研究院的大模型项目“悟道”,训练出多个百亿、千亿参数规模的大模型,并成立大模型开源社区OpenBMB,是国内最早提出“平民版大模型”、最早促进大模型开源事业的团队之一。 但意料之外、又情理之中的是,尽管团队技术实力出色、对 AGI 的理解深刻,其在 2022 年到 2023 年大模型浪潮刚起、国内纯种大模型团队并不多时,却遭到冷落与误解,未能吃到首轮红利。
面壁智能发布 MiniCPM-o 2.6 全模态模型,号称“端侧 GPT-4o”
官方表示,其总参数量 8B,视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别,是开源社区中模态支持最丰富、性能最佳的模型之一。
端侧版GPT-4o问世,面壁小钢炮实现端到端、全模态实时对话
只用 8B 参数,性能接近 OpenAI GPT-4o。
大模型隐藏玩家上桌:DeepSeek 向左,面壁向右
作者丨朱可轩编辑丨陈彩娴大模型赛跑两年后,玩家已逐步分化为三种趋势:一类玩家仍追随 OpenAI 的脚步卷大参数基座模型,另外一类烧不起钱的玩家转头拥抱应用端,而第三类则自始至终都在摸索如何更高效打造出性能更优的模型。 目前,第一类卷向大参数的玩家也都在寻找高效解决方案,连 OpenAI 此前发布 GPT-4o mini 切入小模型市场,Meta Llama 3.1-8B、微软 Phi-3-vision 和 Phi-4 14B 、谷歌 Gemma 2 以及阿里 Qwen 2.5 等一系列小模型也都是头部玩家在做的布局。 算力存在上限已是不争的事实,而且也并非参数越大就意味着效果一定能达到预期,更何况,如若如果每增长一倍参数规模,效果能力却并未呈一倍增长,大模型发展起来会很慢:OpenAI 能用百千亿达到 GPT-4 的水平,其他家则可能需要投入更多资源,如此一来要追赶 GPT-5 会更难,因为在 OpenAI 的基础上再加码更多算力、参数的可能性不大,这对于大多数无法如同 OpenAI 一般大把烧钱的玩家而言并非理智选择。
让「GPT-4V」跑在手机上,这家中国大模型公司做到了
真实世界的视觉信息是流动的,而在处理流动性的视觉信息上,端侧视频理解具有天然优势,手机、PC、AR、机器人、智能座驾等端侧设备自带的摄像头,具有天然的多模态输入能力。 与云端相比,端侧离用户更近,链路更短,效率更高,同时具有更强的信息安全优势。 今日,面壁正式发布了 MiniCPM-V 2.6,在端侧性能实现全面对标 GPT-4V——据介绍,MiniCPM-V 2.6 首次在端侧实现单图、多图、视频理解等多模态核心能力全面超越GPT-4V,三项能力均取得 20B 以下 SOTA 成绩,单图理解越级比肩 Gemini 1.5 Pro 和 GPT-4o mini 。
可信度超越GPT-4V,清华&面壁揭秘「小钢炮」模型背后的高效对齐技术
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文主要作者来自 MiniCPM-V 团队,其中第一作者余天予是清华大学 2021 级硕士研究生,他的主要研究方向是通用多模态基础大模型构建及其对齐方法。近期,由清华大学自然语言处理实验室
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉