模态

火了一整年的多模态学习，在工业界的落地和实践进展到底怎么样了？

火了一整年的多模态学习，在工业界的落地和实践进展到底怎么样了？

在小红书，看见多模态学习的无限可能。

11/23/2022 3:46:00 PM

机器之心

最大数据集、多任务覆盖，阿里达摩院发布首个大规模中文多模态评测基准MUGE

最大数据集、多任务覆盖，阿里达摩院发布首个大规模中文多模态评测基准MUGE

在计算机视觉领域甚至人工智能的发展历程中，ImageNet对于整个领域的技术进步具有至关重要的作用。随着多模态学习成为当下的新热点，为了通过大规模数据集建设和全方位模型能力评测推动多模态领域的发展，阿里达摩院推出MUGE（全称Multimodal Understanding and Generation Evaluation Benchmark）评测基准。该基准是由达摩院联合浙江大学、阿里云天池平台联合发布，中国计算机学会计算机视觉专委会（CCF-CV专委）协助推出的首个大规模中文多模态评测基准。其拥有全球最大规模的中文多模态评测数据集，覆盖多种类型的任务，包括图文描述、基于文本的图像生成、跨模态检索等。MUGE的推出旨在解决当前中文多模态领域下游任务数据集匮乏的问题，并且为广大研究者提供权威平台，从理解能力和生成能力两大角度去衡量算法模型的有效性。

12/21/2021 3:08:00 PM

机器之心

一个模型处理多种模态和任务，商汤等提出Uni-Perceiver，迈向通用预训练感知模型

一个模型处理多种模态和任务，商汤等提出Uni-Perceiver，迈向通用预训练感知模型

来自商汤、西安交通大学等机构的研究者提出了一种通用感知架构 Uni-Perceiver ，该方法可以更好地将预训练中学到的知识迁移到下游任务中。

12/12/2021 12:47:00 PM

机器之心

AI「读图会意」首超人类！阿里达摩院刷新全球VQA纪录

AI「读图会意」首超人类！阿里达摩院刷新全球VQA纪录

历经六年，AI 在这一技能上得分首超人类。

8/12/2021 4:23:00 PM

机器之心

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 Sora、可灵、即梦哪家强？AI视频软件深度测评！借助 AgentCore Memory 为智能体应用添加记忆功能深度拆解！这可能是全网最详细的AI视频创作教程

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney AI新词开源 Meta 微软智能用户 GPT 学习技术智能体马斯克 Gemini Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法 AI for Science Agent 苹果 Claude 芯片腾讯 Stable Diffusion 蛋白质开发者 xAI 具身智能生成式神经网络机器学习 3D RAG AI视频人形机器人研究大语言模型百度生成 Sora GPU 工具华为计算字节跳动 AI设计 AGI 大型语言模型搜索视频生成生成式AI 场景 DeepMind 深度学习 AI模型特斯拉架构 MCP 亚马逊 Transformer 编程视觉预测