多模态生成模型

字节跳动AI核心人才流失视觉研究负责人冯佳时正式离职

字节跳动AI核心人才流失视觉研究负责人冯佳时正式离职

字节跳动在人工智能领域遭遇重要人事变动。该公司Seed大模型视觉基础研究团队负责人冯佳时近日正式宣布离职，这一消息在AI研究圈引发广泛关注。冯佳时在计算机视觉领域具有深厚的学术背景和丰富经验。

8/26/2025 11:31:01 AM AI在线

智谱与生数科技达成战略合作专注大模型联合创新

智谱与生数科技达成战略合作专注大模型联合创新

4月27日，清华大学旗下的两家明星人工智能公司智谱（Z.ai）和生数科技(shengshu.com)宣布达成重大战略合作。此次合作旨在通过双方在大语言模型和多模态生成模型的技术积累与优势，共同推进国产大模型的技术创新与产业落地。智谱和生数科技的合作涵盖了联合研发、产品联动、解决方案整合以及行业协同等多个方面。

4/27/2025 3:00:38 PM AI在线

字节跳动开源Liquid多模态模型，革新视觉与语言统一生成

字节跳动开源Liquid多模态模型，革新视觉与语言统一生成

人工智能领域迎来一项重大突破。 AIbase从社交媒体获悉，字节跳动于近日宣布开源其全新多模态生成模型Liquid，该模型以创新的统一编码方式和单一大语言模型（LLM）架构，实现了视觉理解与生成任务的无缝整合。这一发布不仅展示了字节在多模态AI上的技术雄心，也为全球开发者提供了强大的开源工具。

4/16/2025 6:01:15 PM AI在线

最强开源多模态生成模型MM-Interleaved：首创特征同步器

最强开源多模态生成模型MM-Interleaved：首创特征同步器

过去几个月中，随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出，「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩目的焦点。想象一下，AI 不仅会聊天，还长了「眼睛」，能看懂图片，甚至还会通过画画来表达自己！这意味着，你可以和它们谈天说地，分享图片或视频，它们也同样能用图文并茂的方式回应你。最近，上海人工智能实验室联合香港中文大学多媒体实验室（MMLab）、清华大学、商汤科技、多伦多大学等多家高校、机构，共同发布了一个多才多艺的最强开源多模态生成模型 MM-Interleaved，

2/1/2024 2:34:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉