资讯列表
蚂蚁集团开源Ming-lite-omni:首个媲美GPT-4o的开源多模态模型
蚂蚁集团旗下百灵大模型团队在近期蚂蚁技术日上宣布重大决定:将统一多模态大模型Ming-lite-omni进行全面开源。 这一举措不仅标志着蚂蚁集团在AI领域的又一次重大开放,更被业界视为首个在模态支持方面能够与GPT-4o相媲美的开源模型。 220亿参数的技术突破Ming-lite-omni基于Ling-lite构建,采用先进的MoE(专家混合)架构,拥有220亿总参数和30亿激活参数的强大配置。
5/29/2025 4:00:54 PM
AI在线
谷歌官方相册 App 迎十周岁生日:消除、增强等 Pixel 9 专属 AI 功能下放
谷歌官方的相册App迎来十周年,为此谷歌今日宣布将全面升级应用中的编辑器,生成式AI则是此次更新的核心亮点。
5/29/2025 3:18:36 PM
清源
MotionPro炸场!AI视频生成革命来袭,40ms一帧精准控制,影视游戏行业要变天
AI领域迎来一项重大技术突破——MotionPro,一款专为图像到视频(I2V)生成设计的精密运动控制器正式亮相。 这一技术通过创新的区域轨迹和运动掩码技术,实现了对物体和镜头运动的精细化控制,为视频生成带来了前所未有的灵活性和精确性。 AIbase为您整理了MotionPro的最新进展及其对行业的深远影响。
5/29/2025 3:00:54 PM
AI在线
Meta 发布 Multi-SpatialMLLM:引领多模态 AI 的空间理解革命
科技巨头 Meta 与香港中文大学的研究团队联合推出了 Multi-SpatialMLLM 模型,这一新框架在多模态大语言模型(MLLMs)的发展中取得了显著进展,尤其是在空间理解方面。 该模型通过整合深度感知、视觉对应和动态感知三大组件,突破了以往单帧图像分析的限制,为更复杂的视觉任务提供了强有力的支持。 近年来,随着机器人和自动驾驶等领域对空间理解能力的需求不断增长,现有的 MLLMs 面临着诸多挑战。
5/29/2025 3:00:54 PM
AI在线
可灵2.1重磅上线:价格降65%,性能显著提升
备受关注的 AI 视频生成工具可灵2.1正式上线。 这次更新不仅在性能上实现了显著提升,还大幅降低了价格,吸引了众多用户的目光。 根据反馈,可灵2.1的效果、速度与性价比都令人惊艳,用户普遍表示这款新版本将大大改善他们的创作体验。
5/29/2025 3:00:54 PM
AI在线
字节发布图像Agent“小云雀AI” 打造一键爆款创作神器
字节跳动今日推出全新图像Agent“小云雀AI”,一款智能创作工具,引发行业关注。 其功能与Lovart相似,用户仅需一句指令,“小云雀AI”即可主动思考、智能执行,快速生成爆款视频与图片,真正实现“灵感即所得,创作零门槛”。 “小云雀AI”无需专业技能,创作如聊天般轻松,适合短视频创作者、营销团队及普通用户,极大降低内容创作门槛。
5/29/2025 3:00:54 PM
AI在线
基准测试揭秘大模型“字数危机”:26 个模型长文本生成普遍拉胯,最大输出长度过度宣传
“写一篇 10,000 字的长文,详细分析某个议题。”看似简单的要求,实际却往往让这些模型“力不从心”:不是生成内容不足,就是重复啰嗦,甚至直接罢工拒绝生成。
5/29/2025 2:57:53 PM
清源
通义实验室、北大发布新技术ZeroSearch 让LLM检索能力激活,成本降低88%
最近,通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架,这一新技术可以在不需要真实搜索的情况下,激活大语言模型的检索能力,并且训练成本降低了惊人的88%。 这一突破为大语言模型的训练和应用提供了全新的思路。 传统的训练方法通常依赖于真实的搜索引擎来获取信息,这不仅造成了高昂的 API 调用成本,还可能因搜索结果的质量不稳定而影响模型的表现。
5/29/2025 2:00:56 PM
AI在线
40毫秒生成一个世界!Odyssey AI交互视频引爆Web4.0,免费试玩让你秒变虚拟探险家!
AI初创公司Odyssey宣布推出其突破性的AI交互视频技术,以每40毫秒生成并流式传输一帧的惊人速度,为用户带来无需传统游戏引擎即可实现的实时互动体验。 这一技术被誉为“交互式视频”,融合了视频游戏与电影的元素,标志着数字化叙事领域的重大突破。 AIbase为您整理了Odyssey这一创新技术的核心亮点及其对未来娱乐产业的深远影响。
5/29/2025 2:00:56 PM
AI在线
扎克伯格称 Meta AI 助手月活跃用户规模破 10 亿
在本周三举办的年度股东大会上,Meta 公司首席执行官马克・扎克伯格(Mark Zuckerberg)表示,在旗下的 Facebook、Instagram、WhatsApp 和 Messenger 等系列应用中,使用 AI 助手的月活跃用户数量已经突破 10 亿。
5/29/2025 1:52:31 PM
故渊
中国欢迎有意愿的上合组织成员国共建人工智能应用合作中心
据央视新闻报道,在 2025 中国-上海合作组织人工智能合作论坛上,中国发布《中国-上合组织国家人工智能应用合作中心建设方案》,并发出共建邀请。
5/29/2025 1:46:53 PM
浩渺
Meta 发布 Multi-SpatialMLLM:多模态 AI 突破空间理解瓶颈
来自FAIR Meta和香港中文大学的研究团队提出了一种新框架,通过深度感知、视觉对应和动态感知三大组件,显著提升MLLMs的多帧空间理解能力。
5/29/2025 1:38:56 PM
故渊
全面解读:新版R1低调升级!编程强到起飞直追o3-high,支持30分钟以上长思考,推理、写作都进化了!
出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek 于 5 月 28 日晚间在微信平台低调宣布——R1 模型完成“小版本试升级”! 图片这波有多低调呢? DeepSeek 又是“0 宣发”出手,连一句英文公告都没有。
5/29/2025 1:05:32 PM
伊风
全球首款AI代理浏览器Opera Neon发布,智能聊天与自动化任务引领Web4.0时代
Opera公司正式宣布推出其全新AI驱动的代理浏览器Opera Neon,并开放Alpha版候补名单。 这一浏览器以其独特的“代理”功能,重新定义了用户与网络的交互方式,集成了智能聊天、任务自动化和内容创作等创新特性。 AIbase为您整理了Opera Neon的最新亮点及其对未来浏览体验的深远影响。
5/29/2025 12:01:03 PM
AI在线
字节推出全新 AI 剪辑应用 “剪小映”,轻松记录生活瞬间
最近,字节跳动公司发布了一款名为 “剪小映” 的新应用,其宣传口号 “捕捉美好,智创影片” 引发了广泛关注。 这款应用的推出,标志着字节在视频编辑领域的又一次创新,同时也是继 “即梦 AI” 之后的又一力作。 借助火山引擎的豆包大模型技术,“剪小映” 旨在为用户提供更加便捷、高效的视频创作体验。
5/29/2025 12:01:03 PM
AI在线
谷歌放大招!LMEval开源评测框架上线,AI模型比拼从此更透明
近日,谷歌正式发布了开源框架 LMEval,旨在为大语言模型(LLM)和多模态模型提供标准化的评测工具。 这一框架的推出,不仅简化了跨平台模型性能比较,还支持文本、图像和代码等多领域的评估,展现了谷歌在AI评测领域的最新突破。 AIbase为您整理了LMEval的最新动态及其对AI行业的影响。
5/29/2025 12:01:03 PM
AI在线
全栈智能体Lemon AI横空出世:一键解锁多领域复杂任务
近日,创新型全栈通用AI Agent——Lemon AI正式亮相,掀起智能自动化热潮。 Lemon AI以其强大的自主性和工具调用能力,从任务需求到成果交付实现全流程自动化,无需人工干预,为用户带来高效便捷的体验。 Lemon AI集成自然语言处理、代码生成、网页浏览、API调用、系统命令执行及应用操作等多种功能,能够智能识别任务目标,自动规划完成步骤并调用所需工具。
5/29/2025 12:01:03 PM
AI在线
蚂蚁集宣布正式开源统一多模态大模型Ming-lite-omni
5月27日,在蚂蚁技术日上,蚂蚁集团旗下的百灵大模型(Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。 据蚂蚁方面介绍,这是一款基于Ling-lite构建的MoE架构的全模态模型,其总参数22B,激活参数3B。 据悉,Ming-lite-omni当前模型权重和推理代码已开源,后续会陆续开源训练代码和训练数据。
5/29/2025 11:27:00 AM
郭海惟