应用
中国信通院、vivo、荣耀、OPPO、小米、华为联合倡议:共建终端智能体生态
中国信息通信研究院携vivo、荣耀、OPPO、小米、华为等产业界,于 5 月 27 日发布《关于共建终端智能体生态的倡议》,共同制定了终端智能体生态的统一技术标准,为用户提供懂你、能干、可信、安全的终端智能体服务。
快手可灵 AI 上线 2.1 系列模型:不到 1 分钟生成 5 秒 1080p 视频,更快更便宜
其在标准模式(720p)下生成5s视频仅需20灵感值,高品质模式(1080p)下也只需35灵感值,成本下降65%。
蚂蚁集团开源Ming-lite-omni:首个媲美GPT-4o的开源多模态模型
蚂蚁集团旗下百灵大模型团队在近期蚂蚁技术日上宣布重大决定:将统一多模态大模型Ming-lite-omni进行全面开源。 这一举措不仅标志着蚂蚁集团在AI领域的又一次重大开放,更被业界视为首个在模态支持方面能够与GPT-4o相媲美的开源模型。 220亿参数的技术突破Ming-lite-omni基于Ling-lite构建,采用先进的MoE(专家混合)架构,拥有220亿总参数和30亿激活参数的强大配置。
OpenAI放大招!图像生成API升级:实时流式预览+多轮编辑,MCP加持让创作无界限!
OpenAI宣布其图像生成API(Responses API)迎来重大更新,新增流式传输、多轮编辑以及与Model Context Protocol(MCP)工具和实时网络数据搜索的集成功能。 这些新特性不仅提升了图像生成效率,还为开发者提供了更灵活的创作方式,标志着AI驱动的视觉内容创作进入全新阶段。 AIbase为您整理了此次更新的核心亮点及其对行业的深远影响。
Meta 团队研究发现:简化推理链条能显著提升 AI 准确率
近期,Meta 的 FAIR 团队与耶路撒冷希伯来大学的研究人员联合发布了一项新研究,表明减少大型语言模型的推理时间可以显著提高其在复杂推理任务中的表现。 研究结果显示,使用较短推理链的 AI 模型准确率提高了34.5%,这一发现对当前 AI 行业的假设提出了挑战。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项研究中,作者指出,长时间的思考链条并不一定能够带来更好的推理能力,反而会导致计算资源的浪费。
谷歌官方相册 App 迎十周岁生日:消除、增强等 Pixel 9 专属 AI 功能下放
谷歌官方的相册App迎来十周年,为此谷歌今日宣布将全面升级应用中的编辑器,生成式AI则是此次更新的核心亮点。
字节发布图像Agent“小云雀AI” 打造一键爆款创作神器
字节跳动今日推出全新图像Agent“小云雀AI”,一款智能创作工具,引发行业关注。 其功能与Lovart相似,用户仅需一句指令,“小云雀AI”即可主动思考、智能执行,快速生成爆款视频与图片,真正实现“灵感即所得,创作零门槛”。 “小云雀AI”无需专业技能,创作如聊天般轻松,适合短视频创作者、营销团队及普通用户,极大降低内容创作门槛。
可灵2.1重磅上线:价格降65%,性能显著提升
备受关注的 AI 视频生成工具可灵2.1正式上线。 这次更新不仅在性能上实现了显著提升,还大幅降低了价格,吸引了众多用户的目光。 根据反馈,可灵2.1的效果、速度与性价比都令人惊艳,用户普遍表示这款新版本将大大改善他们的创作体验。
Meta 发布 Multi-SpatialMLLM:引领多模态 AI 的空间理解革命
科技巨头 Meta 与香港中文大学的研究团队联合推出了 Multi-SpatialMLLM 模型,这一新框架在多模态大语言模型(MLLMs)的发展中取得了显著进展,尤其是在空间理解方面。 该模型通过整合深度感知、视觉对应和动态感知三大组件,突破了以往单帧图像分析的限制,为更复杂的视觉任务提供了强有力的支持。 近年来,随着机器人和自动驾驶等领域对空间理解能力的需求不断增长,现有的 MLLMs 面临着诸多挑战。
MotionPro炸场!AI视频生成革命来袭,40ms一帧精准控制,影视游戏行业要变天
AI领域迎来一项重大技术突破——MotionPro,一款专为图像到视频(I2V)生成设计的精密运动控制器正式亮相。 这一技术通过创新的区域轨迹和运动掩码技术,实现了对物体和镜头运动的精细化控制,为视频生成带来了前所未有的灵活性和精确性。 AIbase为您整理了MotionPro的最新进展及其对行业的深远影响。
基准测试揭秘大模型“字数危机”:26 个模型长文本生成普遍拉胯,最大输出长度过度宣传
“写一篇 10,000 字的长文,详细分析某个议题。”看似简单的要求,实际却往往让这些模型“力不从心”:不是生成内容不足,就是重复啰嗦,甚至直接罢工拒绝生成。
40毫秒生成一个世界!Odyssey AI交互视频引爆Web4.0,免费试玩让你秒变虚拟探险家!
AI初创公司Odyssey宣布推出其突破性的AI交互视频技术,以每40毫秒生成并流式传输一帧的惊人速度,为用户带来无需传统游戏引擎即可实现的实时互动体验。 这一技术被誉为“交互式视频”,融合了视频游戏与电影的元素,标志着数字化叙事领域的重大突破。 AIbase为您整理了Odyssey这一创新技术的核心亮点及其对未来娱乐产业的深远影响。
通义实验室、北大发布新技术ZeroSearch 让LLM检索能力激活,成本降低88%
最近,通义实验室和北京大学的研究团队推出了一项名为 ZeroSearch 的创新框架,这一新技术可以在不需要真实搜索的情况下,激活大语言模型的检索能力,并且训练成本降低了惊人的88%。 这一突破为大语言模型的训练和应用提供了全新的思路。 传统的训练方法通常依赖于真实的搜索引擎来获取信息,这不仅造成了高昂的 API 调用成本,还可能因搜索结果的质量不稳定而影响模型的表现。
扎克伯格称 Meta AI 助手月活跃用户规模破 10 亿
在本周三举办的年度股东大会上,Meta 公司首席执行官马克・扎克伯格(Mark Zuckerberg)表示,在旗下的 Facebook、Instagram、WhatsApp 和 Messenger 等系列应用中,使用 AI 助手的月活跃用户数量已经突破 10 亿。
中国欢迎有意愿的上合组织成员国共建人工智能应用合作中心
据央视新闻报道,在 2025 中国-上海合作组织人工智能合作论坛上,中国发布《中国-上合组织国家人工智能应用合作中心建设方案》,并发出共建邀请。
Meta 发布 Multi-SpatialMLLM:多模态 AI 突破空间理解瓶颈
来自FAIR Meta和香港中文大学的研究团队提出了一种新框架,通过深度感知、视觉对应和动态感知三大组件,显著提升MLLMs的多帧空间理解能力。
全栈智能体Lemon AI横空出世:一键解锁多领域复杂任务
近日,创新型全栈通用AI Agent——Lemon AI正式亮相,掀起智能自动化热潮。 Lemon AI以其强大的自主性和工具调用能力,从任务需求到成果交付实现全流程自动化,无需人工干预,为用户带来高效便捷的体验。 Lemon AI集成自然语言处理、代码生成、网页浏览、API调用、系统命令执行及应用操作等多种功能,能够智能识别任务目标,自动规划完成步骤并调用所需工具。
字节推出全新 AI 剪辑应用 “剪小映”,轻松记录生活瞬间
最近,字节跳动公司发布了一款名为 “剪小映” 的新应用,其宣传口号 “捕捉美好,智创影片” 引发了广泛关注。 这款应用的推出,标志着字节在视频编辑领域的又一次创新,同时也是继 “即梦 AI” 之后的又一力作。 借助火山引擎的豆包大模型技术,“剪小映” 旨在为用户提供更加便捷、高效的视频创作体验。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉