AI在线 AI在线

应用

小米多模态大模型Xiaomi MiMo-VL开源

近日,小米公司研发的MiMo-VL多模态模型接过MiMo-7B的接力棒,在多个领域展现出了强大的实力。 该模型在图片、视频、语言的通用问答和理解推理等多个任务上大幅领先同尺寸标杆多模态模型Qwen2.5-VL-7B,在GUI Grounding任务上的表现更是可与专用模型相媲美,为Agent时代的到来做好了准备。 MiMo-VL-7B在多模态推理任务上成绩斐然,尽管参数规模仅为7B,却在奥林匹克竞赛(OlympiadBench)和多个数学竞赛(MathVision、MathVerse)中大幅领先参数规模10倍大的阿里Qwen-2.5-VL-72B和QVQ-72B-Preview,同时也超越了闭源模型GPT-4o。
5/30/2025 10:01:14 AM
AI在线

​黑森林实验室推出 FLUX.1Kontext:可通过文本和参考图像对图像进行多次修改

黑森林实验室(Black Forest Labs,简称 BFL),由著名的 Stable Diffusion 模型创作者成立,近日推出了新一代图像生成模型 FLUX.1Kontext。 该模型不仅可以生成和编辑照片,还支持用户通过文本和参考图像对图像进行多次修改,为企业的 AI 应用带来了全新可能。 多版本选择与平台支持BFL 推出了 FLUX.1Kontext 的三个版本:FLUX.1Kontext [pro]、FLUX.1Kontext [max] 以及即将进入私有测试阶段的 FLUX.1Kontext [dev]。
5/30/2025 10:01:14 AM
AI在线

百度智能云千帆大模型平台全新升级,文小言App引入DeepSeek最新技术

百度智能云千帆大模型平台于5月29日迎来了重大更新,正式上架了最新的 DeepSeek-R1-0528大模型。 这一更新标志着百度在 AI 技术领域的进一步创新,旨在为企业提供更加全面和强大的模型支持。 此次升级,千帆模型开发平台不仅仅是简单的模型更新,还增加了多项实用功能。
5/30/2025 9:05:04 AM
AI在线

Artificial Analysis:DeepSeek成为世界前二AGI实验室

模型与 API 独立分析公司 Artificial Analysis 发布了对 DeepSeek R1-0528的最新评估报告,结果显示,DeepSeek R1在技术性能上取得了显著突破,一举超越了 xAI、Meta 和 Anthropic,与谷歌平起平坐,成为全球第二大人工智能实验室。 同时,DeepSeek 在开源权重领域也确立了其无可争议的领导地位。 根据 Artificial Analysis 的智能指数,DeepSeek R10528版本在对所有顶尖模型进行的七项主流评估中得分从60分跃升至68分。
5/30/2025 9:05:04 AM
AI在线

阿里巴巴开源自主搜索 AI 智能体 WebAgent 让研究更高效

阿里巴巴在 GitHub 上发布了其创新的自主搜索 AI 智能体 ——WebAgent。 这款 AI 智能体具备端到端的信息检索和多步推理能力,能够像人类一样在网络环境中主动搜索、分析和决策。 它的推出将极大提升研究人员获取和整理信息的效率。
5/30/2025 9:05:04 AM
AI在线

百度智能云千帆大模型平台、文小言接入DeepSeek-R1-0528模型

百度智能云千帆大模型平台正式上架了 DeepSeek 最新的 R1-0528大模型。 这一重要更新于5月29日上线,旨在为企业和用户提供更强大的 AI 能力和支持。 千帆模型开发平台不仅上架了这一全新大模型,还同步推出了一系列实用功能,包括批量推理、模型评估、推理日志挖掘分析以及模型蒸馏。
5/30/2025 9:05:04 AM
AI在线

出门问问上线 Mobvoi MCP Server

5月29日,人工智能公司出门问问正式上线Mobvoi MCP Server,并开源代码,通过一站式集成多项AI能力,真正帮助用户实现“AI能力自由”。 Mobvoi MCP Server集成了语音生成、声音克隆、图片驱动数字人、视频配音、视频翻译等多项能力,用户只需简单输入文本,即可灵活调用这些服务。 目前,该平台已兼容Cursor、Cline、Claude Desktop、Windsurf、OpenAI Agents等MCP客户端,完美适配多场景及多端工作流,无论是代码小白、AI Coding爱好者,还是开发工程师,均可轻松上手。
5/30/2025 8:00:54 AM
AI在线

腾讯元宝正式接入DeepSeek R1-0528 最新版

腾讯元宝正式宣布接入DeepSeek R1-0528最新版,并在电脑版、网页版同步提供抢先体验,此次模型更新带来了三大显著变化,为用户带来更加优质、高效的AI使用体验。 在推理能力上,新模型展现出了更强的实力。 无论是处理复杂的代码问题,还是深入分析各类难题,都能够做到快速且准确,为用户提供可靠的解决方案。
5/30/2025 8:00:54 AM
AI在线

阿里巴巴开源自主搜索 AI 智能体 WebAgent

WebAgent 不仅能识别文献中的关键信息,还能通过多步推理将不同文献中的观点进行整合,最终为用户提供一份全面且精准的研究报告。
5/30/2025 6:40:47 AM
问舟

“一天内完成更新”:腾讯多款产品接入 DeepSeek R1-0528 最新版

腾讯官方今日发文宣布,腾讯元宝、ima、搜狗输入法、QQ 浏览器等产品迎来升级,率先接入深度思考模型 DeepSeek R1-0528 最新版,多项能力全面提升。具体如下: · 推理能力大幅提升,代码水平更强 · 写作表现更有人味,格式更规范 · 思考不仅快,还有条理、讲逻辑,同时支持长时间思考
5/29/2025 11:13:14 PM
归泷

百度智能云千帆大模型平台、文小言宣布接入 DeepSeek-R1-0528 最新模型

百度智能云千帆大模型平台和文小言App宣布全面接入DeepSeek-R1-0528最新模型,该模型在复杂逻辑推理、长文本处理稳定性、代码生成质量等方面有显著提升。企业用户和开发者可通过千帆平台体验新模型,并利用全流程工具链构建专属大模型。文小言App用户也可体验最新的AI问答和创作能力。#百度智能云##DeepSeek#
5/29/2025 10:09:54 PM
远洋

教育部发布 2025 年高考预警信息:靠 AI 或所谓“专家”押中题目可能性极小

教育部指出,一些不法分子受利益驱使,散布高考相关虚假信息,制造贩卖焦虑,组织实施诈骗,甚至诱导考生作弊,严重损害考生和家长切身利益,严重扰乱考试招生秩序。
5/29/2025 9:32:14 PM
清源

国家新型工业化操作系统“鸿道”发布:用于具身智能机器人,支持华为、龙芯、英伟达、英特尔等 GPU / NPU 架构

据上证报报道,鸿道操作系统实现了芯片-系统-应用的垂直整合,支持包括龙芯,华为、海光、英伟达、英特尔、高通等在内的一众GPU/NPU架构。
5/29/2025 9:21:39 PM
清源

DeepSeek-R1-0528 更新官方详解:思考更深、推理更强,整体表现接近 o3

DeepSeek R1 模型昨日宣布完成小版本升级,当前版本为 DeepSeek-R1-0528。用户通过官方网站、App 或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API 也已同步更新,调用方式不变。
5/29/2025 8:16:57 PM
汪淼

Anthropic CEO 阿莫代伊警告:未来五年 AI 可能消灭半数入门级白领工作

阿莫代伊指出,AI技术的飞速发展正对初级白领职业构成重大威胁,尤其是在科技、金融、法律、咨询等领域。他警告称,这一趋势将在一至五年内迅速显现,但外界对此普遍缺乏警觉。
5/29/2025 7:43:26 PM
清源

奥运攻关技术创新联合体在北京成立,将建全球最长智能跑道、首个国人运动人体专业多模态大模型

成立仪式上,国家体育总局体育科学研究所与近 60 家单位现场签约,超 20 家企业参加奥运攻关代表性科研成果展,发布国家级人工智能体育健康应用基地。国家体育总局科教司司长陈志宇,北京经开区工委委员、管委会副主任王磊出席仪式并致辞。
5/29/2025 6:36:56 PM
汪淼

微软 CEO 纳德拉:我更关注 AI 为现实世界带来的实际影响,而非单纯追求 AGI

微软CEO纳德拉表示,AI技术应注重实际影响而非单纯追求AGI。他批评科技行业过于自恋,强调技术应造福社会。微软与OpenAI的合作关系出现裂痕,微软正开发自己的AI模型。#人工智能##微软#
5/29/2025 6:28:07 PM
远洋

通义大模型发布OmniAudio 可从 360° 视频生成空间音频

近日,通义实验室语音团队在空间音频生成领域取得里程碑式成果,推出OmniAudio技术,该技术可直接从360°视频生成FOA(First-order Ambisonics)音频,为虚拟现实和沉浸式娱乐带来全新可能。 空间音频作为一种模拟真实听觉环境的技术,能提升沉浸式体验,但现有技术大多基于固定视角视频,对360°全景视频空间信息利用不足。 传统视频到音频生成技术主要生成非空间音频,无法满足沉浸式体验对3D声音定位需求,且多基于有限视角视频,错过全景视频丰富视觉上下文。
5/29/2025 6:00:54 PM
AI在线