AI在线 AI在线

资讯列表

DeepSeek R1- 0528 在OpenRouter支持本地工具调用

人工智能领域持续快速发展,DeepSeek对其R1-0528模型的最新更新引发了开发者社区的广泛关注。 据AIbase报道,升级后的DeepSeek R1-0528现已支持OpenRouter上的本地工具调用,这一重大改进使开发者能够将本地工具无缝集成到AI工作流中。 本地工具调用提升工作流效率DeepSeek R1-0528是一款开源推理模型,以其可媲美OpenAI o3和Google Gemini2.5Pro等专有模型的性能而闻名。
6/10/2025 10:01:16 AM
AI在线

​支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟

在当今人工智能的快速发展中,多智能体系统的应用逐渐成为焦点。 最近,由著名企业孵化器 Y Combinator 支持的开源多智能体开发框架 Rowboat 正式亮相。 该框架凭借其便捷的操作和强大的功能,吸引了广泛关注,GitHub 上的星标数已超过2000颗。
6/10/2025 10:01:16 AM
AI在线

生成式AI悄然入侵影视幕后,英国急需应对四大危机

英国电影协会(BFI)近日发布一份重磅报告,指出生成式人工智能正悄然重塑英国的电影、电视和游戏产业。 该技术不仅在幕后广泛应用以提升制作效率,还推动了全新的创作方式与商业模式的诞生。 报告显示,生成式AI已被用于加速脚本撰写、角色建模、视觉特效制作等流程,显著节省时间与成本。
6/10/2025 10:01:16 AM
AI在线

比亚迪接入阿里通义大模型,智能座舱再升级!一句话即可享受在线服务

阿里云官方近日宣布,比亚迪成功接入了阿里通义大模型,这意味着未来在比亚迪的智能座舱内,用户只需一句话,就能轻松实现如购票、点餐等在线服务。 这项新技术将大大提升驾驶体验,为用户提供更为便捷的服务。 这项创新名为 Mobile-Agent,采用了全视觉解决方案。
6/10/2025 10:01:16 AM
AI在线

苹果将 ChatGPT 和其他 AI 模型引入 Xcode

在2025年全球开发者大会(WWDC)上,苹果公司正式发布了其应用开发套件 Xcode 的新版本,这次更新将 OpenAI 的 ChatGPT 集成到开发环境中,为开发者提供了更为智能的编码和文档生成工具。 新版本的 Xcode26允许开发者利用 AI 的强大功能来提高工作效率。 苹果在发布会上表示,开发者可以直接将 AI 模型连接到他们的编码体验中,帮助他们编写代码、进行测试和生成文档。
6/10/2025 10:00:53 AM
AI在线

DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注

据虎嗅消息,国内大模型公司DeepSeek的一位核心高管已于半年前悄然离职创业,并计划在2025年圣诞节前后推出其首款Agent产品。 有接近人士向虎嗅透露,该高管曾担任DeepSeek的“CTO”角色,不过也有知情人指出,DeepSeek内部架构中并无明确设置“CTO”职位。 该职位在名义上可能并不存在,但确有高管承担类似的技术统筹与研发决策职责。
6/10/2025 10:00:32 AM
AI在线

开源多智能体开发框架:支持MCP、Agent SDK,超2000颗星

著名企业孵化器Y Combinator支持的开源多智能体开发框架Rowboat。 Rowboat支持火热的MCP服务以及OpenAI开源的Agent SDK,几分钟就能开发一个复杂的智能体工作流。 开源地址:、Playground、Copilot三大块组成:Agent,主要负责处理对话的特定部分,并能依据指令使用工具执行任务。
6/10/2025 9:28:31 AM

OpenAI 称年收入已达 100 亿美元,2029 年目标 1250 亿美元

OpenAI宣布年收入达100亿美元,主要得益于ChatGPT等产品。公司计划2029年收入增至1250亿美元,但面临人才和基础设施的高额投入压力。#AI# #OpenAI#
6/10/2025 9:27:26 AM
远洋

苹果炮轰AI推理遭打脸,GitHub大佬神怒怼!复杂任务≠推理能力

最近,苹果公司发表了预印本论文,指出推理大模型存在重大缺陷。 昨天,Ruben Hassid发布了相关解读的X帖子,认为这是项突破性研究:苹果证明了Claude等AI推理模型,根本不会思考。 这种解读在社交平台上广泛传播,浏览量已超过1000万,且仍在持续增长。
6/10/2025 9:25:27 AM

数学圈地震!o3靠直觉刷爆人类顶尖难题,14位专家集体破防

推理模型不会推理,一夜成为硅谷最热门的话题。 来自Epoch AI最新报告称,o3-mini-high不仅会推理,还能破解顶尖数学难题。 14位数学家组团,共同评估o3在29道FrontierMath推理能力。
6/10/2025 9:22:31 AM

比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临

王劲,香港大学计算机系二年级博士生,导师为罗平老师。 研究兴趣包括多模态大模型训练与评测、伪造检测等,有多项工作发表于 ICML、CVPR、ICCV、ECCV 等国际学术会议。 近年来,大型语言模型(LLMs)在多模态任务中取得了显著进展,在人工通用智能(AGI)的两大核心支柱(即理解与生成)方面展现出强大潜力。
6/10/2025 9:18:53 AM

刚刚,苹果WWDC掀AI重构风暴!端侧模型全开放、AI版Siri却成最大「鸽」王

今年的苹果,到底有没有新活? 北京时间今天凌晨 1 点,一年一度的「科技圈春晚」—— 苹果全球开发者大会 WWDC 在 CEO 蒂姆・库克的演讲中拉开了序幕! 此次大会,苹果宣布了一系列操作系统、服务和软件的更新,其中包括全新的系统命名规则以及名为液态玻璃( Liquid Glass)的新设计语言。
6/10/2025 9:10:47 AM

AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板

用AI来整理会议内容,已经是人类的常规操作。 不过,你猜怎么着? 面对1000道多步骤音频推理题时,30款AI模型竟然几乎全军覆没,很多开源模型表现甚至接近瞎猜。
6/10/2025 9:10:00 AM

AI七个月突破数学家“围剿”反超人类!14位数学家深挖原始推理token:不靠死记硬背靠直觉

从只能答对2%的题目,到在超难数学题集中刷下22%得分,甚至超过人类团队平均水平,大模型需要多长时间? 现在,令数学家们都惊讶的结果已经尘埃落定:7个月。 发生在大名鼎鼎的“专为为难大模型而生的”FrontierMath基准测试上的这一幕,在激起热议同时,也引发了新的思考:大模型们是怎么做到的?
6/10/2025 9:09:00 AM

双重突破:全球首个零售VLA大模型来了!开源OpenWBT让机器人遥操门槛暴降!

学会“适当暂停与总结”,大模型终于实现无限推理。 想象一下,让你一口气不歇地推演一个超复杂数学证明,大脑也会“内存溢出”吧? 如今的大模型在长上下文推理中也面临同样的困境,随着推理长度增加而指数级增长的计算成本,以及由于长度受限而被迫中断推理过程。
6/10/2025 9:07:00 AM

首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」

视觉语言模型(VLM)正经历从「感知」到「认知」的关键跃迁。 当OpenAI的o3系列通过「图像思维」(Thinking with Images)让模型学会缩放、标记视觉区域时,我们看到了多模态交互的全新可能。 然而,当前主流VLM仍被困在「文本茧房」中——依赖文本token间接翻译视觉信息,在高清图像中的微小物体、视频里的动态细节等场景中,常常因缺乏直接视觉操作能力而「视而不见」。
6/10/2025 9:07:00 AM

无需SFT也不用RL,样本级推理优化神器SLOT来了,准确率轻松+10%

试想一下,如果你参加考试时,可以在答题前花几秒钟「适应」一下这道具体的题目,你的表现会不会更好? 这正是西湖大学研究团队在最新论文中提出的核心思想。 他们开发的 SLOT(Sample-specific Language Model Optimization at Test-time)方法,把每个输入 prompt 本身当作一份「迷你训练数据」,让模型在生成答案前先「学习」理解这个具体问题。
6/10/2025 9:05:00 AM

大模型能够自发形成“人类思维地图”!Nature子刊重磅研究揭示多模态大模型类脑机制

大模型≠随机鹦鹉! Nature子刊最新研究证明:大模型内部存在着类似人类对现实世界概念的理解。 LLM能理解现实世界和各种抽象概念吗?
6/10/2025 9:04:00 AM