AI在线 AI在线

理论

宇树机器人上演好莱坞《铁甲钢拳》!网友激动表示:比CG还CG

好莱坞科幻大片《铁甲钢拳》就这样被宇树机器人实现了? 官方划重点:全程完全实拍,无任何加速。 和一名成年男子对打,出拳那叫一个稳准狠:被一脚踢倒后,一个手撑地就立马自己起来了:除了和人类对战,两个机器人也能打得热火朝天:与此同时,宇树科技还剧透最近一个月左右,将开启机器人格斗直播。
4/11/2025 12:55:52 PM
量子位

字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?

字节最新深度思考模型,在数学、代码等多项推理任务中超过DeepSeek-R1了? 而且参数规模更小。 同样是MoE架构,字节新模型Seed-Thinking-v1.5有200B总参数和20B激活参数。
4/11/2025 12:10:33 PM
量子位

如何查明你的AI供应商是否存在安全风险

在采用AI的过程中,最令人担忧的问题之一是数据泄露。 想象一下这样的场景:一名员工登录到他们常用的AI聊天机器人中,粘贴了敏感的公司机密数据,并要求对其进行总结。 就这样,机密信息被输入到了不受你控制的第三方模型中。
4/11/2025 11:50:56 AM
Adam Burt

200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了

字节跳动豆包团队今天发布了自家新推理模型 Seed-Thinking-v1.5 的技术报告。 从报告中可以看到,这是一个拥有 200B 总参数的 MoE 模型,每次工作时会激活其中 20B 参数。 其表现非常惊艳,在各个领域的基准上都超过了拥有 671B 总参数的 DeepSeek-R1。
4/11/2025 11:21:00 AM
机器之心

ChatGPT解锁完整记忆,奥特曼彻夜难眠!所有聊天记录黑历史AI全知道

昨晚,奥特曼一则预告帖,浏览破200多万,彻底点燃了全网大猜想。 而让他兴奋到睡不着的,竟是ChatGPT增强了记忆能力! 图片图片从今天起,ChatGPT记忆功能可以参考过去所有聊天记录,提供更加个性化回复。
4/11/2025 10:32:39 AM

AI智能体如何重塑现代工作流程?

长期以来,工作流程一直是组织效率的支柱。 从最简单的行政任务到最复杂的项目管理流程,工作流程都能帮助企业简化操作、减少错误并提高生产力。 然而,随着AI智能体技术的迅猛发展,工作流程的设计、执行与优化正面临彻底重构的契机。
4/11/2025 10:10:16 AM

预训练还没终结!港中文清华等提出「三位一体」框架,持续自我进化

当前(多模态)大模型正深陷「数据饥渴」困境:其性能高度依赖预训练阶段大量高质量(图文对齐)数据的支撑。 然而,现实世界中这类高价值数据资源正在迅速耗尽,传统依赖真实数据驱动模型能力增长的路径已难以为继。 在NeurIPS 2024会议上,OpenAI联合创始人Ilya Sutskever明确指出:「Pre-training as we know it will end」, 这一判断是对传统预范式极限的清晰警示。
4/11/2025 9:35:34 AM
新智元

Grok-3四档定价揭秘:低至0.3美元/百万token,硬刚谷歌Meta

GenAI竞争,越来越激烈了。 据Similar  Web统计,在日活跃用户方面,Grok与Gemini展开了激烈竞争。 两者都已经超过50万日活跃用户,差距不足5万。
4/11/2025 9:29:15 AM
新智元

流体力学专用版DeepSeek,单GPU可跑,成本节约高达100倍

又一专业领域成功引入AI工程师! 而且还是基于DeepSeek、Qwen等国产大模型打造,国内研究人员都能用的那种。 不卖关子了,这就是由英国埃克塞特大学初旭副教授团队与北航王文康副教授团队联合打造的OpenFOAMGPT,将AI工程师成功引入计算流体力学(CFD)领域。
4/11/2025 9:22:00 AM
OpenFOAMGPT团队

7B小模型写好学术论文,新框架告别AI引用幻觉,实测100%学生认可引用质量

学术写作通常需要花费大量精力查询文献引用,而以ChatGPT、GPT-4等为代表的通用大语言模型(LLM)虽然能够生成流畅文本,但经常出现“引用幻觉”(Citation Hallucination),即模型凭空捏造文献引用。 这种现象严重影响了学术论文的可信度与专业性。 现在,加拿大滑铁卢大学与卡内基梅隆大学的华人研究团队,提出了一种名为 ScholarCopilot 的智能学术写作大模型框架,专门针对学术场景,致力于精准地生成带有准确引用的学术文本。
4/11/2025 9:12:21 AM
量子位

Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B

刚刚,Kimi团队上新了! 开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,多模态和推理双双拿捏。 按照Kimi官方的说法,其关键亮点如下:都是基于MoE架构,总参数为16B,但推理时仅激活2.8B;具备强大的多模态推理能力(媲美参数大10倍的模型)和Agent能力;支持128K上下文窗口;采用相对较为宽松的MIT许可证。
4/11/2025 9:10:00 AM
量子位

Dify+RAGFlow:泵类设备预测维护系统案例分享

上篇文章介绍到的 Dify RAGFLow 的协同使用文章里,提到了一个泵类设备预测性维护智能系统。 后来陆续有人私信咨询实施细节,这篇做个统一的介绍。 Dify RAGFlow:1 1>2的混合架构,详细教程 实施案例项目定位是,利用 Dify 的工作流编排能力和 RAGFlow 的知识库组件,结合模拟的设备传感器数据 (IoT) 和企业资源数据 (CMMS, MES, ERP),构建一个针对离心式冷却液泵的预测性维护系统原型。
4/11/2025 9:02:47 AM
韦东东

十大步骤详解Spring AI MCP机制底层实现,小白误入!

MCP分为MCP Client和MCP Server:MCP Client负责进行工具发现和工具调用MCP Server负责提供工具和工具执行总体流程图图片十大步骤详解第一步,MCP Client接收用户的问题,比如“今天是几月几号”。 第二步,MCP Client发送tools/list请求给MCP Server进行工具发现。 利用Spring AI开发的MCP Server,可以利用@Tool注解定义工具,比如:图片并利用MethodToolCallbackProvider提供出去:在MCP Server的MpcServerAutoConfiguration自动配置类中定义了一个McpSyncServer的Bean,它会依赖注入ListToolCallbackProvider,这样McpSyncServer中就拿到了MCP Server中定义的所有Tools(调用ToolCallbackProvider的getToolCallbacks()即可拿到)。
4/11/2025 9:01:37 AM
IT周瑜

字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA​

利用字节团队魔改的FLUX模型,可以直接把多个参考主体放进一张图了。 字节团队以FLUX为基础模型,提出了新的生图模型UNO,统一了图像生成任务中不同输入条件的处理。 无论是单主体进行风格变换,还是不同物体的融合,UNO都能直接搞定。
4/11/2025 9:00:00 AM
量子位

ChatGPT有了完整记忆!像朋友一样记住所有聊天记录,回复更加私人订制

ChatGPT可以引用过去所有聊天了! 刚刚,OpenAI发布ChatGPT新能力,支持参考过去所有对话内容,更好根据个人喜好来生成回复。 除了保存此前记忆,还能引用过去内容。
4/11/2025 8:51:51 AM

有了MCP,AI不仅更完整,还更实用了

互联网刚诞生时,普通人对它的印象只是能收发电子邮件。 智能手机刚出现时,很多人觉得不过是个能打电话的小电脑。 当AI大模型横空出世,大家惊叹于它超强的对话能力,却难以想象它能做什么实际工作。
4/11/2025 8:45:00 AM

Java家族出列:十款值得关注的生成式AI工具与框架

译者 | 核子可乐审校 | 重楼尽管Java并非大多数程序员构建AI/ML项目的首选语言——毕竟Python拥有更庞大的AI/ML框架生态——但Java在AI、机器学习及生成式AI革命中仍占据重要席位。 其技术优势和广泛的生态系统使其成为许多开发者的首选,尤其是那些偏好严格类型定义和JVM高性能的开发者。 甚至部分Python爱好者也会通过Jython运行代码以发挥JVM的速度优势。
4/11/2025 8:30:39 AM
核子可乐

模态编码器 | ALIGN,通过大规模嘈杂数据集训练的视觉语言模型

简单看一下Google早期的一篇工作ALIGN,发表在2021 ICML上。 研究动机:传统的视觉语言表示学习通常在手动标注的大规模数据集上进行训练,需要大量的预先处理和成本。 ALIGN利用网络上摘取的HTML页面和alt-text标签,构建了一个18亿对图像-文本的嘈杂数据集,从而在不需要昂贵的数据过滤的情况下,实现高效的学习。
4/11/2025 2:00:00 AM
Goldma