AI在线 AI在线

AI

宇树机器人上演好莱坞《铁甲钢拳》!网友激动表示:比CG还CG

好莱坞科幻大片《铁甲钢拳》就这样被宇树机器人实现了? 官方划重点:全程完全实拍,无任何加速。 和一名成年男子对打,出拳那叫一个稳准狠:被一脚踢倒后,一个手撑地就立马自己起来了:除了和人类对战,两个机器人也能打得热火朝天:与此同时,宇树科技还剧透最近一个月左右,将开启机器人格斗直播。
4/11/2025 12:55:52 PM
量子位

字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?

字节最新深度思考模型,在数学、代码等多项推理任务中超过DeepSeek-R1了? 而且参数规模更小。 同样是MoE架构,字节新模型Seed-Thinking-v1.5有200B总参数和20B激活参数。
4/11/2025 12:10:33 PM
量子位

ChatGPT解锁完整记忆,奥特曼彻夜难眠!所有聊天记录黑历史AI全知道

昨晚,奥特曼一则预告帖,浏览破200多万,彻底点燃了全网大猜想。 而让他兴奋到睡不着的,竟是ChatGPT增强了记忆能力! 图片图片从今天起,ChatGPT记忆功能可以参考过去所有聊天记录,提供更加个性化回复。
4/11/2025 10:32:39 AM

Grok-3四档定价揭秘:低至0.3美元/百万token,硬刚谷歌Meta

GenAI竞争,越来越激烈了。 据Similar  Web统计,在日活跃用户方面,Grok与Gemini展开了激烈竞争。 两者都已经超过50万日活跃用户,差距不足5万。
4/11/2025 9:29:15 AM
新智元

流体力学专用版DeepSeek,单GPU可跑,成本节约高达100倍

又一专业领域成功引入AI工程师! 而且还是基于DeepSeek、Qwen等国产大模型打造,国内研究人员都能用的那种。 不卖关子了,这就是由英国埃克塞特大学初旭副教授团队与北航王文康副教授团队联合打造的OpenFOAMGPT,将AI工程师成功引入计算流体力学(CFD)领域。
4/11/2025 9:22:00 AM
OpenFOAMGPT团队

7B小模型写好学术论文,新框架告别AI引用幻觉,实测100%学生认可引用质量

学术写作通常需要花费大量精力查询文献引用,而以ChatGPT、GPT-4等为代表的通用大语言模型(LLM)虽然能够生成流畅文本,但经常出现“引用幻觉”(Citation Hallucination),即模型凭空捏造文献引用。 这种现象严重影响了学术论文的可信度与专业性。 现在,加拿大滑铁卢大学与卡内基梅隆大学的华人研究团队,提出了一种名为 ScholarCopilot 的智能学术写作大模型框架,专门针对学术场景,致力于精准地生成带有准确引用的学术文本。
4/11/2025 9:12:21 AM
量子位

Kimi 16B胜GPT-4o!开源视觉推理模型:MoE架构,推理时仅激活2.8B

刚刚,Kimi团队上新了! 开源轻量级视觉语言模型Kimi-VL及其推理版Kimi-VL-Thinking,多模态和推理双双拿捏。 按照Kimi官方的说法,其关键亮点如下:都是基于MoE架构,总参数为16B,但推理时仅激活2.8B;具备强大的多模态推理能力(媲美参数大10倍的模型)和Agent能力;支持128K上下文窗口;采用相对较为宽松的MIT许可证。
4/11/2025 9:10:00 AM
量子位

十大步骤详解Spring AI MCP机制底层实现,小白误入!

MCP分为MCP Client和MCP Server:MCP Client负责进行工具发现和工具调用MCP Server负责提供工具和工具执行总体流程图图片十大步骤详解第一步,MCP Client接收用户的问题,比如“今天是几月几号”。 第二步,MCP Client发送tools/list请求给MCP Server进行工具发现。 利用Spring AI开发的MCP Server,可以利用@Tool注解定义工具,比如:图片并利用MethodToolCallbackProvider提供出去:在MCP Server的MpcServerAutoConfiguration自动配置类中定义了一个McpSyncServer的Bean,它会依赖注入ListToolCallbackProvider,这样McpSyncServer中就拿到了MCP Server中定义的所有Tools(调用ToolCallbackProvider的getToolCallbacks()即可拿到)。
4/11/2025 9:01:37 AM
IT周瑜

字节开源新生图模型:一个模型统一所有生图任务,多主体融合效果SOTA​

利用字节团队魔改的FLUX模型,可以直接把多个参考主体放进一张图了。 字节团队以FLUX为基础模型,提出了新的生图模型UNO,统一了图像生成任务中不同输入条件的处理。 无论是单主体进行风格变换,还是不同物体的融合,UNO都能直接搞定。
4/11/2025 9:00:00 AM
量子位

有了MCP,AI不仅更完整,还更实用了

互联网刚诞生时,普通人对它的印象只是能收发电子邮件。 智能手机刚出现时,很多人觉得不过是个能打电话的小电脑。 当AI大模型横空出世,大家惊叹于它超强的对话能力,却难以想象它能做什么实际工作。
4/11/2025 8:45:00 AM

OpenAI 悄悄更新 ChatGPT,Plus / Pro 订阅用户可享全局对话内容记忆功能

OpenAI 今天发文宣布悄悄为旗下 ChatGPT 进行更新,目前订阅了 Plus 和 Pro 级别用户可以使用“经过改进的上下文记忆功能”。
4/11/2025 6:42:19 AM
漾仔

2025年CIO的优先事项:掌握AI,确保未来

在BrightTALK CIO峰会上,七位IT和技术专家分享了实用策略和最佳实践,以供希望在这个动荡但又充满机遇的商业时代导航并了解2025年CIO首要任务的IT领导者参考。 证明AI投资的投资回报率:构建用例供应链随着AI应用的普及,确定能够提供切实商业价值的用例是2025年CIO的一项关键优先事项。 在这一领域取得成功需要一种战略方法,以识别和利用能够显著改善底线表现的AI举措。
4/11/2025 12:30:00 AM
Ana

商汤大装置发放“1亿代金券”,全栈赋能场景落地

2025年4月10日,商汤科技SenseTime举办2025技术交流日,发布商汤大装置SenseCore 2.0,以更灵活、敏捷、可靠的特性赋能企业,推动AI基础设施与应用开发及行业需求深度融合。 同时,商汤科技宣布将发放“1亿代金券”,专项支持行业伙伴协同并进,加速产业智能化升级,共创AI新高度。 该计划聚焦具身智能、AIGC等多个前沿领域,通过多维度的精准扶持,为企业提供从专家咨询到模型训练、推理验证的全流程AI服务支持,打造"高效率、低成本、端到端"的一站式赋能方案。
4/10/2025 5:39:00 PM
新闻助手

谷歌推出 Vertex AI Media Studio 文生视频套件:自动化包办画面渲染、旁白、配乐等

谷歌今天(4 月 10 日)推出 Vertex AI Media Studio 平台,该套件支持文本指令生成完整视频内容。
4/10/2025 1:25:15 PM
故渊

UC伯克利华人开源14B「o3-mini」,代码版R1突袭OpenAI王座!

OpenAI o1/o3-mini级的推理模型,竟被抢先开源了? 刚刚,来自UC伯克利和Together AI的联合团队,重磅推出了一款完全开源的代码推理模型——DeepCoder-14B-Preview。 现在,只需要14B就可以拥有一个媲美o3-mini的本地模型,并且完全免费!
4/10/2025 10:02:43 AM
新智元

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

还记得前段时间字节跳动备受关注的数字人技术Omnihuman-1吗? 最近,这支团队一项基于DiT架构的可控人像视频生成技术DreamActor-M1,一经发布,又在推特上引起了超百万量级的关注——仅需一张静态照片和一段驱动视频,便可生成高质量、达到电影级别的视频,将人像视频生成的表现力提升至全新水平! 左右滑动查看项目网页::,还能精准捕捉并迁移驱动视频中的动作和表情,呈现出高度逼真的效果,极大地简化了现有的动作捕捉、角色动画以及内容创作流程。
4/10/2025 9:54:40 AM
新智元

谷歌最新AI芯片打平英伟达B200,专为推理模型打造,最高配每秒42500000000000000000次浮点运算

谷歌首款AI推理特化版TPU芯片来了,专为深度思考模型打造。 代号Ironwood,也就是TPU v7,FP8峰值算力4614TFlops,性能是2017年第二代TPU的3600倍,与2023年的第五代TPU比也有10倍。 (为什么不对比第六代,咱也不知道,咱也不敢问。
4/10/2025 9:43:01 AM
量子位

“谷歌版MCP”来了!开源A2A,不同厂商Agent也能协作

刚刚,“谷歌版MCP”来了! 谷歌推出A2A协议,即Agent2Agent,能让AI Agent在不同生态系统间安全协作,而无需考虑框架或供应商。 不同平台构建的AI Agent之间可以进行通信、发现彼此的能力、协商任务并开展协作,企业可通过专业Agent团队处理复杂工作流。
4/10/2025 9:42:51 AM