资讯列表
突破 3D 重建的瓶颈,SuperDec 助力机器人与内容生成
近日,来自 ETH Zurich、斯坦福大学和微软的研究团队推出了一项名为 SuperDec 的新方法,旨在通过超四面体原理实现紧凑且富有表现力的3D 场景表示。 这一创新方法不仅能有效分解3D 场景中的各个对象,还可以应用于机器人技术和可控的视觉内容生成,为多种领域带来了新的可能性。 SuperDec 的工作原理SuperDec 的核心思想是利用超四面体这一几何原件,对3D 场景进行局部处理。
讯飞医疗科技:两年内有望盈利,医疗 AI 助力健康未来
科大讯飞旗下的讯飞医疗科技正式在香港联交所上市,成为国内医疗大模型领域的先锋企业。 在上市不到半年的时间里,讯飞医疗科技总裁陶晓东接受媒体采访时透露,基于市场需求和对未来的预判,公司预计将在未来1至2年内实现盈利。 根据公司最新的财报,讯飞医疗科技在2024年的营收达到了7.34亿元,同比增长32%,尽管依然亏损1.33亿元,但亏损额相比前一年有所减少。
Google 不慎泄露 Gemini CLI 开源即将推出文章,现已404
近日,Google 意外发布了一篇关于 Gemini CLI 的博客文章,但目前该页面已返回404错误。 这篇未正式公开的文章披露了 Gemini CLI 的多项关键功能,引发开发者社区热议。 文章内容显示,Gemini CLI 是一款面向 Gemini2.5Pro 的开源命令行界面(CLI)工具,支持高达100万代币的上下文窗口,适合处理复杂代码和大规模数据。
Abridge 融资 3 亿美元,市值跃升至 53 亿美元,领跑 AI 医疗记录市场
在最近的一轮融资中,Abridge,这家致力于自动化医疗记录的人工智能初创公司,成功获得了3亿美元的 E 轮融资,使其估值达到53亿美元。 这轮融资由著名投资机构 Andreessen Horowitz 领投,Khosla Ventures 也参与其中。 值得注意的是,这一融资紧接着公司在2月份完成的2.5亿美元融资,当时估值为27.5亿美元。
西门子 CTO 大夸 DeepSeek:预计三五年后西门子的所有产品都将融入 AI 元素
西门子(Siemens)管理委员会委员、首席技术官兼首席战略官 Peter Koerte 在昨日的 2025 天津夏季达沃斯论坛上指出,过去 50 年,市场致力于人工智能算法的研究,而目前,AI 已经可以运行工厂,控制无需人工的系统,“工业界面对庞大的数据量和个性化的需求,需要人和 AI 一起工作。”
提升对话质量,代码显示 Claude AI 即将引入记忆功能
AI初创公司Anthropic计划为Claude添加记忆功能,以挑战具有先进记忆功能的ChatGPT。这项功能将使Claude能够记住过去的事件并在新的对话中引用,以提升结果质量。
LLM的关键转折:LAM,究竟是什么?
作者 | Bill Doerrfeld 编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)操作 Windows 程序、自动对账发票、预订航班和酒店——这些只是新一代大型语言模型(LLMs)为 AI 智能体带来的众多可能性中的几个。 研究人员将这一阶段的进化称为“大型行动模型(Large Action Models)”,简称 LAMs。 迄今为止,LLM 是无状态的——它们无法自行采取行动、适应环境或与工具交互。
Clikka AI颠覆产品摄影!一张图秒变专业级大片,省钱又吸睛
一款名为Clikka AI的产品摄影AI工具在网络上引发热议。 这款工具以其低成本、高质量的图像生成能力,为在线销售、产品设计和企业营销提供了全新解决方案。 AIbase整理了最新网络信息,为您深度解析Clikka AI的创新功能及其对电商行业的潜在影响。
支付宝宣布为AI开发者提供国内首个“AI打赏”服务
今日,支付宝宣布为AI开发者提供国内首个“AI打赏”服务,并首发上线蚂蚁百宝箱平台、阿里云百炼,为开发者提供便捷收款能力,进一步推动AI技术的商业化应用。 据支付宝介绍,“AI打赏”服务旨在满足AI智能体内收取赞赏、小费等需求,为开发者提供一种轻量化的收款解决方案。 个人开发者只需登录蚂蚁百宝箱平台或阿里云百炼,按照简单两步操作——选择开通“AI打赏”功能并给智能体挂载该服务,即可快速启用打赏功能。
OpenAI突袭AI办公,微软谷歌恐遭大洗牌!密谋一年曝光,Office帝国危了
OpenAI未来想要做的,便是吞掉微软、谷歌的市场。 Information独家爆料称,OpenAI内部已筹划一年,计划在ChatGPT中植入「文档协作」与「即时通讯」功能。 图片OpenAI这一步棋,直接向「金主爸爸」微软发起正面挑战,同时也将开辟与谷歌竞争的新战线。
重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练
过去几年,随着基于人类偏好的强化学习(Reinforcement Learning from Human Feedback,RLHF)的兴起,强化学习(Reinforcement Learning,RL)已成为大语言模型(Large Language Model,LLM)后训练阶段的关键技术。 RL 不仅显著提升了模型的对齐能力,也拓展了其在推理增强、智能体交互等场景下的应用边界。 围绕这一核心范式,研究社区不断演化出多种优化策略和算法变体,如 Agentic RL、RLAIF、GRPO、REINFORCE 等。
Windows最新搭载微软自研模型Mu,一句话搞定所有系统配置
还在为复杂的Windows设置头疼? 微软来重新定义设置界面交互了。 全新发布的设备端小语言模型Mu,让Windows 11的设置也拥有了自己的AI Agent。
为什么MCP能爆火,但ChatGPT插件之流全都死了?神贴断言:MCP吞噬一切!网友:炒作太过,本质还是重复造轮子!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)MCP(Model Context Protocol)其实并不新,它早在去年就由 Anthropic 正式提出。 但短短几个月后,它的支持阵容迅速扩展,从 Cursor、Zed 等新兴工具,到谷歌、OpenAI 等顶级玩家,几乎整个 LLM 工具链都开始围绕 MCP 建设生态。 你有没有想过一个问题:为什么 MCP 之前的那些“前辈”都没活下来,它却突然火遍全场?
周鸿祎:AI 再强大也无法取代人类的三大能力
在近日发布的一段视频中,周鸿祎就人工智能(AI)的未来进行了深入探讨,表达了他对 AI 与人类关系的看法。 他指出,尽管许多人担心 AI 会取代自己的工作,但从目前的情况来看,AI 并不能完全取代人类。 周鸿祎强调,即使 AI 技术不断进步,它们仍然需要人类的管理与指导。
OpenAI搜索连接器重磅上线!解锁ChatGPT全新工作效率神器
OpenAI宣布推出全新搜索连接器(Search Connectors)功能,进一步扩展ChatGPT的生态能力。 这一功能允许用户将ChatGPT与多种外部应用程序无缝连接,显著提升工作效率和数据整合能力。 据最新网络信息,该功能现已开始向欧盟以外的Pro和Team用户逐步开放。
罗森在日本引入“次世代门店”:机器人能烹饪,AI 电子屏会推荐商品
据日本共同社报道,罗森23日在东京都开设了一家结合人工智能和机器人等先进技术的次世代门店。顾客只要拿起商品,电子看板便会自动推荐相关商品,店内还配备了负责烹饪和商品陈列的机器人。
4D-LRM震撼发布!AI重建时空,任意视角任意时刻一键还原
一款名为4D-LRM(Large Space-Time Reconstruction Model)的大型时空重建模型引发了科技界的广泛关注。 这款模型以其突破性的动态物体重建能力,实现了从任意视角、任意时间点生成高保真4D场景的壮举。 AIbase整理了最新网络信息,为您全面解析4D-LRM的创新技术及其潜在应用前景。
DeepMind“黑科技”炸场!Gemini Robotics On-Device让机器人秒变“全能选手”
Google DeepMind重磅推出新一代机器人AI模型——Gemini Robotics On-Device,引发行业热议。 这款模型以其完全本地化运行、强大的任务适应能力和低样本学习特性,展现了机器人AI技术的全新突破。 AIbase整理最新网络信息,为您深度解析这款模型的创新点及其对机器人产业的潜在影响。