资讯列表
老黄唱衰编程,GitHub CEO硬刚:放弃写代码等于放弃智能体未来话语权
                        在最新的媒体采访中,GitHub CEO托马斯·多姆克正面battle最近甚嚣尘上的“编程无用论”。 在他的构想中,2025年是属于编程智能体的一年,但未来仍然属于全体人类程序员。 网友们纷纷表示:终于!
                    
                    5/20/2025 1:57:42 PM
                        
                    黄仁勋最新访谈:中国 AI 人才“制霸”全球,人工智能开启1万亿→50万亿级别市场
                        最近,Nvidia的 CEO 黄仁勋,人称“黄教主”,在科技圈又发表了一系列引人注目的观点。  这次是在知名科技博主Ben Thompson的“Stratechery”访谈里,黄教主分享了他的诸多见解,从中美AI聊到自家公司的发展方向,信息量不小。 图片一、中国AI实力?
                    
                    5/20/2025 1:55:28 PM
                        
                    谷歌 DeepMind 新研究强化思维链训练,让 AI 语言模型不再“纸上谈兵”
                        科技媒体 marktechpost 昨日(5 月 19 日)发布博文,报道称谷歌 DeepMind 团队联合约翰・开普勒林茨大学 LIT AI 实验室,通过强化学习微调(RLFT)技术,提升语言模型的决策能力。
                    
                    5/20/2025 1:54:43 PM
                        故渊
                    英伟达发布 GR00T N1.5 人形机器人 AI 基础模型,黄仁勋称将推动“下一代工业革命”
                        在 2025 台北国际电脑展上,英伟达首席执行官黄仁勋宣布大幅扩展机器人开发基础设施,推出人形机器人基础模型 Isaac GR00T N1.5 新版,并称其将推动“下一代工业革命”。
                    
                    5/20/2025 1:51:31 PM
                        故渊
                    Build大会最硬核发布:微软把RAG技术塞进Windows,结构化检索让AI拥有"超忆症"
                        科技圈的目光无疑高度聚焦于微软的年度Build开发者大会。 正如许多人预期的那样,微软一开场就亮出了其核心主题——智能体(Agent)。 微软的意图很明确:将自身定位在“开放智能体网络”(Open Agentic Web)的中心。
                    
                    5/20/2025 1:45:19 PM
                        
                    多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满
                        检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。 针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型BGE-Code-v1,多模态向量模型BGE-VL-v1.5以及视觉化文档向量模型BGE-VL-Screenshot。 这些模型取得了代码及多模态检索的最佳效果,并以较大优势登顶CoIR、Code-RAG、MMEB、MVRB等领域内主要测试基准。
                    
                    5/20/2025 1:02:23 PM
                        新智元
                    腾讯混元游戏视觉生成平台发布,首个工业级 AIGC 游戏内容生产引擎
                        混元游戏现阶段已经上线的能力包括 AI 美术管线、实时画布、AI 2D 美术生成、专业角色多视图生成等核心能力,集中在游戏美术概念设计环节。
                    
                    5/20/2025 12:42:31 PM
                        问舟
                    谷歌 AI 编程智能体 Jules 全球公测,挑战 GitHub Copilot 和 OpenAI 的 Codex
                        谷歌 AI 编程智能体 Jules 迈入新开发阶段,在 2024 年 12 月私人预览后,最新开启全球公测,任意拥有 Google 账号的开发者现在都可以使用这款 AI 工具。
                    
                    5/20/2025 12:39:11 PM
                        故渊
                    Anthropic 研究揭示:AI 推理的思维链解释不可全信
                        Anthropic 公司发布最新研究报告,指出思维链(Chain-of-Thought,简称 CoT)提示方法虽被广泛用于提升大型语言模型(LLMs)的推理能力并解释其思维过程,但其可靠性存疑。
                    
                    5/20/2025 12:16:18 PM
                        故渊
                    边画边出图!腾讯混元上线游戏视觉生成平台
                        5月20日,腾讯正式发布混元游戏视觉生成平台,这是一款依托混元大模型打造的AI内容引擎,专为游戏工业级内容生产而生。 该平台的推出标志着游戏美术设计行业进入了一个全新的高效创作时代,有望将创作效率提升数十倍。 在过去,游戏美术设计师在创作角色图时,往往需要在多个软件之间来回跳转,从寻找参考图到起草图、制作三视图,再到渲染动态演示,整个流程分散且繁琐,文件需要反复导入导出。
                    
                    5/20/2025 12:00:55 PM
                        AI在线
                    全新音频问答模型 Omni-R1:利用文本驱动的强化学习和自动生成的数据推进音频问答
                        最近,一项来自 MIT CSAIL、哥廷根大学、IBM 研究所等机构的研究团队提出了一个名为 Omni-R1的全新音频问答模型。 该模型在 Qwen2.5-Omni 的基础上,通过一种名为 GRPO(Group Relative Policy Optimization)的强化学习方法进行优化,显示出在音频问答任务中的出色表现。 Omni-R1在著名的 MMAU 基准测试中创造了新的最先进成绩,涵盖了声音、语音和音乐等多个音频类别。
                    
                    5/20/2025 12:00:55 PM
                        AI在线
                    火山引擎推出开源 MCP Servers,助力大模型应用开发
                        近日,火山引擎宣布推出一款名为 MCP Servers 的大模型生态平台,并将其开源。 这一举措使得企业可以轻松将自研工具按照 MCP 协议进行封装并上传共享,形成一个良性的 “用生态” 与 “建生态” 的循环。 火山引擎MCP Servers 可被视为一个 “大模型工具超市”,集成了大量高质量的 MCP 协议适配工具,涵盖了搜索、数据库和业务系统 API 等多个高频场景。
                    
                    5/20/2025 12:00:55 PM
                        AI在线
                    马斯克与微软携手,Grok人工智能模型将登陆Azure平台
                        在近日召开的微软 Build 开发者大会上,埃隆・马斯克与微软的 CEO 萨蒂亚・纳德拉共同宣布,将马斯克的 xAI 公司推出的 Grok3和 Grok3迷你人工智能模型引入微软的 Azure AI Foundry 平台。 这一举动标志着微软与 xAI 之间的合作关系愈加紧密,尽管两者在过去曾因与 OpenAI 的关系而存在分歧。 Azure AI Foundry 是微软专为开发者打造的人工智能平台,旨在帮助他们构建、定制和管理 AI 应用程序。
                    
                    5/20/2025 12:00:55 PM
                        AI在线
                    KEEP颠覆视频人脸超分辨率!全新SOTA模型融合卡尔曼滤波,细节与时序一致性完美突破!
                        Hugging Face社区发布了一项突破性技术——KEEP(Kalman-inspired Feature Propagation),一款专为视频人脸超分辨率设计的新模型,被誉为该领域的全新SOTA(State-of-the-Art)。 通过创新的卡尔曼滤波灵感架构和跨帧注意力机制,KEEP在恢复人脸细节和保持时序一致性方面实现了显著突破,超越传统方法。 AIbase综合最新动态,深入解析KEEP的技术亮点及其对视频超分辨率领域的深远影响。
                    
                    5/20/2025 12:00:55 PM
                        AI在线
                    AI发现新物质,仅用200小时!不写一行代码,筛选36.7万种物质
                        一行代码都不用写,全靠AI,在200小时内发现一种全新物质! 如果使用传统方法,这个过程可能需要花费几个月甚至几年时间。 这个立大功的AI,就是微软刚刚在Build大会上推出的Microsoft Discovery。
                    
                    5/20/2025 11:56:08 AM
                        
                    一文读懂 Vision RAG 模型
                        众所周知,检索增强生成(RAG)技术已在大语言模型(LLM)应用中证明了其巨大价值,通过从外部知识库检索相关文本信息,显著提升了模型回复的准确性、时效性和可追溯性。 然而,我们所感知和理解的世界并非只由文本构成:大量的现实信息和复杂语境,深刻地蕴含在图像、图表、视频等视觉内容之中。 传统的 RAG 模型难以直接“看”懂并利用这些丰富的视觉信息。
                    
                    5/20/2025 11:55:22 AM
                        Luga Lee
                    Nvidia 推出 AI 驱动的 DGX 个人计算系统,开启桌面级超级计算新时代
                        近日,Nvidia 宣布与将推出 DGX Spark 和 DGX Station 个人 AI 超级计算系统。 这一系列新产品旨在为全球开发者、数据科学家和研究人员提供前所未有的性能和效率,满足他们在人工智能领域日益增长的需求。 在人工智能技术快速发展的背景下,企业、软件提供商、政府机构和研究机构需要具备强大性能的系统,以便在不牺牲数据规模、模型隐私或扩展速度的情况下,享受桌面级的 AI 服务器体验。
                    
                    5/20/2025 11:00:55 AM
                        AI在线
                    告别繁琐:MoneyPrinterTurbo 一键AI速成高清短视频
                        近日,GitHub 上一款名为 MoneyPrinterTurbo 的开源项目,引起了广泛关注。 这款创新工具利用强大的人工智能大模型,旨在极大地简化短视频制作流程,用户只需输入视频主题或关键词,即可全自动生成包含文案、素材、字幕和背景音乐的高清短视频。 功能亮点MoneyPrinterTurbo 的设计理念旨在简化视频制作流程。
                    
                    5/20/2025 11:00:55 AM
                        AI在线