AI在线 AI在线

资讯列表

视频版IC-Light来了!Light-A-Video提出渐进式光照融合,免训练一键视频重打光

本文作者来自于上海交通大学,中国科学技术大学以及上海人工智能实验室等。 其中第一作者周彧杰为上海交通大学二年级博士生,师从牛力副教授。 数字化时代,视频内容的创作与编辑需求日益增长。
2/20/2025 1:00:00 PM
机器之心

物理直觉不再是人类专属?LeCun等新研究揭示AI可如何涌现出此能力

在当今的 AI 领域,图灵奖得主 Yann LeCun 算是一个另类。 即便眼见着自回归 LLM 的能力越来越强大,能解决的任务也越来越多,他也依然坚持自己的看法:自回归 LLM 没有光明的未来。 在近期的一次演讲中,他将自己的观点总结成了「四个放弃」:放弃生成式模型、放弃概率模型、放弃对比方法、放弃强化学习。
2/20/2025 12:37:57 PM
机器之心

马斯克旗下 xAI 宣布 Grok 3 免费开放,直到服务器不堪重负为止

马斯克旗下人工智能公司 xAI 宣布,“世界最智能 AI”系统 Grok 3 现在免费向公众提供服务(直到服务器不堪重负为止)。xAI 在其官方 X 账号上发布了这一消息,马斯克也转发该推文称,“短时间内,Grok 3 对所有人免费开放!”
2/20/2025 12:27:57 PM
远洋

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数:以步骤为粒度对齐上下文学习与推理

仅需简单提示,满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。 上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度,大幅提升上下文学习性能,突破少样本学习上限。 图片大语言模型使用多步推理解决复杂数学问题,即先将复杂问题分解为多个步骤并逐步进行推理。
2/20/2025 12:09:22 PM

Meta 宣布建造全球最长海底电缆,助力人工智能基础设施

近日,Meta 公司正式宣布了名为 Project Waterworth的重大项目。 这项计划是一个历时数年的多亿美元投资,旨在建造一条超过50,000公里的海底电缆,以支持全球的人工智能基础设施。 这个海底电缆项目一旦完成,将成为全球最长的海底电缆,具有抵抗船锚和其他危险因素造成损坏的能力。
2/20/2025 12:00:41 PM
AI在线

硅基流动CEO否认曾拒绝DeepSeek入股:是对未合作表遗憾

近日,围绕硅基流动完成Pre-A轮融资的报道引发了一场关于公司早期发展历程的讨论。 创投日报此前报道称,2023年下半年DeepSeek创始人梁文锋曾提出入股硅基流动的意向,条件是开源其自研LLM推理引擎,但遭到了硅基流动CEO袁进辉的拒绝。 对此,袁进辉今日在朋友圈作出回应,否认了上述说法。
2/20/2025 12:00:31 PM
AI在线

腾讯ima安卓端App正式上线 云存储空间免费扩容至2G

腾讯旗下AI工作台ima.copilot(简称ima)今日宣布推出移动端应用程序(App),率先上线安卓端,iOS将于近期上线,同时将云存储空间免费扩容至2G,进一步拓展其多终端生态布局。 作为以知识库为核心的AI工作台产品,ima自2024年10月发布以来,已覆盖Windows、Mac及微信小程序平台,此次移动端上线标志着用户可随时随地享受“搜、读、写”一体化的智能体验,真正实现“让知识流动起来”。 ima移动端依然延续了简洁、清爽的设计风格,整合了电脑端和小程序的核心能力。
2/20/2025 11:53:00 AM
AI在线

谷歌发布AI科研助手:Gemini2.0驱动的虚拟科学家

谷歌日前正式宣布推出基于Gemini2.0的AI科研助手系统——AI co-scientist,旨在为科学家提供虚拟协作,从而生成新颖的研究假设和建议。 这套系统不仅具备常规的文献审查和总结功能,更突破性地加入了原创知识发掘能力。 AI co-scientist能够模拟科学方法的推理过程,根据已有证据和具体研究目标,为科研人员提供新颖的研究假设和建议方案。
2/20/2025 11:49:00 AM
AI在线

谷歌发布全新视觉语言模型 PaliGemma 2 Mix 集成多种功能助力开发者

近日,谷歌宣布推出一款全新的视觉 - 语言模型(Vision-Language Model, VLM),名为 PaliGemma2Mix。 这款模型融合了图像处理与自然语言处理的能力,能够同时理解视觉信息和文本输入,并根据需求生成相应的输出,标志着人工智能技术在多任务处理方面的进一步突破。 PaliGemma2Mix 的功能非常强大,它集成了图像描述、光学字符识别(OCR)、图像问答、目标检测和图像分割等多种视觉 - 语言任务,适用于多种应用场景。
2/20/2025 11:37:00 AM
AI在线

复旦主导,中美等8个国家25家单位44名学者联合发布大模型安全技术综述

近年来,随着大模型的快速发展和广泛应用,其安全问题引发了社会各界的广泛关注。 例如,近期发生的「全球首例利用 ChatGPT 策划的恐袭事件」再次敲响了警钟,凸显了大模型安全问题的紧迫性和重要性。 为应对这一挑战,来自中美英德等 8 个国家 25 家高校和科研机构的 44 位 AI 安全领域学者联合发布了一篇系统性技术综述论文。
2/20/2025 11:31:31 AM
机器之心

量子计算里程碑!微软单芯片可百万量子比特,Nature研究爆火

重大突破! 本周四,微软宣布造出了一款前所未有的量子计算芯片 Majorana 1,并称可以在单块芯片上让数百万量子比特协同工作,解决之前无法的解决的问题,从新药物研发到创造革命性的新材料。 微软 CEO 萨提亚・纳德拉为此专门撰写了一条长推文,短时间内就已经收获了上千万阅读量,其中提到 Majorana 1 是首款建立在拓扑核心(topological core)上的量子处理单元,而这一成就的基础是他们创造的「一种全新的物质状态」,而这又解锁了一类新材料。
2/20/2025 11:29:21 AM
机器之心

英国初创公司 Humanoid 发布通用型人形机器人 HMND 01

近日,英国人工智能和机器人初创公司 Humanoid 在一段新视频中揭晓了其通用型人形机器人 HMND01。 这款机器人采用双足设计,模拟人类的运动和动作,配备有头部、躯干、手臂和腿部,五指手部具备高速且精准的操作能力,能够完成复杂的任务。 这得益于其搭载的众多高扭矩和高速的执行器。
2/20/2025 11:28:00 AM
AI在线

OpenAI的GPT-5即将问世:目前我们所知道的一切

想象一下,一个能浏览互联网、理解世界、记忆事物,还能像人一样自然聊天并进行复杂推理的AI。 这听起来像科幻电影里的情节,但实际上,这样的技术已经离我们不远了。 随着ChatGPT的不断进化,其最新版本GPT-5即将横空出世,预示着AI正朝着通用智能的目标大步迈进。
2/20/2025 11:20:41 AM
Bernard Marr

新突破!中国电信复现DeepSeek R1,探索行业大模型建设新路径

DeepSeek是由深度求索开发的低成本、高性能开源大语言模型,该模型通过强化学习与混合专家结构(MOE)的技术创新,以工程优化突破硬件限制,实现了“算力需求下降但性能提升”的反共识路径。 开源策略重塑了AI生态,为全球开发者提供普惠工具,标志着从“算力堆砌”向“算法效率”的产业转型。 中国电信政企信息服务事业群DeepSeek攻坚团队紧跟技术潮流,基于行业数据复现R1模型,提出行业大模型优化的新思路。
2/20/2025 11:12:11 AM

微软推出世界首个拓扑导体芯片 称可在几年内引入量子计算

微软最近宣布了一项重大的技术突破,称其新开发的芯片可能会使量子计算机在几年内得以建造,而不是几十年。 该芯片的亮点在于其采用了全球首个拓扑导体(topoconductor),这一材料可以创造出一种新的物质状态,既不是固态、液态或气态。 这项创新使得设计出可放置于单个芯片中的量子系统成为可能,且该芯片的尺寸小于手掌。
2/20/2025 11:03:00 AM
AI在线

硅基流动袁进辉否认拒绝 DeepSeek 梁文锋投资,但承认自己没有远见感到后悔

大模型云服务商硅基流动于 2024 年底完成亿元人民币 Pre-A 轮融资。本月早些时候,硅基流动上线 DeepSeek R1 & V3 企业级服务,提供专属实例、算力纳管、私有版 MaaS、基于华为昇腾 910B 的一体机四种企业级服务模式供客户选择。
2/20/2025 10:57:42 AM
汪淼

“AI 编程”炙手可热:初创公司 Codeium 获新一轮融资,估值推至 28.5 亿美元

据外媒TechCrunch今日报道,AI驱动的编程初创公司Codeium正进行新一轮融资,估值达到28.5亿美元(IT之家备注:当前约 207.57 亿元人民币)。
2/20/2025 10:51:30 AM
清源

OpenAI最新基准测试:AI编程能力达人类四分之一,显现局限性

OpenAI近日发布了一项重要的AI编程能力评估报告,通过价值100万美元的实际开发项目揭示了AI在软件开发领域的现状。 这项名为SWE-Lancer的基准测试涵盖了1,400个来自Upwork的真实项目,全面评估AI在直接开发和项目管理两大领域的表现。 测试结果显示,表现最佳的AI模型Claude3.5Sonnet在编码任务中的成功率为26.2%,在项目管理决策方面达到44.9%。
2/20/2025 10:37:00 AM
AI在线