AI在线 AI在线

资讯列表

想与顶级AI人才互动?来和机器之心一起共赴这4场全球学术顶会

时间的脚步来到 2025 年,人工智能领域依旧风起云涌。 从春节前火遍全球的 DeepSeek 开始,2025 年的中国 AI 力量展现出了以颠覆性技术创新引领全球浪潮的趋势。 DeepSeek 专注语言基座与多模态兼容,凭借开源普惠的路径和低成本高性能的突破,推动 AI 应用从「概念验证」迈向「规模化落地」。
3/17/2025 5:46:00 PM
机器之心

ICLR 2025 | 四川大学提出Test-time Adaptation新范式,突破查询偏移挑战

在 NeurIPS 2024 大会上,OpenAI 联合创始人兼前首席科学家 Ilya Sutskever 在其主题报告中展望了基础模型的未来研究方向,其中包括了 Inference Time Compute [1],即增强模型在推理阶段的能力,这也是 OpenAI o1 和 o3 等核心项目的关键技术路径。 作为 Inference Time Compute 的重要方向之一,Test-time Adaptation(TTA)旨在使预训练模型动态适应推理阶段中不同分布类型的数据,能够有效提高神经网络模型的分布外泛化能力。 然而,当前 TTA 的应用场景仍存在较大局限性,主要集中在单模态任务中,如识别、分割等领域。
3/17/2025 5:43:00 PM
机器之心

游戏新势力:Liminal Experiences 利用 AI 打造用户生成内容

随着 5.8 百万美元的资金注入,位于洛杉矶的游戏初创公司 Liminal Experiences Inc. 于周二正式亮相,致力于将用户生成内容引入视频游戏。 该公司由曾在 Riot Games 工作的布兰登・穆利根创立,旨在通过人工智能工具帮助用户构建自己的角色扮演类视频游戏,创建独特的角色、环境和故事情节。
3/17/2025 4:58:00 PM
AI在线

报道称阿里云全新 “T 项目” 启动,推进下一代 AI 技术研发

据《科创板日报》,阿里云启动了名为 “T 项目” 的新计划,旨在加速下一代 AI 技术的研发。 该项目将专注于多个前沿领域,包括 AI 引擎、大型语言模型(LLM)和多模态技术等,期望通过这些技术的突破,满足日益增长的市场需求。 “T 项目” 的启动意味着阿里云在 AI 领域布局的进一步加深。
3/17/2025 4:47:00 PM
AI在线

​米哈游创始人新 AI 游戏《群星低语》内测开启,带你与 AI 女友共同求生

近日,米哈游创始人蔡浩宇所创办的神秘 AI 游戏公司 Anuttacon 推出了新作《群星低语》(Whispers From The Star),该游戏以科幻主题为背景,结合了先进的 AI 技术,给玩家带来了独特的互动体验。 与传统叙事游戏不同,《群星低语》通过实时对话,让玩家的选择直接影响游戏进程和角色命运。 在游戏中,玩家将扮演一名天体物理系的女生 Stella,她是外星星球 GAIA 上的唯一幸存者。
3/17/2025 4:43:00 PM
AI在线

FF成立Future AIHER子公司,全面布局AI混增电驱系统领域

法拉第未来(Faraday Future,简称FF)近日在洛杉矶总部成功举办了首届FF Open AI Day,重点展示了公司的AI战略、产品及技术规划。 会上,FF宣布正式成立全球首家AI混增电驱系统公司——Future AIHER Inc.,这家全资子公司将专注于超级AI混增系统和超级AI增程系统的设计与开发,为增程式电动车(EREV)提供全面动力解决方案。 超级AI混增(AIHER)技术被描述为AI驱动的"增程 混动"、"强增程,弱混动"的融合技术。
3/17/2025 4:40:00 PM
AI在线

钉钉推出 AI 客服助理,宣称 700 家企业已接入

钉钉官方今日宣布推出 AI 客服助理,其支持自动接入企业官网、公众号,直接服务消费者和企业客户。官方称这项能力一经推出后,云深处科技、Rokid(乐奇)、瑞德林、艾为电子、精准学等 700 多家企业已接入。
3/17/2025 4:28:45 PM
归泷(实习)

搜狗输入法PC版「AI助手」接入满血版「腾讯元宝」

腾讯搜狗输入法宣布其PC版「AI助手」正式接入满血版「腾讯元宝」大模型能力,为用户带来更便捷的AI体验。 此次升级无需额外下载AI软件,用户即可在键盘上直接体验腾讯混元和DeepSeek大模型的强大功能,支持「深度思考」和「联网搜索」,助力办公和学习效率大幅提升。 用户只需将PC版搜狗输入法升级至最新版本,点击状态栏的「汪仔」按钮或通过「Alt 空格」快捷键,即可召唤出AI助手。
3/17/2025 4:02:00 PM
AI在线

突发!百川智能两位联合创始人出走,一位正在走离职手续

出品 | 51CTO技术栈(微信号:blog51cto)刚刚收到消息,大模型六小虎之一的百川智能高层出现了很大的变动——两位联合创始人被媒体曝出了离职创业的消息。 其中,联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。 另据知情人士称,焦可和陈炜鹏两人都已经分别开始AI领域的创业。
3/17/2025 3:59:19 PM

北大团队提出全新框架LIFT 将长上下文知识注入模型参数

北京大学张牧涵团队提出了一种全新的框架——Long Input Fine-Tuning (LIFT),通过将长输入文本训练进模型参数中,使任意短上下文窗口模型获得长文本处理能力。 这一方法颠覆了传统的长文本处理思路,不再专注于无限扩充上下文窗口,而是将长文本知识内化到模型参数中,类似于人类将工作记忆转化为长期记忆的过程。 目前大模型处理长文本面临两大主要挑战:传统注意力机制的平方复杂度导致处理长文本时计算和内存开销巨大 模型难以理解散落在长文本各处的长程依赖关系现有的解决方案如RAG和长上下文适配各有局限:RAG依赖准确的检索,容易引入噪声导致幻觉 长上下文适配的推理复杂度高,上下文窗口仍然有限LIFT的技术创新LIFT框架包含三个关键组件:动态高效的长输入训练通过分段的语言建模将长文本切分为有重叠的片段 避免因过长上下文造成的推理复杂度提升和长程依赖丢失 训练复杂度对长文本长度呈线性增长 平衡模型能力的门控记忆适配器设计专门的Gated Memory Adapter架构 动态平衡原始模型的In-Context Learning能力和对长输入的记忆理解 允许模型根据查询自动调节使用多少LIFT记忆的内容辅助任务训练通过预训练LLM基于长文本自动生成问答类辅助任务 补偿模型在切段训练中可能损失的能力 帮助模型学会应用长文本中的信息回答问题实验结果LIFT在多个长上下文基准测试上取得显著提升:LooGLE长依赖问答:Llama38B的正确率从15.44%提升至29.97% LooGLE短依赖问答:Gemma29B的正确率从37.37%提升至50.33% LongBench多项子任务:Llama3通过LIFT在5个子任务中的4个有明显提升消融实验表明,Gated Memory架构相比使用PiSSA微调的原模型,在LooGLE ShortQA数据集上的GPT-4score提升了5.48%。
3/17/2025 3:59:00 PM
AI在线

上海市出台 AI 行业鼓励政策,每年设立一定规模算力券、模型券、语料券供企业使用

上海市发布新政策,每年设立算力券、模型券、语料券,支持AI企业发展。此举旨在降低企业成本,促进产业集聚。 #上海AI政策# #人工智能#
3/17/2025 3:41:57 PM
漾仔

百川智能联合创始人焦可、陈炜鹏相继离职,投身AI创业热潮

近日,据界面报道,AI独角兽百川智能联合创始人焦可已正式离职,而另一位联合创始人陈炜鹏也将离开,目前仍在办理内部离职手续。 这一消息引发业内广泛关注。 据知情人士透露,焦可已开启AI语音领域的创业项目,并积极寻求融资支持。
3/17/2025 3:23:00 PM
AI在线

Anthropic或将发布Claude3.7Sonnet Max?Cursor更新引发猜测

近日,AI代码编辑器Cursor在其最新版本0.47.5的更新日志中透露,正在为Anthropic即将推出的“Claude3.7Sonnet Max”模型做准备。 这一消息迅速引发业内关注。 然而,目前Anthropic尚未发布任何官方公告,关于“Claude3.7Sonnet Max”的具体信息仍是个谜。
3/17/2025 3:14:00 PM
AI在线

无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025

编辑丨ScienceAI在药物研发和材料科学领域,设计具有特定性质的分子是一项关键但耗时的任务。 传统方法依赖大量实验试错,而生成式 AI 模型的出现为这一领域带来曙光。 然而,现有方法面临两大瓶颈:一是多数生成模型仅能处理连续型数据(如图像像素),难以应对分子设计中离散的原子类型与连续坐标共存的多模态数据;二是针对特定性质的定向生成通常需要额外训练模型,成本高昂。
3/17/2025 3:08:00 PM
ScienceAI

Groundlight 开源框架,搞定复杂的视觉推理

一直专注于让AI看懂世界的 Groundlight 研究团队,近日放大招,宣布开源了一套全新的 AI 框架!这套框架旨在攻克视觉领域的一大难题——复杂的视觉推理,让AI不仅能“看图识物”,更能像福尔摩斯一样,从图像中推理出更深层次的信息。  我们都知道,现在的AI在识别猫猫狗狗方面已经炉火纯青,但要让它们理解图片背后的逻辑关系,进行更复杂的推理,就常常“卡壳”。 Groundlight 的研究人员指出,当前的视觉语言模型 (VLM) 在理解图像本身尚且不足的情况下,更难以完成需要深度解读的任务。
3/17/2025 3:00:00 PM
AI在线

消息称阿里云启动“T 项目”,加速下一代 AI 技术研发

《科创板日报》今日发布消息称,阿里云已启动了“T项目”,主要指面向下一代AI技术,做AI引擎、LLM(大语言模型)、多模态等未知领域探索,员工以类似项目“借调”的方式加入。
3/17/2025 2:59:43 PM
清源

联想问天WA7785a G3服务器创纪录!单机运行671B DeepSeek大模型吞吐量高达6708token/s!

联想今日宣布,旗下首款 AMD AI 大模型训练服务器——联想问天 WA7785a G3在单机部署671B(满血版) DeepSeek 大模型时,实现了高达6708token/s 的极限吞吐量,再次刷新了单台服务器运行超大规模模型性能的纪录。 据介绍,此次性能突破得益于联想万全异构智算平台的强大支持。 联想通过访存优化、显存优化、创新的 PCIe5.0全互联架构以及精选 SGLang 框架中的最优算子等一系列创新技术手段,对大模型从预训练、后训练到推理的全流程进行了持续优化。
3/17/2025 2:51:00 PM
AI在线

北大团队提出LIFT:将长上下文知识注入模型参数,提升大模型长文本能力

机构: 北京大学人工智能研究院 北京通用人工智能研究院作者: 毛彦升 徐宇飞 李佳琪 孟繁续 杨昊桐 郑子隆 王希元 张牧涵长文本任务是当下大模型研究的重点之一。 在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。 扩充模型的长文本能力不仅意味着可以在上下文窗口中装入更长的文本,更是能够更好地建模文本段落间信息的长程依赖关系,增强对长文的阅读理解和推理。
3/17/2025 2:42:00 PM
机器之心