应用
摩尔线程开源 MT-MegatronLM 和 MT-TransformerEngine 两大 AI 框架
摩尔线程官方今日发文宣布,近日已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现高效的混合并行训练和推理,提升了训练效率与稳定性。
3/17/2025 6:28:02 PM
归泷(实习)
ChatGPT Android 测试版(1.2025.070)上线:可设置为手机默认数字助理,替代谷歌 Gemini
在通过长按 Home 按键、导航条或长按电源键唤醒数字助理后,屏幕上会出现 ChatGPT 的悬浮气泡。
3/17/2025 6:08:50 PM
潞源(实习)
浙江: 2025 年新增直播相关企业 1000 家、促进“人工智能+消费”
浙江省人民政府办公厅印发了关于大力提振和扩大消费专项行动实施方案的通知,实施提振消费专项行动,力争2025年社会消费品零售总额增长5%以上。 专项行动实施方案提出,积极发展直播电商、即时零售、社区团购、兴趣电商等新型消费业态,2025年新增直播相关企业1000家、培育“绿色直播间”300个。 焕新历史经典、中华老字号产品,促进“人工智能 消费”。
3/17/2025 5:59:00 PM
AI在线
想与顶级AI人才互动?来和机器之心一起共赴这4场全球学术顶会
时间的脚步来到 2025 年,人工智能领域依旧风起云涌。 从春节前火遍全球的 DeepSeek 开始,2025 年的中国 AI 力量展现出了以颠覆性技术创新引领全球浪潮的趋势。 DeepSeek 专注语言基座与多模态兼容,凭借开源普惠的路径和低成本高性能的突破,推动 AI 应用从「概念验证」迈向「规模化落地」。
3/17/2025 5:46:00 PM
机器之心
游戏新势力:Liminal Experiences 利用 AI 打造用户生成内容
随着 5.8 百万美元的资金注入,位于洛杉矶的游戏初创公司 Liminal Experiences Inc. 于周二正式亮相,致力于将用户生成内容引入视频游戏。 该公司由曾在 Riot Games 工作的布兰登・穆利根创立,旨在通过人工智能工具帮助用户构建自己的角色扮演类视频游戏,创建独特的角色、环境和故事情节。
3/17/2025 4:58:00 PM
AI在线
报道称阿里云全新 “T 项目” 启动,推进下一代 AI 技术研发
据《科创板日报》,阿里云启动了名为 “T 项目” 的新计划,旨在加速下一代 AI 技术的研发。 该项目将专注于多个前沿领域,包括 AI 引擎、大型语言模型(LLM)和多模态技术等,期望通过这些技术的突破,满足日益增长的市场需求。 “T 项目” 的启动意味着阿里云在 AI 领域布局的进一步加深。
3/17/2025 4:47:00 PM
AI在线
米哈游创始人新 AI 游戏《群星低语》内测开启,带你与 AI 女友共同求生
近日,米哈游创始人蔡浩宇所创办的神秘 AI 游戏公司 Anuttacon 推出了新作《群星低语》(Whispers From The Star),该游戏以科幻主题为背景,结合了先进的 AI 技术,给玩家带来了独特的互动体验。 与传统叙事游戏不同,《群星低语》通过实时对话,让玩家的选择直接影响游戏进程和角色命运。 在游戏中,玩家将扮演一名天体物理系的女生 Stella,她是外星星球 GAIA 上的唯一幸存者。
3/17/2025 4:43:00 PM
AI在线
FF成立Future AIHER子公司,全面布局AI混增电驱系统领域
法拉第未来(Faraday Future,简称FF)近日在洛杉矶总部成功举办了首届FF Open AI Day,重点展示了公司的AI战略、产品及技术规划。 会上,FF宣布正式成立全球首家AI混增电驱系统公司——Future AIHER Inc.,这家全资子公司将专注于超级AI混增系统和超级AI增程系统的设计与开发,为增程式电动车(EREV)提供全面动力解决方案。 超级AI混增(AIHER)技术被描述为AI驱动的"增程 混动"、"强增程,弱混动"的融合技术。
3/17/2025 4:40:00 PM
AI在线
钉钉推出 AI 客服助理,宣称 700 家企业已接入
钉钉官方今日宣布推出 AI 客服助理,其支持自动接入企业官网、公众号,直接服务消费者和企业客户。官方称这项能力一经推出后,云深处科技、Rokid(乐奇)、瑞德林、艾为电子、精准学等 700 多家企业已接入。
3/17/2025 4:28:45 PM
归泷(实习)
搜狗输入法PC版「AI助手」接入满血版「腾讯元宝」
腾讯搜狗输入法宣布其PC版「AI助手」正式接入满血版「腾讯元宝」大模型能力,为用户带来更便捷的AI体验。 此次升级无需额外下载AI软件,用户即可在键盘上直接体验腾讯混元和DeepSeek大模型的强大功能,支持「深度思考」和「联网搜索」,助力办公和学习效率大幅提升。 用户只需将PC版搜狗输入法升级至最新版本,点击状态栏的「汪仔」按钮或通过「Alt 空格」快捷键,即可召唤出AI助手。
3/17/2025 4:02:00 PM
AI在线
北大团队提出全新框架LIFT 将长上下文知识注入模型参数
北京大学张牧涵团队提出了一种全新的框架——Long Input Fine-Tuning (LIFT),通过将长输入文本训练进模型参数中,使任意短上下文窗口模型获得长文本处理能力。 这一方法颠覆了传统的长文本处理思路,不再专注于无限扩充上下文窗口,而是将长文本知识内化到模型参数中,类似于人类将工作记忆转化为长期记忆的过程。 目前大模型处理长文本面临两大主要挑战:传统注意力机制的平方复杂度导致处理长文本时计算和内存开销巨大 模型难以理解散落在长文本各处的长程依赖关系现有的解决方案如RAG和长上下文适配各有局限:RAG依赖准确的检索,容易引入噪声导致幻觉 长上下文适配的推理复杂度高,上下文窗口仍然有限LIFT的技术创新LIFT框架包含三个关键组件:动态高效的长输入训练通过分段的语言建模将长文本切分为有重叠的片段 避免因过长上下文造成的推理复杂度提升和长程依赖丢失 训练复杂度对长文本长度呈线性增长 平衡模型能力的门控记忆适配器设计专门的Gated Memory Adapter架构 动态平衡原始模型的In-Context Learning能力和对长输入的记忆理解 允许模型根据查询自动调节使用多少LIFT记忆的内容辅助任务训练通过预训练LLM基于长文本自动生成问答类辅助任务 补偿模型在切段训练中可能损失的能力 帮助模型学会应用长文本中的信息回答问题实验结果LIFT在多个长上下文基准测试上取得显著提升:LooGLE长依赖问答:Llama38B的正确率从15.44%提升至29.97% LooGLE短依赖问答:Gemma29B的正确率从37.37%提升至50.33% LongBench多项子任务:Llama3通过LIFT在5个子任务中的4个有明显提升消融实验表明,Gated Memory架构相比使用PiSSA微调的原模型,在LooGLE ShortQA数据集上的GPT-4score提升了5.48%。
3/17/2025 3:59:00 PM
AI在线
上海市出台 AI 行业鼓励政策,每年设立一定规模算力券、模型券、语料券供企业使用
上海市发布新政策,每年设立算力券、模型券、语料券,支持AI企业发展。此举旨在降低企业成本,促进产业集聚。 #上海AI政策# #人工智能#
3/17/2025 3:41:57 PM
漾仔
百川智能联合创始人焦可、陈炜鹏相继离职,投身AI创业热潮
近日,据界面报道,AI独角兽百川智能联合创始人焦可已正式离职,而另一位联合创始人陈炜鹏也将离开,目前仍在办理内部离职手续。 这一消息引发业内广泛关注。 据知情人士透露,焦可已开启AI语音领域的创业项目,并积极寻求融资支持。
3/17/2025 3:23:00 PM
AI在线
Anthropic或将发布Claude3.7Sonnet Max?Cursor更新引发猜测
近日,AI代码编辑器Cursor在其最新版本0.47.5的更新日志中透露,正在为Anthropic即将推出的“Claude3.7Sonnet Max”模型做准备。 这一消息迅速引发业内关注。 然而,目前Anthropic尚未发布任何官方公告,关于“Claude3.7Sonnet Max”的具体信息仍是个谜。
3/17/2025 3:14:00 PM
AI在线
Groundlight 开源框架,搞定复杂的视觉推理
一直专注于让AI看懂世界的 Groundlight 研究团队,近日放大招,宣布开源了一套全新的 AI 框架!这套框架旨在攻克视觉领域的一大难题——复杂的视觉推理,让AI不仅能“看图识物”,更能像福尔摩斯一样,从图像中推理出更深层次的信息。 我们都知道,现在的AI在识别猫猫狗狗方面已经炉火纯青,但要让它们理解图片背后的逻辑关系,进行更复杂的推理,就常常“卡壳”。 Groundlight 的研究人员指出,当前的视觉语言模型 (VLM) 在理解图像本身尚且不足的情况下,更难以完成需要深度解读的任务。
3/17/2025 3:00:00 PM
AI在线
消息称阿里云启动“T 项目”,加速下一代 AI 技术研发
《科创板日报》今日发布消息称,阿里云已启动了“T项目”,主要指面向下一代AI技术,做AI引擎、LLM(大语言模型)、多模态等未知领域探索,员工以类似项目“借调”的方式加入。
3/17/2025 2:59:43 PM
清源
联想问天WA7785a G3服务器创纪录!单机运行671B DeepSeek大模型吞吐量高达6708token/s!
联想今日宣布,旗下首款 AMD AI 大模型训练服务器——联想问天 WA7785a G3在单机部署671B(满血版) DeepSeek 大模型时,实现了高达6708token/s 的极限吞吐量,再次刷新了单台服务器运行超大规模模型性能的纪录。 据介绍,此次性能突破得益于联想万全异构智算平台的强大支持。 联想通过访存优化、显存优化、创新的 PCIe5.0全互联架构以及精选 SGLang 框架中的最优算子等一系列创新技术手段,对大模型从预训练、后训练到推理的全流程进行了持续优化。
3/17/2025 2:51:00 PM
AI在线
研究显示 60% 以上 AI 聊天机器人回答错误,新闻可信度遭受挑战
根据哥伦比亚新闻评论的数字新闻中心最新研究流行的 AI 搜索工具在回答问题时超过60% 的概率提供了不正确或误导性的信息。 这一结果令人担忧,因为这些工具不仅削弱了公众对新闻报道的信任,也使出版商面临流量和收入的双重损失。 图源备注:图片由AI生成,图片授权服务商Midjourney研究人员测试了包括 ChatGPT、Perplexity、Gemini 和 Grok 在内的八款生成式 AI 聊天机器人,要求它们识别来自200篇最新新闻文章的摘录。
3/17/2025 2:40:00 PM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉