AI在线 AI在线

应用

刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中

上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。 第一个项目,果然与推理加速有关。 北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。
2/24/2025 10:28:00 AM
机器之心

Grok 3语音功能正式上线:支持10种模式,甚至包括18禁选项

埃隆·马斯克旗下xAI公司宣布,其人工智能聊天机器人Grok3的语音功能已正式上线。 这一备受期待的功能现已通过Grok应用程序向用户开放,目前支持英语交互。 根据X平台上的最新消息,用户只需更新Grok应用,即可在界面右上角“新对话”按钮旁发现新增的语音标志,点击即可体验这一全新功能。
2/24/2025 10:25:00 AM
AI在线

DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。 该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。 FlashMLA的核心技术特性包括对BF16精度的全面支持,以及采用块大小为64的页式键值缓存(Paged KV Cache)系统,实现更精确的内存管理。
2/24/2025 10:18:00 AM
AI在线

LiblibAI哩布哩布AI宣布再获数亿元融资 一年内连续完成四轮融资

2月24日,LiblibAI(哩布哩布AI)宣布在短短一年内连续完成四轮融资,创下国内AI应用赛道融资速度的新纪录。 继2024年7月披露的数亿元融资后,LiblibAI再次成功斩获数亿元资金。 最新两轮融资由渶策资本、顺为资本领投,明势创投等老股东超额跟投,巨人网络担任产业投资方,远识资本继续担任独家财务顾问。
2/24/2025 10:07:00 AM
AI在线

融资速度“开挂”!LiblibAI再获数亿投资,一年连融四轮 领跑 AI 应用赛道

国内 AI 应用赛道再添重磅融资事件! AI 内容创作平台 LiblibAI-哩布哩布AI 今日正式宣布, 在短短一年时间内 惊人地 连续完成四轮融资, 创下国内 AI 应用领域 前所未有的 融资速度纪录。 继2024年7月 披露的数亿元融资之后, LiblibAI 再次成功 斩获 数亿元巨额资金, 发展势头 持续 强劲, 引发业界 高度 关注。
2/24/2025 10:07:00 AM
AI在线

Meta AI 发布新型视频学习模型V-JEPA :视频理解新突破

近日,Meta AI 团队推出了视频联合嵌入预测架构(V-JEPA)模型,这一创新举措旨在推动机器智能的发展。 人类能够自然而然地处理来自视觉信号的信息,进而识别周围的物体和运动模式。 机器学习的一个重要目标是揭示促使人类进行无监督学习的基本原理。
2/24/2025 10:02:00 AM
AI在线

阿里巴巴宣布创纪录投资:未来三年3800亿加码云与AI硬件建设

今日,阿里巴巴集团CEO吴泳铭宣布,未来三年,阿里将投入超过3800亿元人民币,用于建设云和AI硬件基础设施,总额超过去十年的总和。 这一创纪录的投资规模,不仅是中国民营企业在云和AI硬件基础设施建设领域的最大手笔,更彰显了阿里巴巴在AI时代的技术野心与战略布局。 **此次巨额投资的宣布恰逢两个重要时点:一是国内AI产业迎来爆发式增长,AI技术在各行业中的应用迅速扩展;二是民营企业座谈会的召开,进一步为科技企业的发展注入信心与动力。
2/24/2025 10:00:42 AM
AI在线

DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA

DeepSeek今日启动“开源周”,首个开源的代码库为FlashMLA——针对 Hopper GPU 优化的高效 MLA 解码内核,支持可变长度序列。
2/24/2025 9:47:40 AM
清源

腾讯混元视频模型(Hunyuan Video)测试招募中,开源在望

近日,腾讯混元视频模型(Hunyuan Video)在 X 平台上正式公开招募测试伙伴,标志着这一前沿 AI 视频生成技术迈入关键测试阶段。 根据官方透露,测试结束后,该模型有很大概率会开源,为全球 AI 社区贡献其技术成果。 混元视频模型是腾讯在 AI 视频生成领域的重要创新,拥有超过13B 的参数量,是目前开源模型中规模最大的视频生成模型之一。
2/24/2025 9:47:00 AM
AI在线

黄仁勋怒怼市场 “你们都搞错了!”:DeepSeek R1 不是来砸场子, 反而是 Nvidia 的 “神助攻”

“你们都搞错了!” 近日, 英伟达掌门人 罕见 “ 动怒 ” , 公开回应了市场对中国 AI 创企 DeepSeek 发布 R1模型的 “ 过度 ” 反应。 在黄仁勋看来, DeepSeek R1的 横空出世非但不是 对 Nvidia 的 “ 饭碗 ” 构成 威胁, 反而是加速AI发展的重大利好, 对英伟达而言 更是 “ 神助攻 ” 一般的存在。 事情起因于今年1月 DeepSeek 发布 R1模型 后, 市场普遍认为 R1的高效性意味着未来AI发展将不再需要如此庞大的算力资源, 这直接导致Nvidia股价单日暴跌16.9%, 市值瞬间蒸发数百亿美元。
2/24/2025 9:47:00 AM
AI在线

斯坦福新AI框架 OctoTools:无需训练,让AI实现高效复杂推理!

在人工智能(AI)领域,尽管大型语言模型(LLMs)在处理自然语言方面表现出色,但它们在面对复杂推理任务时常常显得力不从心。 这些任务通常需要多步骤的推理、领域特定的知识,或者外部工具的有效集成。 为了克服这些限制,研究人员们一直在探索如何通过外部工具的使用来提升 LLM 的能力。
2/24/2025 9:39:00 AM
AI在线

DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型

今日凌晨,全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布,DeepSeek-R1在 Hugging Face 上获得了超过10000个赞,成为该平台近150万个模型中最受欢迎的大模型。 这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。
2/24/2025 9:30:00 AM
AI在线

美国人工智能安全研究所面临大规模裁员危机

据多家媒体报道,美国国家标准与技术研究所(NIST)计划裁减多达500名员工,这一决定进一步威胁到刚刚起步的美国人工智能安全研究所(AISI)。 Axios 的报道称,AISI 和 “美国芯片计划” 将面临针对试用期员工的 “重大” 裁员,这些员工通常是在职一至两年的新员工。 Bloomberg 则表示,部分员工已经收到了即将被解雇的口头通知。
2/24/2025 9:27:00 AM
AI在线

OpenAI 最新研究:当前 AI 模型仍无法媲美人类程序员

尽管 OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)坚称,到今年年底,人工智能模型将能够超越“低级别”软件工程师,但该公司研究人员的最新研究却表明,即使是目前最先进的 AI 模型,仍无法与人类程序员相媲美。
2/24/2025 9:25:21 AM
远洋

月之暗面联手UCLA推新模型Mixture-of-Expert,提升语言模型训练效率

在人工智能领域,训练大型语言模型(LLMs)已成为推动技术进步的重要方向。 然而,随着模型规模和数据集的不断扩大,传统的优化方法 —— 特别是 AdamW—— 逐渐显露出其局限性。 研究人员面临着计算成本高、训练不稳定等一系列挑战,包括梯度消失或爆炸、参数矩阵更新不一致及分布式环境下的资源需求高等问题。
2/24/2025 9:25:00 AM
AI在线

​五角大楼高官透露:将投资于 “自主杀手机器人”

在一次令人震惊的声明中,一位高级国防官员向《Defense One》透露,五角大楼对自主杀手机器人的兴趣正在加速增长。 该官员在匿名的情况下表示,五角大楼正计划减少对人工智能研究的资金投入,转而投资于实际的 AI 武器系统。 他指出:“我们不会再投资于‘人工智能’,因为我不知道那意味着什么。
2/24/2025 9:17:00 AM
AI在线

小米将推出首款AI PC产品

小米集团合伙人兼总裁卢伟冰在近日一场小米15Ultra爆料直播中透露,小米将推出首款 AI PC 产品引发了科技界的广泛关注。 据称,新款 AI PC 的一大亮点在于其搭载的99Wh 超大电池,这一设计不仅满足了民航运输的安全标准,成为市场上为数不多的可登机产品,还将大幅提升用户在移动办公时的续航能力。 卢伟冰表示,随着移动办公的普及,用户对电池续航的需求越来越高。
2/24/2025 9:13:00 AM
AI在线

​OpenAI 最新研究揭示:最先进的 AI 仍难以解决编码问题

近日,OpenAI 的研究人员在一篇新发布的论文中坦言,尽管目前的 AI 技术已经相当先进,但这些模型依然无法与人类程序员相媲美。 OpenAI 首席执行官山姆・阿尔特曼曾表示,预计到今年底,AI 将能够战胜 “低级” 软件工程师,但研究结果却显示,这些 AI 模型仍然面临重大挑战。 图源备注:图片由AI生成,图片授权服务商Midjourney在研究中,OpenAI 团队使用了一种名为 SWE-Lancer 的新基准测试,评估了从自由职业网站 Upwork 上提取的1400多项软件工程任务的表现。
2/24/2025 9:09:00 AM
AI在线