应用
DeepSeek 开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s
DeepSeek 开源周首日正式开源其最新技术成果FlashMLA,这是一款专为英伟达Hopper架构GPU打造的高效多层注意力(Multi-Layer Attention)解码内核。 该技术特别针对变长序列场景进行优化,可显著提升大模型推理性能。 FlashMLA的核心技术特性包括对BF16精度的全面支持,以及采用块大小为64的页式键值缓存(Paged KV Cache)系统,实现更精确的内存管理。
2/24/2025 10:18:00 AM
AI在线
LiblibAI哩布哩布AI宣布再获数亿元融资 一年内连续完成四轮融资
2月24日,LiblibAI(哩布哩布AI)宣布在短短一年内连续完成四轮融资,创下国内AI应用赛道融资速度的新纪录。 继2024年7月披露的数亿元融资后,LiblibAI再次成功斩获数亿元资金。 最新两轮融资由渶策资本、顺为资本领投,明势创投等老股东超额跟投,巨人网络担任产业投资方,远识资本继续担任独家财务顾问。
2/24/2025 10:07:00 AM
AI在线
融资速度“开挂”!LiblibAI再获数亿投资,一年连融四轮 领跑 AI 应用赛道
国内 AI 应用赛道再添重磅融资事件! AI 内容创作平台 LiblibAI-哩布哩布AI 今日正式宣布, 在短短一年时间内 惊人地 连续完成四轮融资, 创下国内 AI 应用领域 前所未有的 融资速度纪录。 继2024年7月 披露的数亿元融资之后, LiblibAI 再次成功 斩获 数亿元巨额资金, 发展势头 持续 强劲, 引发业界 高度 关注。
2/24/2025 10:07:00 AM
AI在线
Meta AI 发布新型视频学习模型V-JEPA :视频理解新突破
近日,Meta AI 团队推出了视频联合嵌入预测架构(V-JEPA)模型,这一创新举措旨在推动机器智能的发展。 人类能够自然而然地处理来自视觉信号的信息,进而识别周围的物体和运动模式。 机器学习的一个重要目标是揭示促使人类进行无监督学习的基本原理。
2/24/2025 10:02:00 AM
AI在线
阿里巴巴宣布创纪录投资:未来三年3800亿加码云与AI硬件建设
今日,阿里巴巴集团CEO吴泳铭宣布,未来三年,阿里将投入超过3800亿元人民币,用于建设云和AI硬件基础设施,总额超过去十年的总和。 这一创纪录的投资规模,不仅是中国民营企业在云和AI硬件基础设施建设领域的最大手笔,更彰显了阿里巴巴在AI时代的技术野心与战略布局。 **此次巨额投资的宣布恰逢两个重要时点:一是国内AI产业迎来爆发式增长,AI技术在各行业中的应用迅速扩展;二是民营企业座谈会的召开,进一步为科技企业的发展注入信心与动力。
2/24/2025 10:00:42 AM
AI在线
DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA
DeepSeek今日启动“开源周”,首个开源的代码库为FlashMLA——针对 Hopper GPU 优化的高效 MLA 解码内核,支持可变长度序列。
2/24/2025 9:47:40 AM
清源
腾讯混元视频模型(Hunyuan Video)测试招募中,开源在望
近日,腾讯混元视频模型(Hunyuan Video)在 X 平台上正式公开招募测试伙伴,标志着这一前沿 AI 视频生成技术迈入关键测试阶段。 根据官方透露,测试结束后,该模型有很大概率会开源,为全球 AI 社区贡献其技术成果。 混元视频模型是腾讯在 AI 视频生成领域的重要创新,拥有超过13B 的参数量,是目前开源模型中规模最大的视频生成模型之一。
2/24/2025 9:47:00 AM
AI在线
黄仁勋怒怼市场 “你们都搞错了!”:DeepSeek R1 不是来砸场子, 反而是 Nvidia 的 “神助攻”
“你们都搞错了!” 近日, 英伟达掌门人 罕见 “ 动怒 ” , 公开回应了市场对中国 AI 创企 DeepSeek 发布 R1模型的 “ 过度 ” 反应。 在黄仁勋看来, DeepSeek R1的 横空出世非但不是 对 Nvidia 的 “ 饭碗 ” 构成 威胁, 反而是加速AI发展的重大利好, 对英伟达而言 更是 “ 神助攻 ” 一般的存在。 事情起因于今年1月 DeepSeek 发布 R1模型 后, 市场普遍认为 R1的高效性意味着未来AI发展将不再需要如此庞大的算力资源, 这直接导致Nvidia股价单日暴跌16.9%, 市值瞬间蒸发数百亿美元。
2/24/2025 9:47:00 AM
AI在线
斯坦福新AI框架 OctoTools:无需训练,让AI实现高效复杂推理!
在人工智能(AI)领域,尽管大型语言模型(LLMs)在处理自然语言方面表现出色,但它们在面对复杂推理任务时常常显得力不从心。 这些任务通常需要多步骤的推理、领域特定的知识,或者外部工具的有效集成。 为了克服这些限制,研究人员们一直在探索如何通过外部工具的使用来提升 LLM 的能力。
2/24/2025 9:39:00 AM
AI在线
DeepSeek-R1 登顶 Hugging Face:以10000 赞力压 150 万个模型
今日凌晨,全球最大开源平台之一 Hugging Face 的首席执行官 Clement Delangue 在社交平台发文宣布,DeepSeek-R1在 Hugging Face 上获得了超过10000个赞,成为该平台近150万个模型中最受欢迎的大模型。 这一里程碑式的成就标志着 DeepSeek-R1在全球 AI 社区中的广泛认可与影响力。 DeepSeek-R1的崛起速度令人瞩目。
2/24/2025 9:30:00 AM
AI在线
美国人工智能安全研究所面临大规模裁员危机
据多家媒体报道,美国国家标准与技术研究所(NIST)计划裁减多达500名员工,这一决定进一步威胁到刚刚起步的美国人工智能安全研究所(AISI)。 Axios 的报道称,AISI 和 “美国芯片计划” 将面临针对试用期员工的 “重大” 裁员,这些员工通常是在职一至两年的新员工。 Bloomberg 则表示,部分员工已经收到了即将被解雇的口头通知。
2/24/2025 9:27:00 AM
AI在线
OpenAI 最新研究:当前 AI 模型仍无法媲美人类程序员
尽管 OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)坚称,到今年年底,人工智能模型将能够超越“低级别”软件工程师,但该公司研究人员的最新研究却表明,即使是目前最先进的 AI 模型,仍无法与人类程序员相媲美。
2/24/2025 9:25:21 AM
远洋
月之暗面联手UCLA推新模型Mixture-of-Expert,提升语言模型训练效率
在人工智能领域,训练大型语言模型(LLMs)已成为推动技术进步的重要方向。 然而,随着模型规模和数据集的不断扩大,传统的优化方法 —— 特别是 AdamW—— 逐渐显露出其局限性。 研究人员面临着计算成本高、训练不稳定等一系列挑战,包括梯度消失或爆炸、参数矩阵更新不一致及分布式环境下的资源需求高等问题。
2/24/2025 9:25:00 AM
AI在线
五角大楼高官透露:将投资于 “自主杀手机器人”
在一次令人震惊的声明中,一位高级国防官员向《Defense One》透露,五角大楼对自主杀手机器人的兴趣正在加速增长。 该官员在匿名的情况下表示,五角大楼正计划减少对人工智能研究的资金投入,转而投资于实际的 AI 武器系统。 他指出:“我们不会再投资于‘人工智能’,因为我不知道那意味着什么。
2/24/2025 9:17:00 AM
AI在线
小米将推出首款AI PC产品
小米集团合伙人兼总裁卢伟冰在近日一场小米15Ultra爆料直播中透露,小米将推出首款 AI PC 产品引发了科技界的广泛关注。 据称,新款 AI PC 的一大亮点在于其搭载的99Wh 超大电池,这一设计不仅满足了民航运输的安全标准,成为市场上为数不多的可登机产品,还将大幅提升用户在移动办公时的续航能力。 卢伟冰表示,随着移动办公的普及,用户对电池续航的需求越来越高。
2/24/2025 9:13:00 AM
AI在线
OpenAI 最新研究揭示:最先进的 AI 仍难以解决编码问题
近日,OpenAI 的研究人员在一篇新发布的论文中坦言,尽管目前的 AI 技术已经相当先进,但这些模型依然无法与人类程序员相媲美。 OpenAI 首席执行官山姆・阿尔特曼曾表示,预计到今年底,AI 将能够战胜 “低级” 软件工程师,但研究结果却显示,这些 AI 模型仍然面临重大挑战。 图源备注:图片由AI生成,图片授权服务商Midjourney在研究中,OpenAI 团队使用了一种名为 SWE-Lancer 的新基准测试,评估了从自由职业网站 Upwork 上提取的1400多项软件工程任务的表现。
2/24/2025 9:09:00 AM
AI在线
谷歌AI视频生成模型Veo 2使用成本曝光:一分钟视频要30美元
谷歌近日悄然公布了其视频生成 AI 模型 Veo2的定价信息,Veo2最早是在去年12月被披露的,这一新模型吸引了不少关注。 根据谷歌的定价页面,使用 Veo2的费用为每秒50美分,这样算下来,每分钟的视频费用为30美元,每小时的视频费用则高达1800美元。 谷歌 DeepMind 的研究员乔恩・巴伦(Jon Barron)对这一定价进行了有趣的比较,他提到了备受瞩目的漫威电影《复仇者联盟:终局之战》的制作预算,该预算高达3.56亿美元,折合每秒约32,000美元。
2/24/2025 9:04:00 AM
AI在线
超 20 家央企接入 DeepSeek,涉及能源、通信、汽车等领域
据经济参考报报道,近来,国资央企“牵手”DeepSeek 已成为一股新风潮。据不完全统计,目前有超 20 家央企接入 DeepSeek,涉及能源、通信、汽车、金融、建筑等多个领域。
2/24/2025 8:56:11 AM
远洋
资讯热榜
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
奥特曼:我承认GPT-5发布搞砸了
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
7年了,OpenAI官方给出五代GPT对比,网友却怀念起「狂野」初代
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
AI新词
LLM
蛋白质
腾讯
开发者
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
特斯拉