AI在线 AI在线

理论

DeepSeek 开源周首日:开源 FlashMLA,AI 推理速度再进化!

DeepSeek 开源周day1 推出 FlashMLA! 专为Hopper 架构 GPU打造的 超高效 MLA (Multi-Layer Attention) 解码内核,现在已经正式开源啦! 👏什么是 FlashMLA?
2/24/2025 10:07:04 AM
AI寒武纪

每分钟30美元!谷歌AI视频生成模型Veo 2定价公布

谷歌近期在其定价页面上低调公布了新一代 AI 视频生成模型 Veo 2 的使用费用。 根据官方信息,使用 Veo 2 的成本为每秒 50 美分,换算下来,每分钟的费用为 30 美元,每小时则高达 1800 美元。  Veo 2模型于 2024 年 12 月首次亮相,旨在通过人工智能技术快速生成高质量的视频内容。
2/24/2025 10:03:21 AM

国外权威认证!DeepSeek超150万模型,成最受欢迎开源大模型

今天凌晨3点,全球最大开源平台之一huggingface联合创始人兼首席执行官Clement Delangue发布了最新数据:中国开源大模型DeepSeek-R1在150万模型中,成为该平台最受欢迎的开源大模型,点赞超过1万。 前不久,Clement还特意发文恭喜DeepSeek-R1的下载量超过1000万次,同样创造了huggingface平台有史以来最受欢迎的模型。 看来,Clement也吃到DeepSeek的红利了,对它是真爱啊连续表扬。
2/24/2025 10:01:23 AM
AIGC开放社区

YOLOv8 图像分类及 .tflite 部署

目标检测是计算机视觉中用于识别和定位图像或视频中对象的一种技术。 图像定位是使用边界框来识别一个或多个对象的正确位置的过程,这些边界框对应于对象周围的矩形形状。 这个过程有时会与图像分类或图像识别混淆,后者的目标是将图像或图像中的对象预测为一个类别或类别之一。
2/24/2025 9:50:21 AM
二旺

14岁出道编程天才:新一代码农不会写代码了,AI正培养「文盲程序员」!

AI辅助编程的时代已经到来,代码生成工具触手可及。 这本应是开发效率的巨大飞跃,但一个令人不安的问题却浮出水面:我们是否正在培养出一批只会「复制粘贴」,却对代码底层逻辑一知半解的程序员? 当便捷的AI工具取代了艰苦的学习和思考过程,我们是否在无意中扼杀了真正的技术创新和深度理解?
2/24/2025 9:40:00 AM
新智元

超1/3美国大学生用ChatGPT,用户数激增破4亿!AI重塑教育职场

OpenAI发布了最新报告,揭示了一个引人注目的趋势:美国超过三分之一的大学生正在使用ChatGPT。 他们借助这一工具撰写论文、开展项目研究、探索主题,甚至进行创意头脑风暴。 与此同时,AI技能已成为企业青睐人才的重要标准。
2/24/2025 9:35:00 AM
新智元

RAGFlow+DeepSeek-R1:14b落地案例分享(足够详细):机加工行业设备维保场景

看到一个段子说,春节开工以后,中国有 5000 万家企业老板担心会错过 DeepSeek。 虽然感觉有点瞎玩梗,但 DeepSeek 无疑已是当下所谓大模型企业应用落地的"房间里的大象"。 不过想想,其实子弹也才刚刚飞了一个月而已。
2/24/2025 9:33:10 AM
韦东东

Grok 3冲击诺奖级突破,成证明「黎曼猜想」关键!AI与数学家打出终极组合拳

困扰人类一个多世纪的「黎曼猜想」,如今可能正站在被破解的边缘。 这周发布的Grok 3异军突起,不仅横扫各大排行榜,更将目光投向了这个「猜想界的皇冠」。 风投机构IBC Group创始人Mario Nawfal发文称,破解黎曼猜想的竞赛正在升温,而Grok 3可能正是关键所在!
2/24/2025 9:25:00 AM
新智元

月之暗面开源改进版Muon优化器,算力需求比AdamW锐减48%,DeepSeek也适用

算力需求比AdamW直降48%,OpenAI技术人员提出的训练优化算法Muon,被月之暗面团队又推进了一步! 团队发现了Muon方法的Scaling Law,做出改进并证明了Muon对更大的模型同样适用。 在参数量最高1.5B的不同Llama架构模型上,改进后的Muon算力需求仅为AdamW的52%。
2/24/2025 9:15:00 AM
量子位

多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学

OpenAI o1视觉能力还是最强,模型们普遍“过于自信”! 这个结果来自首个面向事实知识的中文视觉问答基准ChineseSimpleVQA。 该基准测试包含2200个高质量问题,覆盖了8个主要话题和56个子话题,这些问题涉及从人文到科学和工程等多个领域,由淘天集团未来生活实验室团队推出。
2/24/2025 9:12:00 AM
量子位

从RPA到AI Agent:五种agent模式全解析,搭配两个实践项目介绍(text2SQL、流水解析)

24年年末Anthropic公司发布那篇Building effective agents的Blog,无疑是 AI Agent的入门必读文章之一。 其中反复强调了,最成功的应用案例并非依赖复杂的框架或专业的库,而是采用了简单且可组合的模式,个人实践下来,深以为然。 复制本篇结合个人近期的相关项目或者比赛经验,为大家就其中的五种agent模式应用实践做下分享,正文特意避免了过多技术细节,专注于核心概念和实际案例,可放心使用。
2/24/2025 9:04:20 AM
韦东东

10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文反驳涌现

复刻DeepSeek的神话,还在继续。 之前,UC伯克利的博士只用30美元,就复刻了DeepSeek中的顿悟时刻,震惊圈内。 这一次,来自荷兰阿姆斯特丹的研究人员Raz,再次打破纪录,把复刻成本降到了史上最低——只要10美元,就能复现DeepSeek顿悟时刻!
2/24/2025 9:00:00 AM
新智元

不到1美元,打造全球第3超强AI助手!港大3人开源最强Deep Research

OpenAI的Deep Research一经发布便引发了全网的热议。 作为新一代通用AI助手,它具备自主搜索和分析互联网海量信息的能力,并能通过编程手段对复杂数据进行深度分析,迅速在全球范围内获得了极大反响。 在即将到来的AGI时代,各行各业都需要这样的智能助手来提升工作效率。
2/24/2025 8:47:00 AM
新智元

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

DeepSeek啥都开源了,就是没有开源训练代码和数据。 现在,开源RL训练方法只需要用1/30的训练步骤就能赶上相同尺寸的DeepSeek-R1-Zero蒸馏Qwen。 国内大模型六小强之一的阶跃星辰联与清华联合发布Open Reasoner Zero(ORZ),由AI大拿沈向洋、阶跃星辰创始人/CEO姜大昕、ResNet作者张祥雨等一众大佬亲自署名。
2/24/2025 8:40:00 AM
量子位

模型训练之数据集操作:矩阵变换

对神经网络技术有所了解的人应该都知道,要想训练一个高性能的神经网络模型,除了神经网络本身的设计之外,还一个非常重要的前提就是数据集的质量问题;因此,打造一个高质量的数据集就是一个必不可少的过程。 但具体怎么才能开发一个合格的数据集,这时就离不开对数据集的各种操作;而由于在神经网络中,数据的主要载体是多维数组,也就是矩阵;因此一般情况下,数据集的数据格式也会以矩阵的形式存在。 而学会对矩阵的操作就是一个必不可少的技能之一;下面我们就以MINST数据集为例,来简单介绍一下对数据集的操作过程。
2/24/2025 8:40:00 AM
AI探索时代

构建一个完全本地的语音激活的实用RAG系统

译者 | 布加迪审校 | 重楼本文将探讨如何构建一个RAG系统并使其完全由语音激活。 RAG(检索增强生成)是一种将外部知识用于额外上下文以馈入到大语言模型(LLM),从而提高模型准确性和相关性的技术。 这是一种比不断微调模型可靠得多的方法,可以改善生成式AI的结果。
2/24/2025 8:39:08 AM
布加迪

AI智能体结对编程秒杀人类,90分钟神作惊动OpenAI总裁!引全网140万围观

无需人类插手,AI智能体联手AI智能体竟完成了程序开发。 这简直太疯狂了! 最近,AI开发者Lamar将OpenAI Operator和Replit Agent配对后,让其构建应用程序。
2/24/2025 8:36:00 AM
新智元

DeepSeek、OpenAI、Kimi视觉推理到底哪家强?港中文MMLab推出推理基准MME-COT

OpenAI o1和DeepSeek-R1靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢? 为此,来自港中文MMLab的研究者们提出了MME-CoT。 这是一个全面且专门用于评估LMMs中视觉推理能力的Benchmark,包括了数学、科学、OCR、逻辑、时空和通用场景。
2/24/2025 8:30:00 AM
量子位