AI在线 AI在线

资讯列表

扣子Coze宣布独家支持 DeepSeek Function Calling 工具调用能力

新一代AI应用搭建平台——扣子(Coze),宣布正式推出对DeepSeek Function Calling工具调用能力的独家支持。 扣子平台此次更新的核心亮点在于其对DeepSeek模型的深度整合。 用户不仅能够免费体验DeepSeek的R1和V3模型,还能通过扣子平台实时查看模型的思维链内容。
2/21/2025 2:17:00 PM
AI在线

报告称 DeepSeek App 上线一个月下载量破亿:几乎没花钱营销,周活跃用户最高近 9700 万

数据分析平台 QuestMobile 最新数据显示,从上线以来至 2 月 9 日,DeepSeek App 的累计下载量已超 1.1 亿次,周活跃用户规模最高近 9700 万。(每日经济新闻)
2/21/2025 2:15:22 PM
汪淼

阿里巴巴股价飙升,背后原因竟与人工智能有关

阿里巴巴的股价在近期表现出色,持续攀升,吸引了投资者的广泛关注。 这家知名的电子商务巨头上周发布了令人惊喜的财报,超出市场预期,进一步巩固了其在行业中的地位。 公司不仅在营收上实现了增长,同时也表现出良好的盈利能力,显示出其强大的市场竞争力。
2/21/2025 2:10:00 PM
AI在线

消息称字节AI 核心部门Seed大调整 ,吴永辉博士或成核心人物

据多位接近字节跳动的人士透露,字节跳动的 AI 核心部门 Seed 正在经历快速的战略调整和人事变动。 刚刚从谷歌加入字节跳动的 AI 领域权威专家、曾参与 Gemini 开发的 Google Fellow 吴永辉博士,将接替原 LLM 团队及 Seed 总负责人朱文佳,成为 Seed 部门的新负责人。 目前,团队内部正在进行汇报关系的梳理和调整。
2/21/2025 1:57:00 PM
AI在线

超给力!DeepSeek 宣布下周开源五个项目

近日,DeepSeek 在其官网 X 账号上发布了重磅消息,宣布将在接下来的一个星期内陆续开源五个代码库。 该公司表示,当前已经完成的在线服务模块经过严格的测试和部署,已具备投入生产环境的条件。 DeepSeek 强调,分享代码的初衷在于希望每一行代码都能成为推动行业前进的强大动力。
2/21/2025 1:45:00 PM
AI在线

谷歌超硬核教科书来了!Jeff Dean带货揭Gemini训练秘籍:在TPU上scaling

由于深度学习的「黑箱」本性,从业者自我调侃道:如果说深度神经网络是现代版的「炼金术」,我们在古代就是「炼金术士」。 2018年5月3日, Science发表新闻,标题直指「炼金术」,强调加强AI的科学基础但这次的谷歌的团队,却有不一样的看法:在许多方面,深度学习仍然带有一定的「炼金术」色彩,但理解和优化模型性能并不一定如此——即使是在大规模环境下! 近日,谷歌DeepMind科学家Jacob Austint在X上, 发布了基于JAX和TPU的大模型Scaling教科书《How to Sacle Your Model》。
2/21/2025 1:45:00 PM
新智元

「卖铲子」也疯狂!美国「DeepSeek概念」AI初创,估值达33亿美元

放眼全球,最大的投资风口非AI莫属了。 昨日,美国明星初创Together AI宣布,已完成3.05亿美元B轮融资,总估值达到33亿美元。 Together AI表示,这项投资将加速他们在构建基于开源模型的现代AI应用,以及利用他们即将大规模部署的英伟达Blackwell GPU训练定制模型方面的领先地位,也能巩固他们作为首选AI云供应商的地位。
2/21/2025 1:40:00 PM
新智元

全球首个AI CUDA工程师来了!将PyTorch原生实现提速10-100倍

用 AI 提高 AI 的效率,它们就能变得像人类大脑一样高效? 我们的大脑只用了 20 瓦的能量就能完成复杂思考,而现代 AI 系统却需要成排的高功率 GPU 和惊人的电力消耗。 这种差距如何缩小?
2/21/2025 1:28:00 PM
机器之心

大模型扩展新维度:Scaling Down、Scaling Out

本文由悉尼大学计算机学院王云柯,李言蹊和徐畅副教授完成。 王云柯是悉尼大学博士后,李言蹊是悉尼大学三年级博士生,徐畅副教授是澳洲ARC Future Fellow,其团队长期从事机器学习算法、生成模型等方向的研究。 近年来, Scaling Up 指导下的 AI 基础模型取得了多项突破。
2/21/2025 1:20:00 PM
机器之心

DeepSeek 还在发力:官宣下周陆续开源 5 个代码库,毫无保留、推翻象牙塔

DeepSeek 今日宣布,接下来一周,会陆续开源 5 个代码库,每日都有新内容解锁,“毫无保留地分享我们微小但真诚的进展”。
2/21/2025 1:03:44 PM
汪淼

机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA

世界模型(World Model)作为近年来机器学习和强化学习的研究热点,通过建立智能体对其所处环境的一种内部表征和模拟,能够加强智能体对于世界的理解,进而更好地进行规划和决策。 在强化学习领域中,世界模型通常被建模为一个神经网络,通过历史状态和动作,预测未来可能出现的状态。 其中,Dreamer 算法在多种模拟环境的成功表现让我们看到了世界模型优秀的表征和泛化能力。
2/21/2025 1:00:00 PM
机器之心

蚕食人类权力不用AGI降临!「温水煮青蛙」足以让AI渐进式失控

在我们的认知中,政府、经济体系等大规模社会系统就应该由人类主导,产生满足人类偏好的结果。 但在AI时代,这个命题就逐渐站不住脚了。 原因在于,人类与这些系统的目标一致性并不是自发的,而是仰赖于两种有效维持目标对齐的方式:明确的人类行为(如选举和消费者用脚投票),以及经由人类劳动和认知过程隐式方式。
2/21/2025 12:58:02 PM
新智元

Deepseek宣布将连续五天发布5个开源项目 推动社区创新

北京时间,2025年2月21日,专注于探索通用人工智能(AGI)的 DeepSeek AI 团队在社交媒体上发布了一则振奋人心的消息,正式拉开了他们参与 #OpenSourceWeek 活动的序幕。 这家小型但充满雄心的技术团队宣布,从下周开始,他们将开源5个代码仓库,以完全透明的方式与全球开发者社区分享他们的研究进展。 在2月25日北京时间12:00发布的推文中,DeepSeek AI 用轻松而真诚的语气写道:“我们是 @deepseek_ai 的一个小团队,正在探索 AGI。
2/21/2025 12:51:00 PM
AI在线

阿里重回伟大!吴泳铭财报讲话全文曝光:开发者会天然选择阿里云,发布旗舰推理模型!未来三年,阿里对基础设施投资将超过去十年总和!

出品 | 51CTO技术栈(微信号:blog51cto)编辑 | 伊风昨晚,阿里2025财年Q3财报新鲜出炉,同比增长8%,可以说成绩相当亮眼! 淘天增收继续加快,阿里云增速重回加速状态,多项核心业务增速达到年内最佳。 财报显示:阿里第三季度营收增速创逾一年以来最快,资本开支大增,核心业务加速增长,淘天收入增长加快,阿里云收入重回双位数增长(13%),增幅创约两年以来最大,AI相关产品收入连续六季度保持三位数增长。
2/21/2025 12:40:19 PM
伊风

清华系团队 DeepSeek 版多模态生物医药大模型 BioMedGPT-R1 发布,后续计划开源

在 BioMedGPT 的基础上,清华大学 AIR 与水木分子推出了 BioMedGPT-R1,用 DeepSeek R1 蒸馏版本模型更新了 BioMedGPT 中现采用的文本基座模型,从而引入了更优的文本推理能力。
2/21/2025 12:27:55 PM
汪淼

出人意料!DeepSeek-R1用的GRPO其实没必要?规模化强化学习训练用PPO就够了

DeepSeek-R1 非常热门,而在其公布的训练配方中,GRPO(Group Relative Policy Optimization)非常关键,是 DeepSeek-R1 核心的强化学习算法。 PPO 与 GRPO 的对比,来自论文《DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models》相较于 PPO,GRPO 去掉了价值模型,而是通过分组分数来估计基线,从而可极大减少训练资源。 DeepSeek-R1 技术报告中写到:「具体来说,我们使用 DeepSeek-V3-Base 作为基础模型,并采用 GRPO 作为强化学习框架来提高模型的推理性能。
2/21/2025 12:24:14 PM
机器之心

踹了OpenAI后,Figure光速发布具身大模型Helix,能力前所未有、创多项第一

本地 GPU 运行,7B 系统 2 模型 80M 系统 1 模型,可多机器人共用「大脑」。 在 2 月份突然宣布终结与 OpenAI 合作之后,知名机器人初创公司 Figure AI 在本周四晚公开了背后的原因:他们已经造出了自己的通用具身智能模型 Helix。 Helix 是一个通用的视觉 - 语言 - 动作(VLA)模型,它统一了感知、语言理解和学习控制,以克服机器人技术中的多个长期挑战。
2/21/2025 12:07:00 PM
机器之心

传字节大模型团队架构调整,知情人士称吴永辉和朱文佳都向梁汝波汇报

有接近字节的人士表示,吴永辉博士主要负责 AI 基础研究探索工作,偏基础研究,朱文佳主要负责模型应用相关的工作,偏模型应用,两个人都在 Seed 部门,都向字节 CEO 梁汝波汇报。
2/21/2025 12:04:40 PM
-