资讯列表
GenAI遇上SLM:边缘计算的新纪元
小型语言模型(SLM)在效率、隐私和适应性之间实现了卓越的平衡,使其成为各种应用的理想选择。 译自GenAI Meets SLMs: A New Era for Edge Computing,作者 Pankaj Mendki。 让我们想象一个场景:一家医院的患者拥有自己的医疗记录。
4/3/2025 4:21:00 AM
岱军
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭
3月26号,ETH等团队的一项研究一经发布,就引起了圈内热议。 这项研究彻底撕开遮羞布,直接击碎了「LLM会做数学题」这个神话! 论文地址:,MathArena团队使用最近的2025年美国数学奥林匹克竞赛进行了详细评估,结果令人大吃一惊——所有大模型的得分,都低于5%!
4/3/2025 2:25:00 AM
新智元
DeepSeek再度升级,厉害了!
当代的程序员,避免不了各种AI工具打交道,可以说,这些AI工具早已成为我们生活和工作的一部分。 从之前的ChatGpt,到今年年初开源的DeepSeek爆火,国产新锐 DeepSeek 犹如一匹黑马,将中国的 AI 技术从“追赶者”转变为“引领者”。 现在各个大厂也都纷纷部署了DeepSeek,我也把重心从国外的产品转向了国内 AI。
4/3/2025 1:25:00 AM
刘欣
基于DeepSeek + VSCode 实现AI辅助编程
随着人工智能技术的飞速发展,AI 辅助编程逐渐成为提升开发效率、优化代码质量的重要工具。 本文通过结合 DeepSeek 的强大语言模型和 VSCode 的高效开发环境,展示了如何利用 AI 辅助编程完成一个经典的 MapReduce 词频统计任务。 这一实践不仅展示了 AI 在编程中的应用潜力,还为开发者提供了一个高效、便捷的开发流程示例,帮助读者快速上手 AI 辅助编程,并探索其在实际项目中的应用价值。
4/3/2025 12:00:01 AM
万卡集群真实部署,已节省数百万 GPU 小时!MoE 通信优化技术 COMET 开源
当前,MoE 架构是业界拓展模型规模的重要方向,然而,其在分布式训练中存在的大量通信开销,仍严重制约了训练效率和成本。 为攻克这一瓶颈,豆包大模型团队提出了一个全新的通信优化系统 COMET,通过更精准、细粒度的计算-通信重叠技术,在大规模 MoE 模型上可达到单层 1.96 倍加速,端到端平均 1.71 倍效率提升,且在不同并行策略、输入规模及硬件环境下均表现稳定。 目前,COMET 已实际应用于万卡级生产集群,助力 MoE 模型高效训练,并已累计节省了数百万 GPU 小时资源。
4/3/2025 12:00:00 AM
豆包大模型团队
超实用!Prompt程序员使用指南,大模型各角色代码实战案例
提示词(Prompt)是输入给大模型(LLM)的文本指令,用于明确地告诉大模型你想要解决的问题或完成的任务,也是大语言模型理解用户需求并生成准确答案的基础。 因此 prompt 使用的好坏,直接决定了大模型生成结果的质量(是否符合预期)。 图片Prompt 基本使用为了让大模型生成更符合预期的结果,我们在使用 Prompt 时,可以使用以下模版。
4/3/2025 12:00:00 AM
磊哥
OpenAI 3个月怒赚6个亿!我们拿GPT-4o整了个治愈系新闻
编辑 | 杨文这波 GPT-4o 的「吉卜力」狂欢,让 OpenAI 大赚了一笔。 昨天,Sam Altman 发帖称,26 个月前 ChatGPT 刚发布时,用户增长速度已经非常快,五天内就新增了一百万用户,这在当时是一个非常「疯狂」的现象。 然而,现在的情况更加惊人,仅仅在一个小时之内,就新增了一百万用户。
4/2/2025 8:10:00 PM
AI好好用
一篇论文,看见百度广告推荐系统在大模型时代的革新
2025 年,生成式 AI 的发展速度正在加快。 我们见证了 DeepSeek R1,用强大的推理能力再次点燃 AI 智力增长的火箭。 在上个星期,OpenAI 给 GPT-4o 的一波图像生成更新又让全网陷入了梗图、甚至玩梗视频制造的火热氛围中。
4/2/2025 6:22:00 PM
机器之心
2025美国最新奥数题,让大模型集体翻车,DeepSeek R1平均分也不到5%
当 AI 翻开奥数题,CPU 也烧了! 还记得那些被奥数题折磨得彻夜难眠的日子吗? 当你在凌晨三点对着一道几何证明题抓耳挠腮、怀疑人生的时候,你可能会想:「要是有个超级大脑能帮我解决这些问题该多好啊!
4/2/2025 6:15:00 PM
机器之心
脑波解码延迟仅80毫秒,实时「意念对话」技术登Nature子刊
无法说话的人,现在可以通过大脑扫描的方式实时地用自己的声音说话了。 整个过程没有延迟,也不需要打字,不用发出任何声音。 本周,脑机接口的最新研究在社交网络上引发了人们的热烈讨论,一位推特博主的帖子浏览量突破了 150 万。
4/2/2025 6:10:00 PM
机器之心
近千个反现实视频构建了「不可能」基准,哪个AI不服?来战!
白泽琛,新加坡国立大学 Show Lab 博士生,他的研究方向主要包括视频理解和统一的多模态模型,在 CVPR、ICCV、NeurIPS、ICLR 等会议发表多篇文章;曾在 Amazon AI 担任 Applied Scientist,在 ByteDance、Baidu 担任 Research Intern。 兹海,新加坡国立大学 Show Lab Research Fellow,于北京大学获得博士学位,主要研究方向为多模态模型的安全。 Mike Zheng Shou,PI,新加坡国立大学校长青年教授,福布斯 30 under 30 Asia,创立并领导 Show Lab 实验室。
4/2/2025 6:05:00 PM
机器之心
7小时开发完成!北京语言大学团队好样的!国产大模型DeepSeek首次用于地震国际救援!
出品 | 51CTO技术栈(微信号:blog51cto)中国科技再立大功! 4月初,缅甸发生中部7.9级地震后,中国驻缅甸使馆称,前方在使用基于DeepSeek紧急开发的中缅英互译系统,据了解,该系统是国家应急语言服务团秘书处和北京语言大学迅速组建的语言服务支持团队开发出来的。 开发过程团队接到任务后争分夺秒,利用国产大模型DeepSeek仅仅七小时内就开发出中缅英三语实时互译系统,并紧急部署到救援人员的手机和终端设备上。
4/2/2025 4:07:07 PM
元鼎智能完成近10亿元融资,携手Fluidra加速全球市场布局
近日,全球领先的无线泳池机器人公司元鼎智能宣布完成新一轮近 10 亿人民币的战略融资。 本轮融资由全球泳池行业巨头 Fluidra 进行战略投资,云启资本作为新晋投资方加入,XVC、复星锐正、蜂巧资本等老股东持续增持。 此次融资不仅为元鼎智能带来了资本上的有力保障,更重要的是,标志着元鼎智能正式打通全球泳池专业渠道,迎来战略层面的质变提升,并将深刻重塑泳池机器人行业格局。
4/2/2025 3:49:00 PM
新闻助手
始于初创,成于生态:Dify.AI 与亚马逊云科技共筑生成式 AI 应用新范式
2025 年,生成式 AI 技术正经历从“内容生成”到“复杂推理”的跨越式进化。 企业不再满足于文本、图像的简单生成,而是将 AI 深度嵌入业务流程,推动自动化决策与任务执行。 然而,这一过程并非坦途,企业面临着系统整合的复杂性、规模化部署的难题以及专业人才的短缺等多重挑战。
4/2/2025 3:47:27 PM
鸢玮
马斯克 AI 超算细节曝光:已投资 4 亿美元,百万 GPU 电力缺口大
马斯克旗下xAI在孟菲斯建造全球最大超算,计划容纳100万GPU,但电力缺口高达现有供应的4倍。项目已投入4亿美元,需自建发电设施补足缺口。专家称需激进超额预订策略才能满足需求。#AI超算##电力危机#
4/2/2025 3:24:44 PM
箫雨
加州大学研究:AI 模型 GPT - 4.5 和 Llama 3.1 - 405B 可通过标准图灵测试
美国加州大学圣地亚哥分校研究显示,GPT-4.5和Llama 3.1-405B在PERSONA模式下通过三方图灵测试,提问者难以区分AI与人类。AI有望在社交场景中替代人类。#人工智能##图灵测试#
4/2/2025 3:20:23 PM
远洋
微软 CTO 预判:未来一年 AI 智能体记忆能力将有重大突破
微软CTO凯文・斯科特预言,未来一年AI智能体的记忆能力将实现重大突破,交互模式将显著变化。AI智能体将能记住用户互动,适应偏好,更像智能数字同事。#AI技术##微软#
4/2/2025 2:26:39 PM
远洋