资讯列表
LLM省钱大测评!48块GH200,首个百亿级参数量实证
近年来,大型语言模型(LLM)如GPT系列取得了革命性进展,在自然语言处理、内容创作、多语言翻译乃至科学研究等众多领域展现出惊人能力。 然而,模型参数量(如DeepseekR1的671B参数)和上下文窗口的急剧膨胀,带来了巨大的计算力(GPT-3训练约需3640Petaflop/s-days)、能源消耗和资金投入(GPT-3训练成本估计超460万美元)。 高昂的成本已成为制约LLM进一步发展和广泛应用的关键瓶颈。
5/30/2025 8:50:00 AM
还得是华为!Pangu Ultra MoE架构:不用GPU,你也可以这样训练准万亿MoE大模型
Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型,此前发布了英文技术报告[1]。 最近华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告,进一步披露了这个模型的细节。 训练超大规模和极高稀疏性的 MoE 模型极具挑战,训练过程中的稳定性往往难以保障。
5/30/2025 8:45:00 AM
100亿H20没卖出,英伟达狂赚1000多亿破纪录!
英伟达狂赚不止,再次交出了亮眼成绩单! 今早,英伟达2026财年第一季度财报公布,再次破纪录:营收达441亿美元,较上一季度增长12%,较去年同期增长69%数据中心收入达391亿美元,较上一季度增长10%,较去年同期增长73%数据中心占据收入的大头,其次为游戏。 受新出口许可要求影响,英伟达因H20库存积压及采购义务,在本季度计提了45亿美元费用。
5/30/2025 8:40:00 AM
关于 Claude 4 的一切,千万别错过这篇文章
想在 AI 领域保持领先? 千万别错过这篇文章! 介绍现在,AI 巨头们几乎天天都在争相推出更先进的模型。
5/30/2025 8:11:30 AM
前端小智
出门问问上线 Mobvoi MCP Server
5月29日,人工智能公司出门问问正式上线Mobvoi MCP Server,并开源代码,通过一站式集成多项AI能力,真正帮助用户实现“AI能力自由”。 Mobvoi MCP Server集成了语音生成、声音克隆、图片驱动数字人、视频配音、视频翻译等多项能力,用户只需简单输入文本,即可灵活调用这些服务。 目前,该平台已兼容Cursor、Cline、Claude Desktop、Windsurf、OpenAI Agents等MCP客户端,完美适配多场景及多端工作流,无论是代码小白、AI Coding爱好者,还是开发工程师,均可轻松上手。
5/30/2025 8:00:54 AM
AI在线
腾讯元宝正式接入DeepSeek R1-0528 最新版
腾讯元宝正式宣布接入DeepSeek R1-0528最新版,并在电脑版、网页版同步提供抢先体验,此次模型更新带来了三大显著变化,为用户带来更加优质、高效的AI使用体验。 在推理能力上,新模型展现出了更强的实力。 无论是处理复杂的代码问题,还是深入分析各类难题,都能够做到快速且准确,为用户提供可靠的解决方案。
5/30/2025 8:00:54 AM
AI在线
DeepSeek免费超越GPT-4?
DeepSeek 最新发布了 R1-0528 版本,这次更新的最大亮点是"深度思考"能力大幅提升。 很简单:进入 DeepSeek 官网、APP 或小程序,在对话界面开启"深度思考"功能即可。 图片API 接口也同步更新,调用方式保持不变。
5/30/2025 7:40:56 AM
程序员NEO
DeepSeek-R1小升级!体验后有被惊艳到
今年1月,DeepSeek-R1横空出世,凭借在性能和成本方面展现出的巨大优势,迅速成为全球人工智能(AI)领域瞩目的焦点。 时隔四个月,这款大模型迎来了小升级。 5月28日,DeepSeek正式发布了R1的最新版本——DeepSeek-R1-0528。
5/30/2025 6:57:53 AM
Yu
阿里巴巴开源自主搜索 AI 智能体 WebAgent
WebAgent 不仅能识别文献中的关键信息,还能通过多步推理将不同文献中的观点进行整合,最终为用户提供一份全面且精准的研究报告。
5/30/2025 6:40:47 AM
问舟
随着经济压力加大,零售商利用AI来优化成本
面对关税和消费者支出模式带来的压力,零售企业正依赖AI和其他技术来优化成本,以保持竞争力。 随着许多零售商为今年剩余时间内的增长放缓做准备,因为市场波动仍在持续,Ralph Lauren Corporation、Revolve . Group和Williams-Sonoma正优先考虑对AI工具的投资,希望这些工具能减轻经济逆风的影响,并改善客户和员工的体验。
5/30/2025 6:00:00 AM
Lindsey
【一文读懂AI核心要点】什么是大模型?你真的知道“大模型”和“大语言模型”的区别吗?
在人工智能领域,“大模型”和“大语言模型”这两个词经常被提及,很多人甚至把它们当成了同义词。 其实,这两者之间存在本质的区别。 今天,我就带你深入剖析什么是大模型,什么是大语言模型(LLM),它们的区别在哪里,以及如何利用这些模型提升你的项目效率。
5/30/2025 5:00:00 AM
爱学习的蝌蚪
IBM 研究:可验证奖励强化学习(RLVR)通过 GRPO 提升模型推理能力
大家好,我是肆〇柒。 今天,我们来探讨一篇来自IBM Research的前沿论文《REINFORCEMENT LEARNING WITH VERIFIABLE REWARDS: GRPO’S EFFECTIVE LOSS, DYNAMICS, AND SUCCESS AMPLIFICATION》。 这篇论文由Youssef Mroueh撰写,聚焦于强化学习(Reinforcement Learning, RL)领域中一个极具潜力的研究方向——如何通过可验证奖励(RLVR)来优化大型语言模型(LLM)的训练。
5/30/2025 4:00:00 AM
肆零柒
当测试遇见 AI:用 Streamlit+AutoGen+Deepseek 构建智能用例生成器
一、引言: 测试用例的 AI 进化之路1.1 行业困境:手工用例的三重效率枷锁在软件测试领域,测试用例是质量保障的核心载体。 据 ISTQB 2024 全球测试报告揭示:测试用例承担着 70%的质量决策责任,但是传统手工编写方式正面临三大痛点:1.1.1 痛点一:效率瓶颈 —— 百级用例的时间黑洞数据支撑:腾讯云测试效能调研显示:某电商平台年编写用例 1.2w 条,其中 68.3% 因需求变更需重复修改。 某金融 APP 密码修改功能开发中,23 条用例编写耗时占项目周期 42% (相当于 1 个资深测试工程师 80 工时)。
5/30/2025 3:33:00 AM
魏文晏
AI连电路图都看不懂?SeePhys新基准暴击多模态短板,正确率低至55%
当前顶尖AI模型是否真能“看懂”物理图像? 全谱系多模态物理推理新基准来了,结果SOTA级模型准确率都不足55%。 新基准名为SeePhys,强调了图形感知对于模型认识和理解物理世界的重要性。
5/30/2025 3:10:00 AM
RAGFlow v0.19图文混排:详细拆解+预处理增强案例
RAGFlow在5/26 正式更新了v0.19版本,其中有两点值得关注。 首当其冲的是在 Agent 模块(也就是工作流)新增了代码执行组件,这个被吐槽了很久了 RAGFlow工作流编排功能,终于可以处理更加复杂的任务了。 第二点比较大的更新,是这篇文章主要要讨论的,也就是在 Chat 和 Agent 模块中改变以往图片作为引用的展示方式,直接在正文中进行显示。
5/30/2025 3:00:00 AM
韦东东
RAG、AI工作流一键搞定!一文带你看懂 Dify
曾以为AI应用是程序员的专利? Dify 彻底颠覆了! 它就像把复杂AI变成了乐高积木,人人都能动手搭建。
5/30/2025 2:21:00 AM
九歌
万人在看,用Deepseek根据需求定制化写文档并导出,你一定用的上!
需求分析前几天工程立项,主要批量写功能点用于新一年的工程预算。 但是工作量大,共计20000 行左右,要求3天之内完成。 图片文档主要结构及表头信息如下(提供模版部分字段)图片由于工作量太大,手工敲需要消耗大量的人力,于是借助deepseek大模型实现,让AI帮忙干活。
5/30/2025 2:10:00 AM
微微一笑
使用Agno实现AI代理设计的五个层级,由易到难
AI代理设计指南本指南将代理设计分解为五个实际难度级别,每个级别均提供可运行的代码示例。 无论开发者是初学者还是处理现实世界的复杂任务,本指南都能帮助避免常见陷阱,构建真正有效的代理。 这些级别包括:•级别1:带工具和指令的代理•级别2:带知识和记忆的代理•级别3:带长期记忆和推理的代理•级别4:多代理团队•级别5:代理系统以下逐一介绍各级别。
5/30/2025 2:10:00 AM
AI研究生