理论
SOTA大模型遇上加密数据评测:Qwen3未破10%,o1也栽了丨上海AI Lab等联合研究
大语言模型遇上加密数据,即使是最新Qwen3也直冒冷汗! 尽管当前的推理模型在各类基准测试中展现出卓越的性能,但在密码学这一对逻辑严密性和细节精确度要求近乎苛刻的专业领域,模型的推理能力仍有待深入探索。 密码学不仅需要模型具备高阶数学运算能力和严密的逻辑推理链条,更要求其能够精准识别复杂加密模式中的潜在规律;成功解密需要模型具有极强的综合推理能力。
5/30/2025 9:03:00 AM
原来Veo 3早有苗头!人大联合值得买科技在CVPR 2025提出全新「图像到有声视频」生成框架
本文介绍工作由中国人民大学高瓴人工智能学院宋睿华团队、李崇轩、许洪腾与值得买科技 AI 团队共同完成。 第一作者王希华是人大高瓴博士生(导师:宋睿华),他的研究兴趣主要在多模态生成,之前提出利用音频布局(audio layout)为视频生成同步声音的TiVA模型,已发表在MM 2024。 宋睿华的团队主要研究方向为多模态理解、生成与交互。
5/30/2025 9:00:00 AM
RSS 2025|从说明书学习复杂机器人操作任务:NUS邵林团队提出全新机器人装配技能学习框架Manual2Skill
本文共同第一作者为新加坡国立大学博士生铁宸睿和多伦多大学研究助理/本科生孙圣翔。 合作者为朱锦轩、刘益伟、郭京翔、胡越、陈浩楠、陈俊廷、吴睿海。 通讯作者为新加坡国立大学计算机学院助理教授邵林,研究方向为机器人和人工智能。
5/30/2025 8:55:00 AM
LLM省钱大测评!48块GH200,首个百亿级参数量实证
近年来,大型语言模型(LLM)如GPT系列取得了革命性进展,在自然语言处理、内容创作、多语言翻译乃至科学研究等众多领域展现出惊人能力。 然而,模型参数量(如DeepseekR1的671B参数)和上下文窗口的急剧膨胀,带来了巨大的计算力(GPT-3训练约需3640Petaflop/s-days)、能源消耗和资金投入(GPT-3训练成本估计超460万美元)。 高昂的成本已成为制约LLM进一步发展和广泛应用的关键瓶颈。
5/30/2025 8:50:00 AM
还得是华为!Pangu Ultra MoE架构:不用GPU,你也可以这样训练准万亿MoE大模型
Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型,此前发布了英文技术报告[1]。 最近华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告,进一步披露了这个模型的细节。 训练超大规模和极高稀疏性的 MoE 模型极具挑战,训练过程中的稳定性往往难以保障。
5/30/2025 8:45:00 AM
100亿H20没卖出,英伟达狂赚1000多亿破纪录!
英伟达狂赚不止,再次交出了亮眼成绩单! 今早,英伟达2026财年第一季度财报公布,再次破纪录:营收达441亿美元,较上一季度增长12%,较去年同期增长69%数据中心收入达391亿美元,较上一季度增长10%,较去年同期增长73%数据中心占据收入的大头,其次为游戏。 受新出口许可要求影响,英伟达因H20库存积压及采购义务,在本季度计提了45亿美元费用。
5/30/2025 8:40:00 AM
关于 Claude 4 的一切,千万别错过这篇文章
想在 AI 领域保持领先? 千万别错过这篇文章! 介绍现在,AI 巨头们几乎天天都在争相推出更先进的模型。
5/30/2025 8:11:30 AM
前端小智
DeepSeek免费超越GPT-4?
DeepSeek 最新发布了 R1-0528 版本,这次更新的最大亮点是"深度思考"能力大幅提升。 很简单:进入 DeepSeek 官网、APP 或小程序,在对话界面开启"深度思考"功能即可。 图片API 接口也同步更新,调用方式保持不变。
5/30/2025 7:40:56 AM
程序员NEO
DeepSeek-R1小升级!体验后有被惊艳到
今年1月,DeepSeek-R1横空出世,凭借在性能和成本方面展现出的巨大优势,迅速成为全球人工智能(AI)领域瞩目的焦点。 时隔四个月,这款大模型迎来了小升级。 5月28日,DeepSeek正式发布了R1的最新版本——DeepSeek-R1-0528。
5/30/2025 6:57:53 AM
Yu
随着经济压力加大,零售商利用AI来优化成本
面对关税和消费者支出模式带来的压力,零售企业正依赖AI和其他技术来优化成本,以保持竞争力。 随着许多零售商为今年剩余时间内的增长放缓做准备,因为市场波动仍在持续,Ralph Lauren Corporation、Revolve . Group和Williams-Sonoma正优先考虑对AI工具的投资,希望这些工具能减轻经济逆风的影响,并改善客户和员工的体验。
5/30/2025 6:00:00 AM
Lindsey
【一文读懂AI核心要点】什么是大模型?你真的知道“大模型”和“大语言模型”的区别吗?
在人工智能领域,“大模型”和“大语言模型”这两个词经常被提及,很多人甚至把它们当成了同义词。 其实,这两者之间存在本质的区别。 今天,我就带你深入剖析什么是大模型,什么是大语言模型(LLM),它们的区别在哪里,以及如何利用这些模型提升你的项目效率。
5/30/2025 5:00:00 AM
爱学习的蝌蚪
IBM 研究:可验证奖励强化学习(RLVR)通过 GRPO 提升模型推理能力
大家好,我是肆〇柒。 今天,我们来探讨一篇来自IBM Research的前沿论文《REINFORCEMENT LEARNING WITH VERIFIABLE REWARDS: GRPO’S EFFECTIVE LOSS, DYNAMICS, AND SUCCESS AMPLIFICATION》。 这篇论文由Youssef Mroueh撰写,聚焦于强化学习(Reinforcement Learning, RL)领域中一个极具潜力的研究方向——如何通过可验证奖励(RLVR)来优化大型语言模型(LLM)的训练。
5/30/2025 4:00:00 AM
肆零柒
当测试遇见 AI:用 Streamlit+AutoGen+Deepseek 构建智能用例生成器
一、引言: 测试用例的 AI 进化之路1.1 行业困境:手工用例的三重效率枷锁在软件测试领域,测试用例是质量保障的核心载体。 据 ISTQB 2024 全球测试报告揭示:测试用例承担着 70%的质量决策责任,但是传统手工编写方式正面临三大痛点:1.1.1 痛点一:效率瓶颈 —— 百级用例的时间黑洞数据支撑:腾讯云测试效能调研显示:某电商平台年编写用例 1.2w 条,其中 68.3% 因需求变更需重复修改。 某金融 APP 密码修改功能开发中,23 条用例编写耗时占项目周期 42% (相当于 1 个资深测试工程师 80 工时)。
5/30/2025 3:33:00 AM
魏文晏
AI连电路图都看不懂?SeePhys新基准暴击多模态短板,正确率低至55%
当前顶尖AI模型是否真能“看懂”物理图像? 全谱系多模态物理推理新基准来了,结果SOTA级模型准确率都不足55%。 新基准名为SeePhys,强调了图形感知对于模型认识和理解物理世界的重要性。
5/30/2025 3:10:00 AM
RAGFlow v0.19图文混排:详细拆解+预处理增强案例
RAGFlow在5/26 正式更新了v0.19版本,其中有两点值得关注。 首当其冲的是在 Agent 模块(也就是工作流)新增了代码执行组件,这个被吐槽了很久了 RAGFlow工作流编排功能,终于可以处理更加复杂的任务了。 第二点比较大的更新,是这篇文章主要要讨论的,也就是在 Chat 和 Agent 模块中改变以往图片作为引用的展示方式,直接在正文中进行显示。
5/30/2025 3:00:00 AM
韦东东
RAG、AI工作流一键搞定!一文带你看懂 Dify
曾以为AI应用是程序员的专利? Dify 彻底颠覆了! 它就像把复杂AI变成了乐高积木,人人都能动手搭建。
5/30/2025 2:21:00 AM
九歌
万人在看,用Deepseek根据需求定制化写文档并导出,你一定用的上!
需求分析前几天工程立项,主要批量写功能点用于新一年的工程预算。 但是工作量大,共计20000 行左右,要求3天之内完成。 图片文档主要结构及表头信息如下(提供模版部分字段)图片由于工作量太大,手工敲需要消耗大量的人力,于是借助deepseek大模型实现,让AI帮忙干活。
5/30/2025 2:10:00 AM
微微一笑
使用Agno实现AI代理设计的五个层级,由易到难
AI代理设计指南本指南将代理设计分解为五个实际难度级别,每个级别均提供可运行的代码示例。 无论开发者是初学者还是处理现实世界的复杂任务,本指南都能帮助避免常见陷阱,构建真正有效的代理。 这些级别包括:•级别1:带工具和指令的代理•级别2:带知识和记忆的代理•级别3:带长期记忆和推理的代理•级别4:多代理团队•级别5:代理系统以下逐一介绍各级别。
5/30/2025 2:10:00 AM
AI研究生
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
英伟达
Anthropic
智能体
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Agent
Sora
AI视频
GPU
百度
AI设计
华为
搜索
大语言模型
工具
场景
字节跳动
RAG
大型语言模型
具身智能
预测
深度学习
伟达
视觉
Transformer
神器推荐
AGI
亚马逊
视频生成
Copilot
DeepMind
模态
架构
LLaMA