AI
华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍
大模型,如今堪称AI界的「吞金巨兽」。 从写诗到解题,从对话到编程,它们几乎无所不能,但动辄千亿甚至万亿参数的规模,让部署成本高得离谱。 以FP16精度部署的DeepSeek-R1 671B为例,推理时大概需要1342GB的显存,如果是32GB 5090显卡,需要整整42张!
5/26/2025 9:41:26 AM
Gartner:到2029年,50%的云计算将用于AI工作负载
全球著名咨询调查机构Gartner在官网公布了,未来4年影响云计算增长的几大趋势。 分别包括对云的不满、AI/机器学习需求增加、多云和跨云、行业解决方案、数字主权和可持续性。 对云的不满尽管云采用仍在增长,但并非所有实施都成功。
5/26/2025 9:22:00 AM
312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7
自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。 业界普遍认为,需要海量的轨迹数据或复杂的强化学习才能实现电脑智能体的水平突破——这可能意味着大量的人工轨迹标注,以及大规模虚拟机环境的构建,以支撑智能体的学习与优化。 然而,来自上海交通大学和 SII 的最新研究却给出了一个非共识答案:仅需 312 条人类标注轨迹,使用 Claude 3.7 Sonnet 合成更丰富的动作决策,就能激发模型 241% 的性能,甚至超越 Claude 3.7 Sonnet extended thinking 模式,成为 Windows 系统上开源电脑智能体的新一代 SOTA。
5/26/2025 9:21:00 AM
只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max
近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。 然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。 常见的 MLLM 结构。
5/26/2025 9:16:00 AM
机器之心
AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?
如何用AI赚钱,可能是这个时代最常见的问题。 有些人选择用大模型写小说、写报告、写文案等等,但这些场景只是让模型在执行一些「短期且孤立」的任务。 如果能找到合适的应用场景,比如「用自动驾驶跑网约车」,并且模型还能够在长时间内保持连贯的输出,再那岂不是就能躺赚了?
5/26/2025 9:14:00 AM
15亿美元AI独角兽崩塌,全是印度程序员冒充!微软亚马逊惨遭忽悠
印度老哥是真的有点猛啊! 今天要说的这位,是AI编程公司Builder.ai的创始人兼前CEO——Sachin Dev Duggal。 他不仅造了个「全是人工,没有智能」的假AI公司从软银、微软等巨头手里骗到了数亿美元融资,估值干到15亿而且还敢对投资人虚报300%的营收是的,这家公司的后台里并没有AI,有的只是一群印度老哥假装AI写代码。
5/26/2025 9:12:00 AM
H20之后,英伟达全新特供版GPU曝光!单GPU售价低至6500美元
过去,英伟达在中国AI芯片市场几乎「垄断」,出货占比95%。 然而,在美国出口限制以及国产芯片崛起的背景下,现在其在中国的市场份额已经跌至50%。 为了应对这一局面,黄仁勋即将亮出一颗「阉割版」的Blackwell GPU。
5/26/2025 9:10:00 AM
50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间
相信大家都曾有过这样的经历:运行某个程序时,电脑突然卡住,轻则恢复文件,重则重新创建;或者手机频繁弹出「内存不足」的警告,让我们不得不忍痛删除珍贵的照片或应用。 这些日常的烦恼,其实都指向了计算世界中两个至关重要的基本要素:时间和空间。 时间和空间(也称为内存)是计算中最基本的两种资源:任何算法在执行时都需要一定的时间,并在运行过程中占用一定的空间以存储数据。
5/26/2025 9:09:00 AM
机器之心
全球首次发现 OpenAI 模型能无视关机指令,AI 自我保护引发关注
近日,Palisade Research 发布了一项引人注目的研究,揭示了一些人工智能模型在面对直接关闭命令时竟然会选择 “违抗”。 这项研究的核心发现是,包括 OpenAI 最新推出的 o3模型在内的几个 AI 模型,表现出了对关机指令的无视能力。 这一现象引发了人们对 AI 自主性的深入思考。
5/26/2025 9:01:12 AM
AI在线
英伟达推出低价AI芯片应对出口限制,专供中国市场
据路透社援引三位知情人士消息,英伟达将于6月推出一款专为中国市场设计的全新AI芯片,定价预计在6,500至8,000美元之间,明显低于当前售价约为10,000至12,000美元的H20型号。 新芯片基于最新Blackwell架构,并采用RTX Pro6000D的设计框架。 为规避美国对华高端芯片出口限制,该GPU刻意避开了台积电的先进封装工艺,改用标准GDDR7内存,以降低制造复杂度并提升可量产性。
5/26/2025 9:01:10 AM
AI在线
AI救不了塔吉特:销量下滑、顾客流失,人工智能成“背锅侠”?
在2023年圣诞节前夕,美国大型连锁零售商塔吉特(Target)宣布将通过人工智能技术“提升节日购物体验”。 从推出AI聊天机器人“Store Companion”,到引入预测库存系统,再到部署营销平台“Roundel”,塔吉特自诩正在打造“零售业的未来”。 但现实远比宣传冷酷。
5/26/2025 9:00:34 AM
AI在线
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文
随着 DeepSeek R1 的持续爆火,推理和强化学习已经成为 AI 领域的热门词汇。 短短几个月的时间,我们已经见证了太多的推理大模型,AI 更新迭代速度似乎已经快进到了以天为单位。 但在众多研究成果中找到值得关注的内容并不容易。
5/26/2025 8:48:00 AM
ChatGPT引爆教育革命,学习效果暴涨86.7%!
现在的学生,已经离不开各种AIGC工具了, 不论是写作业,还是生成笔记,或者通过阅读AI生成的摘要来读文献。 面对这些离不开AI的学生,老师和家长都开始担忧了,这样下去,孩子会不会越变越笨啊。 然而,最近一项发表在Nature子刊的研究,基于对59项研究对汇总(元分析)指出,ChatGPT的使用对提高K12(中小学生)的学习表现有显著的正向影响,对于培养学生解决复杂问题的能力也有所帮助。
5/26/2025 8:43:00 AM
打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了
不再像CoT(“思维链”)一样“一个字一个字往外蹦”,加上“软思维”就能让大模型像人类一样进行抽象思考。 来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 “软推理”,而非局限于离散的语言符号,打破了基于离散token的推理瓶颈。 相比标准CoT,Soft Thinking最高提升Pass@1平均准确率2.48%、减少token使用量22.4%。
5/26/2025 8:40:00 AM
星际之门内部惊人曝光:40万块GPU爆铺!奥特曼千亿豪赌险把电网干崩
星际之门数据中心内部,首次曝光了! 就在刚刚,记者Emily Chang探访了德州阿比林的星际之门基地。 这项特朗普就职典礼第二天就官宣的、意义非凡的5000亿美元AI未来投资计划,第一次如此详尽地展示在我们眼前。
5/26/2025 8:32:00 AM
AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%
如果面前有两个AI助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选? 最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models》,通过一个全新的评测基准MathIF揭示:大模型越擅长复杂推理,越容易忽略用户的指令要求,“聪明”和“听话”之间存在明显的矛盾。 这项工作的灵感,源自实际使用推理模型(如o3)过程中的一个意外发现:相比许多经过强化推理训练的大模型,GPT-4o在执行具体指令时反而更加“听话” 。
5/26/2025 8:30:00 AM
AI 的阴暗面:揭露"举报模式"与勒索企图
人工智能行业正热议最新发布的克劳德4(Claude 4)系列模型。 这些模型具备先进的持续推理能力,能够在执行复杂任务时自主暂停,通过搜索引擎或外部工具检索数据,然后无缝恢复操作。 持续推理与举报功能这种设计使模型能够长时间不间断处理复杂任务。
5/26/2025 8:30:00 AM
憨憨鸭
首次,AI下棋不再是「黑盒」!
围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。 目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,但其具体推理过程仍处于「黑盒」之中,更无法用人类语言解释其思考过程和结果。 大模型具备良好的自然语言交互性,如何通过提升大模型的推理能力,实现围棋专业能力突破,是摆在科研人员面前的一道难题。
5/26/2025 8:27:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
马斯克
智能体
AI创作
AI新词
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
蛋白质
腾讯
开发者
Claude
苹果
AI for Science
Agent
生成式
神经网络
机器学习
3D
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
华为
工具
RAG
AI设计
大语言模型
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
预测
视频生成
视觉
AGI
伟达
架构
Transformer
神器推荐
亚马逊
特斯拉
Copilot
DeepMind
应用