理论
实测Claude 3.7:3200行代码一口气输出,物理规律手拿把掐,弱智吧已失守
Claude 3.7新鲜出炉全网热议,到底有多强? 第一波实测来了! 简单粗暴总结,它在编程、现实世界任务上,能力爆表。
2/25/2025 1:44:09 PM
量子位
微软急刹车,被曝撤掉大波数据中心租赁!DeepSeek冲击,算力泡沫要破?
一个月内,微软市值已暴跌了3171亿美元,时间点正好是从DeepSeek在华尔街掀起风暴开始。 而就在刚刚,根据Bloomberg透露,作为OpenAI的最大支持者,微软已经取消了部分AI数据中心的租赁。 具体来说,微软在美国至少与两家私人运营商取消了协议,总计取消了「数百兆瓦」的租赁,相当于大约两个数据中心。
2/25/2025 1:00:00 PM
新智元
吴泳铭预告的旗舰推理模型更了!阿里重磅推出QwQ-Max预览版,Agent或成正式版王炸;一手实测R1热门问题,各有千秋!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)吴泳铭亲自预告过的,阿里旗舰推理模型,新消息来了。 刚刚,它的预览版正式发布和上线体验——就是这个QwQ-Max-Preview! 一眼看去,我愿称之为最萌的推理模型,看blog主页的名称,感觉思维链中的模型正在很努力的思考中……图片Qwen Chat 中已经可以体验预览版模型:,发现这里有一个隐藏彩蛋,内容是由QwQ-Max-Preview自己写的,我们可以看到AI做自我介绍时的思维链:首先,该模型属于 Qwen 系列,是基于 Qwen2.5-Max 构建的。
2/25/2025 12:48:03 PM
伊风
业界首个“混合AI推理模型”!快OpenAI一步Anthropic跳版本发布:Claude3.7 Sonnet可自行决定思考时长
整理 | 星璇出品 | 51CTO技术栈(微信号:blog51cto)就在OpenAI还在吊胃口之际,最强竞对 Anthropic 深夜开大了! Anthropic 直接把自家的“通用 推理”二合一的模型发布了,并把自家内部在用的AI编程工具也上线,直接可以终端执行任务的那种! 这就带大家看看这家公司在大模型以及AI产品上的不同打法!
2/25/2025 11:59:44 AM
星璇
2025红队报告:AI被夸大,并未颠覆网络安全威胁格局
据网络安全公司Picus Labs发布的《2025年红队报告》(Red Report 2025)显示,尽管人工智能(AI)在网络安全领域备受热炒,但截至目前,AI并未显著改变网络威胁格局,现实世界中的网络攻击仍主要依赖一组已知的战术、技术和程序(TTPs)。 这一发现与媒体对AI作为“网络犯罪终极武器”的过度宣传形成鲜明对比,提醒企业将注意力集中于实际存在的、实实在在的网络安全挑战上。 AI热潮的现实落差近年来,AI被视为网络犯罪的“秘密武器”,媒体报道频频提及其在网络攻击中的潜力。
2/25/2025 11:04:20 AM
佚名
深度图解神经网络架构技术
译者 | 朱先忠审校 | 重楼在本文中,我们将全面了解神经网络,这是几乎所有尖端人工智能系统的基础技术。 我们将首先探索人类大脑中的神经元,然后探索它们如何形成人工智能神经网络的基本灵感。 然后,我们将探索反向传播,即用于训练神经网络执行酷炫操作的算法。
2/25/2025 10:50:11 AM
朱先忠
LuminaBrush 在图像上绘制照明效果的构建交互式工具
LuminaBrushLuminaBrush 是一个构建交互式工具以在图像上绘制照明效果的项目。 该框架采用两阶段方法:第一阶段将图像转换为“均匀照明”的外观,第二阶段利用用户涂鸦生成照明效果。 相关链接HF 演示:: 目前基于 Flux。
2/25/2025 10:40:00 AM
AIGC Studio
LLM高效推理:KV缓存与分页注意力机制深度解析
随着大型语言模型(LLM)规模和复杂性的持续增长,高效推理的重要性日益凸显。 KV(键值)缓存与分页注意力是两种优化LLM推理的关键技术。 本文将深入剖析这些概念,阐述其重要性,并探讨它们在仅解码器(decoder-only)模型中的工作原理。
2/25/2025 10:21:15 AM
Dewang Sultania
OpenAI研究人员发现,AI无法解决大多数编程问题
2月24日消息,据外媒报道,OpenAI的研究人员承认,即使是最先进的AI模型仍然无法与人类程序员匹敌,尽管首席执行官山姆·奥特曼(Sam Altman)坚称,到今年年底,他们将能够击败“低级”的软件工程师。 在一篇新论文中,该公司的研究人员发现,即使是前沿模型,或最先进、最具突破边界的人工智能系统,“仍然无法解决大多数”编码任务。 研究人员使用了一种名为sw-lancer的新开发基准,该基准基于自由职业者网站Upwork的1400多个软件工程任务。
2/25/2025 10:21:12 AM
Yu
最新!Claude 3.7 Sonnet 即将揭秘:各种关键领域达到顶尖水平
最新消息:亚马逊云服务 (AWS) Bedrock 平台即将迎来 Anthropic 最新的 Claude 3.7 Sonnet 模型。 据可靠消息,这款升级版 Sonnet 3.7 极有可能在 2 月 26 日的亚马逊活动中正式发布。 目前,该模型已在 AWS Bedrock 后台准备就绪,但尚未在前台用户界面中公开显示,处于隐藏状态Claude 3.7 Sonnet 是 Anthropic 公司迄今为止推出的最智能模型。
2/25/2025 10:20:00 AM
AI寒武纪
深夜王炸!刚刚Anthropic发布全球首个混合推理模型与全新代码“神器”:双面王牌组合
刚刚Anthropic公司正式发布了他们最新的AI王牌组合—— Claude 3.7 Sonnet 和 Claude Code! 各种能力超群,只是数学能力还是不及DeepSeek等,感觉Claude所有重点都在代码能力 观看更多转载,深夜王炸! 刚刚Anthropic发布全球首个混合推理模型与全新代码“神器”:双面王牌组合AI寒武纪已关注分享点赞在看已同步到看一看写下你的评论 视频详情 第一时间(熬夜🤣)给大家划个重点Claude 3.7 Sonnet:混合推理架构登场,打造前所未有的智能巅峰!
2/25/2025 10:08:38 AM
AI寒武纪
ICLR2025|小红书等提出AI图像检测新基准新方法
在数字化浪潮汹涌澎湃的今天,AI生成内容已深度渗透至我们生活的方方面面,从艺术创作到设计领域,再到信息传播与版权保护,其影响力无处不在。 然而,随着生成模型技术的飞速发展,如何精准甄别AI生成图像成为业界与学界共同聚焦的难题。 近日,小红书生态算法团队、中科大、上海交通大学联合在ICLR 2025上提出行业稀缺的全人工标注Chameleon基准和行业领先的AIDE检测方法,为AI生成图像检测领域带来了新的挑战和曙光。
2/25/2025 10:04:10 AM
DeepSeek-R1秘籍轻松迁移,最低只需原始数据0.3%
DeepSeek-R1背后关键——多头潜在注意力机制(MLA),现在也能轻松移植到其他模型了! 而且只需原始数据的0.3%~0.6%。 这项研究由复旦大学、华东师范大学、上海AI Lab等联合提出,复旦教授邱锡鹏(Moss大模型项目负责人)也在作者名单之列。
2/25/2025 10:03:20 AM
量子位
大语言模型:表面的推理能力背后是出色的规划技巧
译者 | 刘汪洋审校 | 重楼大语言模型(LLMs)在技术发展上取得了显著突破。 OpenAI 的 o3、Google 的 Gemini 2.0和 DeepSeek 的R1展现出了卓越的能力:它们能处理复杂问题、生成自然的对话内容,甚至精确编写代码。 业界常把这些先进的LLMs 称为"推理模型",因为它们在分析和解决复杂问题时表现非凡。
2/25/2025 9:49:12 AM
刘汪洋
LeCun力荐!进化算法淘汰77%低质数据:RIP方法让模型性能狂飙60%
在LLM的开发中,推动模型进步的主要驱动力是精心挑选高质量的训练示例。 虽然Scaling Law的确能实现「力大砖飞」,但仅仅增加数据量并不能保证模型性能的提升,数据的质量才是关键。 低质量的数据可能会引入噪声,影响模型的训练效果。
2/25/2025 9:17:47 AM
新智元
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug
近日,获英伟达支持、已获数亿美元风投资金的Sakana AI爆出戏剧性反转。 此前,该公司宣称开发出「AI CUDA工程师」,能将特定模型训练速度提升最高达100倍,引发行业关注。 然而,网友却发现,这个系统根本不管用。
2/25/2025 9:15:35 AM
新智元
刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1
憋了大半年,Anthropic终于放出大招——首款混合推理模型Claude 3.7 Sonnet重磅登场! 这是Claude系列中,迄今为止最智能的模型,几乎能够及时响应,并进行可扩展的、逐步的思考。 简言之,一个模型,两种思考方式。
2/25/2025 9:13:16 AM
新智元
全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手
就在昨晚,Anthropic 要发新模型的消息开始在 AI 社区广泛发酵,不过并不是期待中的 Claude 4.0,而是 3.7 Sonnet 版本。 图源:,Anthropic 的新旗舰模型如约而至,正式发布了其迄今为止最智能的模型以及市面上首款混合推理模型 —— Claude 3.7 Sonnet。 Claude 3.7 Sonnet 可以产生近乎即时的响应或者向用户展示扩展的、逐步的思考。
2/25/2025 9:02:26 AM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind