AI在线 AI在线

理论

解决RAG与长上下文模型的困境,你学会了吗?

长文本模型非常适合减少某些需要更长上下文用例的幻觉,但并非所有情况都理想。 译自Solving the RAG vs. Long Context Model Dilemma,作者 Kiran Matty。
2/26/2025 12:16:56 AM
岱军

360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能

2025年2月24日,由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,仅以5%参数,逼近DeepSeek-R1-671B的性能。 核心突破:小模型,大能量数学领域:以78.1分(AIME 2024评测)逼近原版R1模型(79.8分),远超DeepSeek-R1-Distill-Llama-70B(70.0分);综合性能:在编程(LiveCodeBench 61.6分)、科学(GPQA-Diamond 65.0分)领域全面领先最佳开源70B模型DeepSeek-R1-Distill-Llama-70B;效率跃迁:仅需5%参数量,性能达原版R1的95%以上,推理成本大幅降低。 技术革新:领域专精 模型融合研究团队使用「分治-融合」策略:基于DeepSeek-R1生成海量领域数据,分别训练数学、编程、科学三大垂直模型;通过Arcee团队Mergekit工具智能融合,突破单一模型性能上限,实现多任务均衡优化。
2/25/2025 2:50:16 PM
新智元

科学发现速度提高10倍?统计原则+智能体,斯坦福&哈佛提出自动化假设验证框架POPPER

编辑丨coisini假设验证在科学发现、决策制定和信息获取中具有基础作用。 无论是在生物学、经济学还是政策制定中,研究者往往依赖于检验假设来指导其结论。 传统上,这一过程涉及设计实验、收集数据并分析结果以确定假设的有效性。
2/25/2025 2:26:00 PM
ScienceAI

怎么实现一个神经网络?神经网络的组成结构

对学习神经网络技术的人来说,自己设计一个神经网络模型是很多人都想做的事情;也是神经网络技术学习过程中必不可少的一个环节;但是很多人又不知道应该怎么下手。 所以今天就介绍一下怎么设计一个神经网络模型。 实现一个神经网络很多人认为神经网络复杂的原因是因为没有了解过神经网络的组成结构;因此,就很难弄清楚神经网络模型中每个环节的作用,所以我们就先从神经网络的结构入手。
2/25/2025 2:13:31 PM
AI探索时代

只给一张图,AI找到对应合适BGM,央音清华等构建全球化音乐信息检索新范式

给AI看一眼图,它就能找到对应音乐。 比如一艘海上航行的海盗船,啪一下,就检索到了加勒比海盗经典配乐。 音乐信息检索(Music Information Retrieval, MIR)一直面临着多模态数据的复杂性和多语言文本理解的挑战。
2/25/2025 1:51:16 PM
量子位

AI蛋白质设计前沿教程,AAAI'25三大机构携手4小时全面剖析

精准预测和设计蛋白质的序列、结构及模拟其动态变化,一直是科学界的重大挑战。 在即将举行的AAAI 2025会议上,加拿大魁北克省人工智能研究所Mila、美国东北大学和MIT的学者将组织一场主题为“人工智能在蛋白质设计中的应用”的教程。 (文末附教程直通车)综观当下,AI与生命科学深度融合背景下,蛋白质研究正经历前所未有的AI驱动变革。
2/25/2025 1:46:26 PM
量子位

实测Claude 3.7:3200行代码一口气输出,物理规律手拿把掐,弱智吧已失守

Claude 3.7新鲜出炉全网热议,到底有多强? 第一波实测来了! 简单粗暴总结,它在编程、现实世界任务上,能力爆表。
2/25/2025 1:44:09 PM
量子位

微软急刹车,被曝撤掉大波数据中心租赁!DeepSeek冲击,算力泡沫要破?

一个月内,微软市值已暴跌了3171亿美元,时间点正好是从DeepSeek在华尔街掀起风暴开始。 而就在刚刚,根据Bloomberg透露,作为OpenAI的最大支持者,微软已经取消了部分AI数据中心的租赁。 具体来说,微软在美国至少与两家私人运营商取消了协议,总计取消了「数百兆瓦」的租赁,相当于大约两个数据中心。
2/25/2025 1:00:00 PM
新智元

吴泳铭预告的旗舰推理模型更了!阿里重磅推出QwQ-Max预览版,Agent或成正式版王炸;一手实测R1热门问题,各有千秋!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)吴泳铭亲自预告过的,阿里旗舰推理模型,新消息来了。 刚刚,它的预览版正式发布和上线体验——就是这个QwQ-Max-Preview! 一眼看去,我愿称之为最萌的推理模型,看blog主页的名称,感觉思维链中的模型正在很努力的思考中……图片Qwen Chat 中已经可以体验预览版模型:,发现这里有一个隐藏彩蛋,内容是由QwQ-Max-Preview自己写的,我们可以看到AI做自我介绍时的思维链:首先,该模型属于 Qwen 系列,是基于 Qwen2.5-Max 构建的。
2/25/2025 12:48:03 PM
伊风

业界首个“混合AI推理模型”!快OpenAI一步Anthropic跳版本发布:Claude3.7 Sonnet可自行决定思考时长

整理 | 星璇出品 | 51CTO技术栈(微信号:blog51cto)就在OpenAI还在吊胃口之际,最强竞对 Anthropic 深夜开大了! Anthropic 直接把自家的“通用 推理”二合一的模型发布了,并把自家内部在用的AI编程工具也上线,直接可以终端执行任务的那种! 这就带大家看看这家公司在大模型以及AI产品上的不同打法!
2/25/2025 11:59:44 AM
星璇

2025红队报告:AI被夸大,并未颠覆网络安全威胁格局

据网络安全公司Picus Labs发布的《2025年红队报告》(Red Report 2025)显示,尽管人工智能(AI)在网络安全领域备受热炒,但截至目前,AI并未显著改变网络威胁格局,现实世界中的网络攻击仍主要依赖一组已知的战术、技术和程序(TTPs)。 这一发现与媒体对AI作为“网络犯罪终极武器”的过度宣传形成鲜明对比,提醒企业将注意力集中于实际存在的、实实在在的网络安全挑战上。 AI热潮的现实落差近年来,AI被视为网络犯罪的“秘密武器”,媒体报道频频提及其在网络攻击中的潜力。
2/25/2025 11:04:20 AM
佚名

深度图解神经网络架构技术

译者 | 朱先忠审校 | 重楼在本文中,我们将全面了解神经网络,这是几乎所有尖端人工智能系统的基础技术。 我们将首先探索人类大脑中的神经元,然后探索它们如何形成人工智能神经网络的基本灵感。 然后,我们将探索反向传播,即用于训练神经网络执行酷炫操作的算法。
2/25/2025 10:50:11 AM
朱先忠

LuminaBrush 在图像上绘制照明效果的构建交互式工具

LuminaBrushLuminaBrush 是一个构建交互式工具以在图像上绘制照明效果的项目。 该框架采用两阶段方法:第一阶段将图像转换为“均匀照明”的外观,第二阶段利用用户涂鸦生成照明效果。 相关链接HF 演示:: 目前基于 Flux。
2/25/2025 10:40:00 AM
AIGC Studio

LLM高效推理:KV缓存与分页注意力机制深度解析

随着大型语言模型(LLM)规模和复杂性的持续增长,高效推理的重要性日益凸显。 KV(键值)缓存与分页注意力是两种优化LLM推理的关键技术。 本文将深入剖析这些概念,阐述其重要性,并探讨它们在仅解码器(decoder-only)模型中的工作原理。
2/25/2025 10:21:15 AM
Dewang Sultania

OpenAI研究人员发现,AI无法解决大多数编程问题

2月24日消息,据外媒报道,OpenAI的研究人员承认,即使是最先进的AI模型仍然无法与人类程序员匹敌,尽管首席执行官山姆·奥特曼(Sam Altman)坚称,到今年年底,他们将能够击败“低级”的软件工程师。 在一篇新论文中,该公司的研究人员发现,即使是前沿模型,或最先进、最具突破边界的人工智能系统,“仍然无法解决大多数”编码任务。 研究人员使用了一种名为sw-lancer的新开发基准,该基准基于自由职业者网站Upwork的1400多个软件工程任务。
2/25/2025 10:21:12 AM
Yu

最新!Claude 3.7 Sonnet 即将揭秘:各种关键领域达到顶尖水平

最新消息:亚马逊云服务 (AWS) Bedrock 平台即将迎来 Anthropic 最新的 Claude 3.7 Sonnet 模型。 据可靠消息,这款升级版 Sonnet 3.7 极有可能在 2 月 26 日的亚马逊活动中正式发布。 目前,该模型已在 AWS Bedrock 后台准备就绪,但尚未在前台用户界面中公开显示,处于隐藏状态Claude 3.7 Sonnet 是 Anthropic 公司迄今为止推出的最智能模型。
2/25/2025 10:20:00 AM
AI寒武纪

深夜王炸!刚刚Anthropic发布全球首个混合推理模型与全新代码“神器”:双面王牌组合

刚刚Anthropic公司正式发布了他们最新的AI王牌组合—— Claude 3.7 Sonnet 和 Claude Code! 各种能力超群,只是数学能力还是不及DeepSeek等,感觉Claude所有重点都在代码能力 观看更多转载,深夜王炸! 刚刚Anthropic发布全球首个混合推理模型与全新代码“神器”:双面王牌组合AI寒武纪已关注分享点赞在看已同步到看一看写下你的评论 视频详情 第一时间(熬夜🤣)给大家划个重点Claude 3.7 Sonnet:混合推理架构登场,打造前所未有的智能巅峰!
2/25/2025 10:08:38 AM
AI寒武纪

ICLR2025|小红书等提出AI图像检测新基准新方法

在数字化浪潮汹涌澎湃的今天,AI生成内容已深度渗透至我们生活的方方面面,从艺术创作到设计领域,再到信息传播与版权保护,其影响力无处不在。 然而,随着生成模型技术的飞速发展,如何精准甄别AI生成图像成为业界与学界共同聚焦的难题。 近日,小红书生态算法团队、中科大、上海交通大学联合在ICLR 2025上提出行业稀缺的全人工标注Chameleon基准和行业领先的AIDE检测方法,为AI生成图像检测领域带来了新的挑战和曙光。
2/25/2025 10:04:10 AM