AI
理解 RAG 第五部分:管理上下文长度
传统的大型语言模型 (LLM)存在上下文长度限制,这限制了单次用户与模型交互中处理的信息量,这是其主要局限性之一。 解决这一限制一直是 LLM 开发社区的主要工作方向之一,提高了人们对增加上下文长度在生成更连贯、更准确响应方面优势的认识。 例如,2020 年发布的 GPT-3 上下文长度为 2048 个 token,而其更年轻但功能更强大的兄弟 GPT-4 Turbo(诞生于 2023 年)允许在单个提示中处理高达 128K 个 token。
科大讯飞:重回双位数增长,AI 大模型竞赛展现强劲实力
近日,科大讯飞发布了其2024年财报,令人振奋的是,该公司营收达到了233.43亿元,同比增长18.79%。 这标志着科大讯飞时隔两年后重新回到了双位数的增长轨道。 同时,归母净利润也达到了5.6亿元,显示出其盈利能力的稳步回升。
ICLR 2025 | 无需训练加速20倍,清华朱军组提出用于图像翻译的扩散桥模型推理算法DBIM
论文有两位共同一作。 郑凯文为清华大学计算机系三年级博士生,何冠德为德州大学奥斯汀分校(UT Austin)一年级博士生。 扩散模型(Diffusion Models)近年来在生成任务上取得了突破性的进展,不仅在图像生成、视频合成、语音合成等领域都实现了卓越表现,推动了文本到图像、视频生成的技术革新。
基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作
本文由上海人工智能实验室,悉尼大学,牛津大学联合完成。 第一作者周恒为上海 ailab 实习生和 Independent Researcher 耿鹤嘉。 通讯作者为上海人工智能实验室青年科学家白磊和牛津大学访问学者,悉尼大学博士生尹榛菲,团队其他成员还有 ailab 实习生薛翔元。
AI无边界:通过MCP实现不同智能体框架的协作(含代码)
在人工智能飞速发展的当下,智能体框架如雨后春笋般不断涌现。 从LangChain利用高度抽象的方式构建智能体,到CAMEL - AI为用户提供细致配置选项来创建智能体,不同框架各显神通。 但这些框架之间就像说着不同“方言”的个体,彼此沟通困难重重。
AI图像分割新王者:BiRefNet如何重新定义视觉精度边界?
一、当“抠图”变成毫米级手术:BiRefNet的技术突破你是否想过,为什么电商商品图能精准抠出发丝? 为什么自动驾驶车辆能瞬间识别行人轮廓? 答案可能藏在一种名为BiRefNet的AI模型中。
答对有资格入职特斯拉?马斯克这道数学题,我们用七大 AI 模型测了一遍
此前,马斯克在社交平台 X 上贴出了一道数学题,并表示如果有人解开这个问题,就有资格在特斯拉公司工作,引起了很多网友的讨论
阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力
4月27日,夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。 基于视觉理解与思考推理的强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,进一步理解和回答物理世界中的各类问题。 作为阿里巴巴AI旗舰应用,夸克AI超级框持续快速迭代,提升超级智能体的多模态能力,打造用户生活、工作、学习的AI超级入口。
美的加速布局人形机器人,类人机器人五月进驻洗衣机工厂
据新浪科技消息,美的中央研究院人形机器人创新中心负责人近日透露,美的今年将重点发力全人形及类人形机器人产品的迭代。 预计今年5月,美的自研的类人机器人将进入湖北荆州洗衣机工厂进行应用尝试。 此外,美的计划在今年下半年逐步在部分门店开始部署相关机器人产品。
一文详解深度学习中的标量、向量、矩阵、张量
在深度学习领域,标量、向量、矩阵和张量是不可或缺的基本概念。 它们不仅是数学工具,更是理解和构建神经网络的关键。 从简单的标量运算到复杂的张量处理,这些概念贯穿于数据表示、模型构建和算法优化的全过程。
英伟达华人硬核AI神器,「描述一切」秒变细节狂魔!仅3B逆袭GPT-4o
有了AI,谁还愿意用手配「字幕」? 刚刚,英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model(DAM),仅3B参数。 论文地址: Anything,上传一张图,圈哪点哪,它即可生成一段丰富的文字描述。
AI、BI、大数据与数据科学的底层逻辑
数据正在重塑世界。 每天早上醒来查看健身数据、刷信用卡时的授权验证、公司会议上讨论的销售增长曲线——数据已经无缝融入我们的生活。 但在这个数据爆炸的时代,我们真的理解AI、BI、大数据和数据科学的本质区别吗?
AI编码陷阱防不胜防?看看 Cursor设计负责人Ryo Lu 是怎么说的
前不久,Cursor 设计总监 Ryo Lu 在 X 上发布了若干最佳实践建议():内容基本匹配我的使用体感,工具始终是工具,即使如 Cursor,效果好坏最终还是取决于”用的人“使用得当的 Cursor 可以让你写出快速、干净的代码;使用不当,它会生成让你清理一周的 AI 意大利面代码。 本文将围绕这一核心观点,结合实际经验,扩展聊聊 Ryo Lu 给出的建议。 从项目规划到代码实现、从提示设计到错误修复,我们将逐条介绍正确用法、常见误区以及实战技巧。
强化学习被高估!清华上交:RL不能提升推理能力,新知识得靠蒸馏
最近,以推理能力为核心的大语言模型已然成为了主流,比如OpenAI o系列模型、DeepSeek-R1等等。 推理模型在处理数学和编程等复杂逻辑问题方面取得了显著突破。 相比于之前依赖人工标注进行指令微调的方法,这一突破的关键在于可验证奖励强化学习(RLVR)。
Anthropic CEO豪言LLM黑箱5年内必破!研究员爆料:AI有意识概率已达15%
未来,AI会拥有意识,并像人类一样体验世界吗? 现在没有实锤证明AI具有意识,但Anthropic认为这事说不定真有可能。 周四,Anthropic宣布启动这项研究,旨在了解AI的「幸福感」到底算不算数,是否需要认真对待。
看不懂GitHub代码?刚刚这个AI工具让全球每个GitHub项目开口说话
还记得那个号称全球首位 AI 软件工程师 Devin 吗? 它的创造者Cognition Labs公司刚刚推出了一个名为 DeepWiki 的项目。 简单来说,这是一个目标宏大的计划:为全世界每一个 GitHub 代码仓库(Repo)提供可以实时交流、即时更新的文档你可以把它想象成一个由 Devin 技术驱动的、专门针对 GitHub 的“深度研究”工具亮点:免费、免注册、即刻可用最关键的是,对于开源项目,这项服务完全免费,甚至无需注册怎么用?
全球开发者组团训练,首个异步强化学习32B推理模型震撼来袭!数据已开源
最近,全球第一个用去中心化强化学习训练的32B模型——INTELLECT-2正式发布! 任何人都能用自己的异构计算资源参与,无需授权。 这种全新的范式,让去中心化训练在编码、数学和科学领域,迈向前沿的推理性能。
美国政府「AI行动计划」万言书发布! OpenAI与Anthropic呼吁联手封锁中国AI
AI战打到现在,下一步怎么走? 4月25日,美国网络与信息技术研究与发展(NITRD)公开了美国各界就「AI行动计划」提交的全部书面意见。 网站链接:,在现在这届政府是行不通了,现在,特朗普政府需要一个全新的AI行动计划,继续保持美国的AI领先地位。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉