理论
鄂维南李航领衔造高级论文搜索Agent,召回率和精准性超谷歌学术等,磕盐党狂喜
中科院院士鄂维南、字节AI实验室总监李航领衔,推出高级论文搜索Agent。 名为PaSa,两个Agent分别执行多轮搜索和判断论文是否满足查询要求的任务,模仿人类复杂学术搜索行为。 现在就有Demo可玩。
1/27/2025 9:00:00 AM
量子位
用Ray观测和监控大语言模型工作负载
译者 | 布加迪审校 | 重楼前言GPT-4、PHI2、BERT和T5等大语言模型(LLM)的出现已彻底改变了自然语言处理,这些模型支持高端应用程序,包括聊天机器人、推荐系统和分析。 然而,LLM中工作负载的规模和复杂性使得保证性能和可靠性成了一大挑战。 在这种情况下,在使用Ray等框架部署工作负载的同时进行监控和观测显得非常必要。
1/27/2025 8:23:41 AM
布加迪
十大机器蜜蜂:机器蜜蜂能拯救地球上所有的植物吗?
译者 | 张哲刚审校 | 重楼作为一个几乎每天都要吃蜂蜜吐司的人,在过去的几年里,我一直非常关注全球蜜蜂种群持续减少这个话题。 蜜蜂不仅仅是蜂蜜生产者,它们还是大自然中伟大的传粉者。 尽管,就传粉者而言,它们并不是唯一,但是,据我所知,它们是唯一能够生产蜂蜜的传粉者。
1/27/2025 8:00:00 AM
张哲刚
MetaDiff:用扩散模型重塑元学习,攻克小样本学习瓶颈!
一眼概览MetaDiff 提出了一种基于条件扩散模型的创新元学习方法,通过将梯度下降优化建模为去噪过程,有效提升了小样本学习(FSL)的性能,显著减少了内循环优化中的内存负担和梯度消失风险。 核心问题小样本学习的主要挑战在于:如何在训练数据有限的情况下快速适应新任务,而不引入过拟合或内存瓶颈。 传统基于梯度的元学习方法需要计算内循环路径上的二阶导数,导致内存消耗高和梯度消失问题,从而影响性能。
1/27/2025 12:57:43 AM
萍哥学AI
2025年,更多AI,更多软件开发者面临的问题
组织准备好应对AI生成代码可能带来的繁琐工作、漏洞和开发者倦怠了吗? 译自More AI, More Problems for Software Developers in 2025,作者 Jennifer Riggins。 生成式AI创造了比以往任何时候都更多的代码。
1/27/2025 12:23:15 AM
岱军
从人工到自动化到AIOps再到ChatOps:大模型在运维领域的应用
一、引言在信息技术飞速发展的今天,运维工作已经从最初的人工操作,逐步演变为自动化、AIOps(人工智能运维)和ChatOps(通过聊天的方式去运维)。 这些变革不仅提升了运维效率,还显著保障了系统的稳定性。 特别是借助大模型,运维同学能够更加高效地完成工作,并应对复杂的运维挑战。
1/26/2025 3:35:01 PM
佟铁
MV-DUSt3R+: 只需2秒!Meta Reality Labs开源最新三维基座模型,多视图大场景重建
本文一作为唐正纲,目前为博士生,就读于伊利诺伊大学厄巴纳 - 香槟分校,本科毕业于北京大学。 通讯作者是严志程,Meta Reality Labs 高级科研研究员 (Senior Staff Research Scientist),主要研究方向包括三维基础模型,终端人工智能 (On-device AI) 和混合现实。 近期,Fei-Fei Li 教授的 World Labs 和 Google 的 Genie 2 展示了 AI 从单图生成 3D 世界的能力。
1/26/2025 2:13:28 PM
机器之心
字节版Operator抢跑OpenAI? 直接免费开源, 网友:怒省200美元!
一线大模型,正在全面进入智能体时代。 1 月 24 日凌晨 2 点,OpenAI 面向月供 200 美元的 ChatGPT Pro 用户发布了自家的 Computer Use 智能体:Operator。 OpenAI 甚至给 Operator 开设了单独的产品界面,将它视为与 ChatGPT、Sora 并列的关系,这也符合 Sam Altman、黄仁勋、扎克伯格等科技大佬对于「2025 年将是 AI 智能体之年」的趋势判断。
1/26/2025 2:07:34 PM
机器之心
胜过Transformer?谷歌推出新型AI模型架构Titans
自2017年推出以来,Transformer模型架构一直是人工智能的基础要素,推动了自然语言处理、机器翻译等领域的进步。 不过,该模型在可扩展性、计算效率以及应对日益复杂任务等方面,仍面临着诸多挑战。 而Titans模型架构的诞生,旨在通过整合受人类认知过程启发的机制来克服这些障碍,如记忆优先级和适应性注意力。
1/26/2025 1:20:49 PM
Yu
顶级AI智能体不会社交,创业远不如人类!CMU等:最多完成24%任务
如今,基于大模型的智能体,已经能完成许多在几年前还无法想象的任务,进步的速度是如此之快,以至于有些人甚至声称,在接下来的几年内,大多数人类劳动可能都可以实现自动化。 然而近日CMU、杜克大学等机构发表的一项研究却给这一期待泼了一盆凉水。 智能体运营公司还不可行论文链接: Agent Company,与人类员工类似,智能体需要执行软件开发、项目管理、财务分析等典型的商业环境中的任务。
1/26/2025 1:07:50 PM
新智元
全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
这些天,硅谷彻底处于中国公司带来的大地震余波中。 全美都在恐慌:是否全球人工智能的中心已经转移到了中国? 就在这当口,全球复现DeepSeek的一波狂潮也来了。
1/26/2025 1:03:35 PM
新智元
AI 重塑运维:基于 Spring AI 的 Docker 自然语言管理实践
MCP (Model Context Protocol) 是一个创新的开源协议,它的核心目标是彻底简化 AI 应用程序的开发流程。 通过提供标准化的通信接口,MCP 在 AI 模型与应用程序上下文之间搭建了一座智能桥梁,让开发者能够更加高效地构建和部署 AI 驱动的应用。 MCP Docker 服务器使用指南 图片在容器化技术日益普及的今天,Docker 的管理和运维工作往往需要掌握大量的命令和配置知识。
1/26/2025 12:34:46 PM
冷冷
太惨,一个月仅23个下载!盘点2024“理想丰满现实骨感”的大模型们!
整理 | 言征出品 | 51CTO技术栈(微信号:blog51cto)大型语言模型的竞争似乎正在结束,只有少数几个明显的赢家。 其中,DeepSeek V3 已成为 2024 年的焦点,引领中国开源模型的发展。 据 Hugging Face 称,DeepSeek V3 与 GPT-4 和 Claude 3.5 等闭源巨头正面交锋,上个月的下载量为 45,499 次,与Meta 的 Llama 3.1(491,629 次下载)和谷歌的 Gemma 2(377,651 次下载)并驾齐驱。
1/26/2025 11:38:54 AM
言征
Meta杨立昆引燃全民大讨论:美政府有些人被洗脑了,监管让开源变得像非法一样!Meta也犯过错!大模型不如猫,保质期就3年!
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)1月23日,在冬季达沃斯论坛的“辩论技术”环节,Meta公司副总裁兼首席人工智能科学家Yann Lecun、麻省理工学院媒体实验室主任 Dava Newman、Axios首席技术记者Ina Turpen Fried(主持人)就未来十年前沿科技进行了时长47分钟的“全民”大讨论,话题涵盖了LLM、智能体、消费机器人、脑机接口、跨物种、太空探索,也讨论了非常让Meta敏感的“技术作恶”、审查监管、开闭源之争。 观众们更是抓住机会让两位嘉宾抖出了很多猛料。 Lecun表示,现在的大模型并没有达到预期效果,在很多方面都存在不足:“我认为当前 LLM范式的保质期相当短,可能只有3到5年。
1/26/2025 11:35:05 AM
言征
世界模型再进化!博士AdaWM:自适应世界模型规划新SOTA
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接::基于自适应世界模型的自动驾驶规划。 基于世界模型的强化学习(RL)已经成为一种有前景的自动驾驶方法,它学习潜在动态模型并且用其训练规划策略。
1/26/2025 11:00:00 AM
自动驾驶专栏
重构的道法术器:探讨AI智能对工具的影响
经过影片出租店的完整演练,对这样一个如麻雀般完整而小的遗留项目展开重构,使得我们对重构建立了一个整体的印象,也有利于我们将前面介绍的各种重构知识串联起来,现在,有必要对整个重构做一次复盘。 为了帮助大家更好地理解重构,我认为可以从道、法、术、器这四个层次做一番总结。 图片道是万物变迁循环中亘古不变的规律,是自然环境、事物的自然规律和发展方向。
1/26/2025 10:12:13 AM
张逸少
人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题,DeepSeek竟是王者
捍卫「人类智慧」最后一战!刚刚,Scale AI和Center for AI Safety(CAIS)公布了「人类最后一场考试」结果! 新基准全称「人类最后一次考试」(Humanity’s Last Exam),简称「HLM」,包含3000个问题,由数百位领域专家开发,用于追寻人类知识推理的边界。 目前,最好的模型,准确率也小于10%,而且自信「过头」。
1/26/2025 9:45:00 AM
新智元
解密FedDAT:首个多模态异构联邦学习高效微调框架,突破数据异构与通信瓶颈!
FedDAT: An Approach for Foundation Model Finetuning in Multi-Modal Heterogeneous Federated Learning一、 一眼概览FedDAT提出了一种创新的双适配器教师框架(Dual-Adapter Teacher, DAT),结合参数高效微调和互知识蒸馏,解决了多模态异构联邦学习(FL)中的数据异构性问题,并在多个视觉-语言任务基准上取得了最优表现。 二、核心问题如何在多模态联邦学习环境中,在数据异构性和通信预算限制下,实现基础模型的高效分布式微调,以提升视觉-语言任务的性能,是本研究的核心问题。 三、 技术亮点1.
1/26/2025 9:07:46 AM
萍哥学AI
资讯热榜
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
昆仑万维天工超级智能体发布!AI Office革命来袭,Deep Research碾压OpenAI,成本仅40%!
3分钟生成UI源文件!实测谷歌最新UI设计神器Google Stitch
Anthropic拒绝为Windsurf提供Claude Sonnet 4与Opus 4支持,商战大戏开演!
进化智能体 AlphaEvolve:科学发现与算法优化的新引擎
从设计到开发一步到位!Figma 5大新功能深度解析!
《Nature》研究显示:ChatGPT 可使中小学生学习效果暴涨 86.7%
早报速读!2025年5月最新AI视频产品评测&优秀案例
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
腾讯
Anthropic
神经网络
研究
3D
计算
Sora
机器学习
生成
AI设计
AI for Science
苹果
GPU
AI视频
训练
搜索
华为
Claude
场景
百度
人形机器人
预测
智能体
伟达
xAI
深度学习
Transformer
大语言模型
字节跳动
模态
LLaMA
文本
神器推荐
具身智能
Copilot
视觉
驾驶
API
算力
应用
Agent
工具
大型语言模型
安全
干货合集
视频生成