理论
微软Agent Lightning:零代码接入RL,“解耦”任何AI Agent学会“在实践中学习”
大家好,我是肆〇柒。 我从工程落地角度出发,看到一篇很有意思的研究想要分享出来。 这是一项来自微软研究团队的研究工作——Agent Lightning。
又一个Genie 3来了!刚上线挤爆服务器,Mirage 2把世界模型玩成在线游戏
世界模型也卷起来了! 全球首款AI原生UGC游戏引擎,2.0版本来了。 Mirage 2,一个可在线游玩的实时、通用领域生成式世界引擎。
2025 年过半,RAG 领域进展如何?这份报告为你深度解析
2025 年已经过半,在 LLM 领域,RAG(检索增强生成)技术一直是备受关注的焦点。 近期,RAGFlow 团队发布了 2025 年过半的 RAG 进展报告下面来详细看下。 1、RAG 与智能体的关系被误读的 "智能体化 RAG"2025 年 AI 圈最热闹的话题莫过于智能体系统,随之而来的 "智能体无需 RAG" 论调一度引发行业困惑。
DeepSeek-V3.1发布:专为国产芯片设计浮点数格式
近日,深度求索(DeepSeek)正式发布新一代大模型 DeepSeek-V3.1,并首次公开提及采用“UE8M0 FP8 Scale”参数精度。 这一技术细节的披露,迅速引发行业关注。 官方在公众号文章中进一步解释,UE8M0 FP8 是专为下一代国产芯片设计的浮点数格式,旨在提升计算效率并降低资源消耗。
Meta掀起AI重大变革:重组团队架构,全力推进 “超级智能”
据外媒报道,Meta 在人工智能领域掀起重大变革,正通过拆分新成立的 AI 部门、重组团队架构,全力推进 “超级智能”(superintelligence) 目标。 这一系列动作不仅标志着其 AI 战略的关键转向,也引发了内部人员与技术路线的连锁反应。 此次变革由 Meta 新任首席 AI 官、前Scale AI首席执行官汪滔(Alexandr Wang)主导,他在内部备忘录中明确,超级智能时代将至,公司需围绕研究、产品、基础设施等核心领域调整组织架构,以加速目标实现。
万物转视频时代来临:Higgsfield AI让传统视频制作成为历史
想象一下这个场景:周一早上,你的老板突然说要在周三的客户会议上展示一个产品演示视频。 按照传统流程,你需要联系拍摄团队、租借设备、安排场地、后期剪辑...光是想想就头疼。 但如果我告诉你,现在只需要一张产品图片和一句描述,3分钟后就能得到好莱坞级别的视频,你会怎么想?
小扎“亿元俱乐部”车门焊死!被曝冻结招聘,禁止内部人员流动
小扎“亿元俱乐部”车门焊死! Meta超级智能实验室被曝冻结招聘,并且禁止该部门员工跨团队调动。 华尔街日报称Meta发言人证实了这个消息,并描述为基本的组织规划:“在招募和年度预算规划工作后,为新的超级智能工作创建一个坚实的结构。
工业大模型,正在重写制造业的游戏规则
有没有想过,为什么特斯拉能在短短几年内颠覆百年汽车工业? 为什么海尔能让家电设计周期从几个月缩短到几周? 答案可能比你想象的更简单——工业大模型。
AI Agent接管谷歌搜索!预订餐厅、定制搜索结果,一键搞定所有事
今天凌晨,谷歌在官网宣布,谷歌搜索的AI模式新增AI Agent功能,可自动帮助用户完成预订餐厅、定制搜索结果。 例如,用户可以询问预订晚餐的餐厅,包括多种约束条件和偏好,包括人数、日期、时间、地点、口味、禁忌和偏好的菜系等。 Agent智能体会在多个预订平台和网站上搜索,找到符合用户特定需求的餐厅,并为用户呈现一个可供选择的餐厅列表,用户可以直接链接到预订页面一键完成预订。
人工智能时代下的WordPress开发形态
译者 | 刘涛审校 | 重楼在过去,利用WordPress(一款功能强大的开源内容管理系统,广泛用于搭建网站和博客,支持用户通过直观界面进行内容创建、编辑和管理,且可通过插件和主题扩展功能与外观)搭建网站需投入大量时间成本。 首先要完成平台的安装,接着从众多选项中挑选适配的主题,再添加各类插件,并且要手动撰写全部网站内容,同时还需保证各个组件之间能够协同且高效地运行。 即便是经验丰富的开发者,搭建一个基础网站也至少需要耗费数小时。
一场无人防备的AI安全危机正在形成
在采访中,Curity的CTO Jacob Ideskog探讨了智能体给企业带来的风险,随着这些智能体逐渐融入企业系统,滥用、数据泄露和未经授权访问的可能性也在增加。 Ideskog警告称,行业正在“梦游”般地陷入安全危机,这与早期API和云计算的采用过程如出一辙,同时他还概述了公司为抵御这些行为驱动的威胁必须采取的措施。 你曾警告称,智能体会让行业“梦游”般地陷入安全危机,你这么说的意思是什么?你看到了哪些迹象表明我们已经在走这条路了?智能体和其他非人类身份正在迅速激增,在某些企业中,它们的数量已经超过人类用户,比例超过80比1。
企业实施机器学习安全运维时将面临的六大挑战
在实施AI的过程中,若企业不对其安全计划进行适应性调整,就可能面临各种新旧威胁。 机器学习安全运维(MLSecOps)通过将AI和机器学习(ML)开发与严格的安全准则相结合,解决了安全边界中的这一关键缺陷。 根据开放软件安全基金会(Open Software Security Foundation)的一份白皮书,建立稳固的MLSecOps基础对于主动降低漏洞风险和简化先前未发现缺陷的修复流程至关重要。
仅50天!百度蒸汽机视频生成大模型升级2.0版本,价格低至行业70%
8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。 百度蒸汽机通过五大技术突破实现“需求即成片”,在生成电影级高清视频画面的同时,实现逼真环境音效、自然人物语音的同步输出。 即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
仅50天!百度蒸汽机视频生成大模型升级2.0版本,价格低至行业70%,百万级特效降至“百元”
8月21日,百度蒸汽机(MuseSteamer)音视频一体化模型完成重大升级,Turbo版、Lite版、Pro版,及有声版全面开放,在行业内首次实现多人有声音视频一体化生成。 百度蒸汽机通过五大技术突破实现“需求即成片”,在生成电影级高清视频画面的同时,实现逼真环境音效、自然人物语音的同步输出。 即日起,用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户可在千帆平台享受高性能视频生成服务。
GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述
LLM驱动的AI智能体已展现出惊人潜力:它们以LLM为核心,集成感知模块(处理文本/图像/音频/视频)、规划模块(如链式思考CoT或树式思考ToT)、记忆模块(短期上下文存储与长期知识检索)和工具模块(调用API如搜索引擎或代码执行器)。 在单智能体系统中,这些组件协同工作,处理从网页导航、代码生成、投资辅助到生物医学分析的任务。 而在多智能体系统(MAS)中,智能体间通过协作(如辩论或任务分解)攻克复杂问题,模拟人类团队的群体智能。
GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类
大家好,我是肆〇柒。 今天我们要探讨一篇由 DeepMind 联合 Stanford HAI(斯坦福以人为本人工智能研究院)共同发布的重磅实证研究报告。 这份报告首次对GPT-5的空间智能能力进行了系统性、标准化的全面评估,其结论可能会更加清晰我们对当前AI能力边界的认知。
USENIX Security 25 | TEE+Legacy GPU混合算力下的模型隐私安全攻防
近日,字节跳动安全研究团队、北京大学和伊利诺伊大学香槟分校合作的研究论文《Game of Arrows: On the (In-)Security of Weight Obfuscation for On-Device TEE-Shielded LLM Partition Algorithms》被安全领域国际顶会USENIX Security收录。 USENIX Security 会议是网络与信息安全领域的四大顶级会议之一,也是中国计算机学会推荐的网络与信息安全领域A类国际学术会议。 该会议享有广泛的学术影响和深厚的学术底蕴,近五年平均录用率约为20%。
写给小白的“具身智能”入门科普
最近具身智能这个概念很火。 那么,究竟什么是具身智能? 它包括哪些类别和关键技术?
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉