AI
又一个Genie 3来了!刚上线挤爆服务器,Mirage 2把世界模型玩成在线游戏
世界模型也卷起来了! 全球首款AI原生UGC游戏引擎,2.0版本来了。 Mirage 2,一个可在线游玩的实时、通用领域生成式世界引擎。
万物转视频时代来临:Higgsfield AI让传统视频制作成为历史
想象一下这个场景:周一早上,你的老板突然说要在周三的客户会议上展示一个产品演示视频。 按照传统流程,你需要联系拍摄团队、租借设备、安排场地、后期剪辑...光是想想就头疼。 但如果我告诉你,现在只需要一张产品图片和一句描述,3分钟后就能得到好莱坞级别的视频,你会怎么想?
AI Agent接管谷歌搜索!预订餐厅、定制搜索结果,一键搞定所有事
今天凌晨,谷歌在官网宣布,谷歌搜索的AI模式新增AI Agent功能,可自动帮助用户完成预订餐厅、定制搜索结果。 例如,用户可以询问预订晚餐的餐厅,包括多种约束条件和偏好,包括人数、日期、时间、地点、口味、禁忌和偏好的菜系等。 Agent智能体会在多个预订平台和网站上搜索,找到符合用户特定需求的餐厅,并为用户呈现一个可供选择的餐厅列表,用户可以直接链接到预订页面一键完成预订。
企业实施机器学习安全运维时将面临的六大挑战
在实施AI的过程中,若企业不对其安全计划进行适应性调整,就可能面临各种新旧威胁。 机器学习安全运维(MLSecOps)通过将AI和机器学习(ML)开发与严格的安全准则相结合,解决了安全边界中的这一关键缺陷。 根据开放软件安全基金会(Open Software Security Foundation)的一份白皮书,建立稳固的MLSecOps基础对于主动降低漏洞风险和简化先前未发现缺陷的修复流程至关重要。
写给小白的“具身智能”入门科普
最近具身智能这个概念很火。 那么,究竟什么是具身智能? 它包括哪些类别和关键技术?
CIO可能无意间阻碍AI战略落地的方式
奥斯卡·王尔德曾说:“以最美好的初衷,往往做出最糟糕的作品。 ”几乎所有目睹过精心策划的AI战略突然分崩离析的CIO都会证明,善意并非成功的保证。 没有哪位CIO希望破坏或延误重要的AI计划,但这种情况发生的频率远超许多领导愿意承认的程度,因此,对AI计划进行强有力的控制,现已成为CIO的首要任务。
一张图0.1秒生成上半身3D化身!清华IDEA新框架入选ICCV 2025
一张图就能创建上半身动作视频,方法还入选了ICCV 2025! 来自清华大学、IDEA(粤港澳大湾区数字经济研究院)的研究人员提出新框架GUAVA,不需要多视角视频、不需要针对不同个体单人训练,仅需0.1秒就能从单图创建一个上半身3D化身。 通常来说,创建逼真且富有表现力的上半身人体化身(如包含细致面部表情和丰富手势),在电影、游戏和虚拟会议等领域具有重要价值。
刚刚,GPT-5 Pro自证全新数学定理!OpenAI总裁直呼颠覆,大佬们集体转发
AI真的能解决人类的前沿问题吗? 比如类似庞加莱猜想、求解麦克斯韦方程、费马大定理、黎曼猜想等问题。 今天这个问题有了答案。
三人团队击败科技巨头:RF-DETR如何成为目标检测新王者
说实话,当我看到一个仅3人团队打造的目标检测模型RF-DETR,居然能在性能上碾压Google、Meta等科技巨头的数百人研发团队时,第一反应是——这怎么可能? 但事实就是这么魔幻。 在刚刚发布的最新评测中,RF-DETR不仅成为首个在COCO数据集上突破60mAP的实时模型,更是在新发布的RF100-VL真实世界数据集上大幅领先YOLO、D-FINE等知名模型。
波士顿动力Atlas人形机器人再现逆天进化:通用AI机器人真的要来了
不是标题党,波士顿动力是真的很强,他们刚刚发布了一个视频,直接硬控我了,这是我目前看到过最震撼的人形机器人,看视频波士顿动力已经证明,可以训练出多任务、语言驱动的策略模型,来控制自家的 Atlas人形机器人完成那些既需要移动又需要灵巧全身操作的长期任务。 这种数据驱动的方法是通用的,几乎可以应用于任何能通过遥控操作演示的任务波士顿动力野心还是很大的,从一开始就想着构建通用人形机器人,波士顿动力认为未来的通用人形机器人,需要掌握一长串复杂的技能。 它们不仅要能灵巧地操作形态各异的物体(比如硬的/软的、重的/轻的、刚性的/铰接的、大的/小的),还需要协调整个身体来调整姿态、改造环境、躲避障碍,并在应对突发状况时保持平衡。
突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法
AI Agent正在被要求处理越来越多复杂的任务。 但当它要不停地查资料、跳页面、筛选信息时,显存狂飙、算力吃紧的问题就来了。 针对这一难题,MIT和新加坡国立大学联合提出了MEM1框架。
OpenAI史上最大失误:放走这位MIT学霸!美国AI「三朝元老」,现实韦小宝
AI算力竞赛,比阿波罗更庞大,比曼哈顿更疯狂! Anthropic联合创始人Tom Brown直言,AI基础设施的规模超越阿波罗与曼哈顿计划。 AGI算力投入正疯狂膨胀,每年增速高达3倍。
奥特曼首曝GPT-6,亲口承认GPT-5「搞砸了」!接入大脑读心,估值或飙破5000亿
GPT-5还没捂热,奥特曼又来捧GPT-6了。 这几天,奥特曼在旧金山的采访中表示,「人们想要记忆功能,希望未来ChatGPT能让用户自定义语气和个性」。 虽未公布下一代AI模型的具体时间,但从奥特曼口中,可以感受出GPT-6确实不一样。
Pydantic AI与MCP相逢
作为一个AI应用开发者,必须为客户构建健壮且结构良好的AI Agent。 Pydantic AI 作为一个健壮的框架彻底改变了开发人员构建、验证和部署 AI 应用程序的方式。 无论创建复杂的AI Agent,还是与MCP集成,Pydantic AI 提供了一个全面的解决方案,将 Pydantic 的可靠性与强大的AI特性相结合。
Kubernetes成本持续攀升,AI能否带来转机?
容器化应用在云端为企业带来诸多优势,但该行业一个鲜为人知的秘密是,管理这些应用的成本却并非优势之一。 根据最近的一项调查,绝大多数使用Kubernetes进行容器编排的企业在过去一年中花费更多,如今许多企业正转向AI来帮助控制成本。 Kubernetes管理供应商Spectro Cloud的调查显示,约88%的受访者表示其总拥有成本在过去一年中有所增长,而92%的受访者表示正在投资基于AI的成本优化工具。
Reddit 季度收入创历史新高,得益于人工智能
Reddit依托其独特的小众社区文化和活跃的问答氛围,正在人工智能(AI)领域实现盈利增长。 该平台的最大资产在于其用户生成的真实内容,这一优势让Reddit在与大型科技公司合作时,占据了有利位置。 公司通过 AI 授权,将平台上的子版块内容整合入搜索引擎结果中,显著提升了网站流量,并为广告主提供了精准的目标受众。
Meta AI大洗牌!超级智能一拆四,小扎押注硅谷华人,LeCun或已出局
扎克伯格,这次是铁了心了,他要All in AI,不留一点后路。 8月20号,Meta又扔下一颗炸弹! 超级智能团队,再一次大重组,短短6个月这已经是第四次重组AI团队了。
dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型
本文第一作者王文,浙江大学博士生,研究方向是多模态理解与生成等。 本文通讯作者沈春华,浙江大学求是讲席教授,主要研究课题包括具身智能、大模型推理增强、强化学习、通用感知模型等。 近年来,扩散大语言模型(Diffusion Large Language Models, dLLMs)正迅速崭露头角,成为文本生成领域的一股新势力。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉