AI
数百个虚拟人在线逃生!天大等发布:首个实时在线多智能体模拟方法
人群疏散模拟对于提高公共安全至关重要,也是构建逼真虚拟动态环境所需要的技术,其发展面临着复杂人类行为建模难的挑战。 现有的疏散模拟方法常以2D点表示人群,关注人群位置和轨迹,但忽略了复杂人类行为,如碰撞、交互、摔倒等,以及三维环境、个体行为能力的影响,导致模拟结果不真实。 而现有的三维运动生成方法和角色控制方法也无法同时保证实时性、合理性、个性化、动态感知、以及适用于任意场景和地形,如表1所示。
斯坦福开源复杂推理AI Agent,融合超十种工具
传统的AI助手通常依赖于单一模型或有限的工具集,难以应对需要多步推理、跨领域知识融合及高精度数据分析的任务。 例如,解决视觉谜题,需要精细图像理解和基于文本的混合推理。 为了解决这一难题,斯坦福开源了OctoTools,这是一个融合了11种不同工具专用于复杂推理的AI Agent。
仅需0.7秒单图像实时3D重建,开源扩散模型
单图像3D重建,即从单一视角的二维图像中恢复出三维物体的形状和结构,是计算机视觉领域的一项基础且极具挑战的难题。 学术界和工业界主要探索了两种不同的技术路线:基于回归的建模方法和生成式建模方法。 基于回归的方法能够高效地推断出可见表面,但在处理遮挡区域时却力不从心,常常导致表面和纹理估计不准确。
代码碾压一切!OpenAI神秘模型o3-alpha一夜刷屏,却遭41岁大神绝地反杀
OpenAI果然藏了一手。 昨天夜里,一个名为「o3-alpha-responses-2025-07-17」的神秘模型被爆出。 网友们疯狂测试后,得出一致结论,这个模型强得离谱。
谷歌AlphaFold得了诺奖,但DeepMind根本没引用前人论文?
AlphaFold因获得诺奖而声名大噪。 在大多数情况下,AlphaFold 2的预测精度几乎可与X射线晶体学相媲美,令人震撼。 生物化学界持续了半个世纪的难题,终于被攻克。
《AI 2027》揭秘:人类会被超级智能取代吗?等等,还有另一个结局!
2021年,Daniel Cocotal团队发布了一份研究报告《AI 2027》。 他以超前且精准的预测闻名,成为了洞悉AI未来发展方向的先驱。 那时ChatGPT还没问世,Daniel就准确预测了聊天机器人的崛起、耗资1亿美元的AI训练项目,以及对AI芯片的出口管制。
黄仁勋说的对!Meta绝密AGI梦之队曝光,44人天团一半来自中国
一张Meta「超级智能实验室」成员名单图,全网传疯了! 今早,硅谷VC大佬Deedy从一位匿名的Meta员工手中,获取了一份44人「顶尖天才」的绝密名单。 这份密密麻麻的列表中,详细记录了每位成员的:· 名字 国籍 工作经验· Meta目前岗位及任期· 曾任职的公司 岗位· 教育背景 专业能力小扎耗费数月的「挖人」战绩,真是令人惊叹。
ICML'25 |大模型再爆弱点!旧记忆忘不掉,新记忆分不出,准确率暴降
人们越来越意识到,大语言模型(LLM)里「找信息」这件事,并不是简单地翻字典,而和「写信息」的能力紧紧绑在一起。 一般认为,给模型塞入更长的上下文就能让它找得更准,不过上下文内部存在「互相干扰」,但这种现象却很少被研究。 为了看清这个问题,弗吉尼亚大学和纽约大学神经科学中心研究人员借用了心理学里的「前摄干扰」(proactive interference)概念:先出现的信息会妨碍我们回忆后来更新的内容。
英伟达GPU被曝严重漏洞,致模型准确率暴跌99.9%
英伟达GPU,被白帽黑客发现了严重漏洞。 通过一种名为GPUHammer的攻击方式,可以让GPU上跑的大模型,准确率从80%直接掉到0.02%,可以说是渣都不剩。 多伦多大学的研究人员形容,这种攻击就像在模型中引发灾难性的脑损伤。
陶哲轩回应OpenAI新模型IMO夺金!GPT-5测试版也曝光了
OpenAI最新模型曝光了,在2025年国际数学奥林匹克竞赛(IMO)上达到了金牌水平! IMO被公认为全球最顶尖的数学竞赛,每年只有不到8%的参赛者能够获得金牌。 而现在,一个AI模型做到了。
AI“压力面”,DeepSeek性能暴跌近30% | 清华&上海AI Lab
给AI一场压力测试,结果性能暴跌近30%。 来自上海人工智能实验室、清华大学和中国人民大学的研究团队设计了一个全新的“压力测试”框架——REST (Reasoning Evaluation through Simultaneous Testing)。 该框架在一个prompt里同时抛给模型多个问题,模拟真实世界中复杂的、多任务并行的推理场景。
大神Karpathy都投的AI实时视频生成模型:直播都能立即转,无限时长几乎零延迟
大神Karpathy都忍不住投资的AI初创,带来首个实时扩散视频生成! 用扫帚当麦克风,用盒子当混音台,无需昂贵设备就能开一场沉浸式直播。 喜欢游戏类型但不喜欢游戏的画面?
无需NeRF/高斯点后处理,视频秒变游戏模型成现实!新方法平均每帧仅需60秒 | ICCV 2025
只需一段视频,就可以直接生成可用的4D网格动画? 来自KAUST的研究团队提出全新方法V2M4,能够实现从单目视频直接生成高质量、显式的4D网格动画资源。 这意味着无需NeRF/高斯点后处理,可直接导入游戏/图形引擎。
入局 AI Infra:程序员必须了解的 AI 系统设计与挑战知识
本文将分享传统后台工程师积累的技术栈和方法论,如何延续并迁移到 AI 系统,并系统性拆解 AI Infra 的硬件、软件、训练和推理挑战。 作者 | rayrphuangAI Infra 和传统 Infra 有什么区别? 程序员积累的技术栈和方法论,如何复用到 AI 系统架构设计上?
AI视频终于告别"等等党"- MirageLSD让实时生成成为现实
昨天看到DecartAI团队在X上发布了一条消息:"我们很兴奋地推出MirageLSD:首个直播流扩散AI视频模型。 "图片说实话,刚看到这个宣传语的时候,我第一反应是又来一个宣传过度的AI工具。 但仔细研究了一下他们的技术细节,发现这次可能真的不一样。
无代码已死?不,我们要做氛围编程的杀手!微软、Mendix等众明星大佬吵起来!氛围编程是新一代的无代码!纯AI工具没有未来
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)这两年,“No Code”这个概念在开发圈几乎成了过去式。 曾经那些主打“人人都能做开发”的拖拽式平台,如今正被更炫、更快、更“聪明”的新秀——AI 工具的声浪迅速淹没。 只需对着 AI 说句话,它就能帮你造出一个应用。
零售巨头劳氏将终端用户反馈闭环与AI工具优化相衔接的成功经验
作为其更广泛业务转型战略的一部分,劳氏正利用AI来提高市场份额、改善消费体验并提升效率。 据劳氏负责AI、数据与创新的高级副总裁钱杜·奈尔(Chandhu Nair)称,该公司对这项技术并不陌生——早在ChatGPT发布前近一年,该公司就与OpenAI开展了合作——随着更多应用投入生产、内部访问权限扩大,劳氏对AI的价值尤为看好。 奈尔在接受采访时表示:“GenAI确实带来了一个巨大的市场机遇,尤其是在家居装饰领域。
英伟达推出 OpenReasoning-Nemotron 推理模型,普通游戏电脑也能玩转高级推理
AI在线 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。 该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。 通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉