应用
长城汽车在广州车展发布VLA大模型:CP Master首搭魏牌新能源,宣称“看得见危险、听得懂指令”
长城汽车在 2025 广州车展发布VLA(Vision-Language-Action)辅助驾驶大模型与CP Master系统,官方定位“听得懂指令、看得见‘看不见’的危险、会思考推理、可托付信任”四大核心能力,首搭车型锁定魏牌全新高山/蓝山,预计 2026 年Q2 开始交付。 技术细节 - 感知:前向4D毫米波 8MP视觉 激光雷达融合,暗光/雨雾识别距离提升至 250 米,可检测轮胎碎片、小动物等“异形障碍物”。 - 推理:VLA在Nvidia Drive Thor芯片运行,FP16 算力2000 TOPS,端到端多模态模型将视觉、语音与车辆动力学联合训练,支持“连续 15 步逻辑链”完成复杂变道 调速 避障。
一手实测Nano Banana Pro后,我总结了8种全新的超神玩法!
万众期待的 Nano Banana Pro,终于终于终于来了。 而这次的这玩意,不仅可以直出 4K,可以自定义比例,模型的知识推理能力和中文文字稳定性,也得到了巨幅的提升。 在玩了一个通宵后,我总结了 8 种非常有趣的玩法,毕竟时间还太短,肯定还有更多有趣有创意的玩法是我没有发现。
太猛了!Nano Banana Pro 顶级邪修玩法超全总结!
来了朋友们,之前试了一下传说中的 Nano Banana Pro 模型,发现很厉害。 现在谷歌正式发布了,藏师傅第一时间上手探索了一下。 发现这玩意太 diao 了,直接把图片模型的能力推向了顶峰,尤其是支持中文,这个对我们来说太重要了。
Vidu、Sora、Veo、可灵哪家强?2025 最新AI视频生成工具横评!
更多AI神器盘点:一、AI 广告制作实战观察:视频生成进入“量产时代”. 一则 AI 生成的电视广告引发行业关注:品牌投入百万,借助 AI 完成 70 个镜头制作。 这一案例不仅体现技术突破,也对传统广告流程带来新挑战。
附超多提示词秘籍!揭秘 Nano Banana Pro 和 Lovart 的双倍提效玩法
前天晚上谷歌推出了基于 Gemini 3 优化后的 Nano Banana Pro 模型,能力大幅提升,而且解决了多语言问题。 更多介绍:我也疯狂玩了两天,搞了一堆案例,顺便探索一下这么强的图像生成和编辑模型结合 Agent 会有什么更强的能力,结果还真让我找到几个。 可以帮你生成纸片人老婆到现实场景的照片,可以有想去哪里点哪里的打卡照,以及完爆 NotebookLM 的 PPT 生成。
杭州蚂蚁投了家腾讯系具身智能公司
Jay 发自 凹非寺. 量子位 | 公众号 QbitAI杭州蚂蚁,投了一家腾讯系具身智能公司。 刚刚,来自深圳的星尘智能再下一城,宣布完成数亿元A 轮融资。
卡帕西大模型横评方法太好玩!四大AI匿名参赛评分,最强出乎意料
鹭羽 发自 凹非寺. 量子位 | 公众号 QbitAI卡帕西又来发布趣味编程项目了~. 这次直接整了一个“大模型议会”(LLM Council)web app。
图片生成仿真!这个AI让3D资产「开箱即用」,直接赋能机器人训练
非羊 整理自 凹非寺. 量子位 | 公众号 QbitAI一张照片,就能生成可直接用于仿真的3D资产。 (没错,下图中几乎所有物体都是AI生成的)随着三维建模从传统的静态视觉效果,逐步迈向可用于仿真与交互的物理可动资产,如何直接生成具备物理属性与关节结构的3D对象,成为推动具身智能(embodied AI)发展的关键。
沈向洋解读AI演进五大维度!IDEA研究院发布“万物可抓取”模型,GPU渲染器打破国外垄断
衡宇 发自 深圳. 量子位 | 公众号 QbitAI“机会不只来自技术本身。 ”.
Gemini 3 的实力到底有多强?超多案例带你了解(附提示词)
大家应该看了很多 Gemini 3 的相关信息了,藏师傅这里就不废话了。 简单说一下它有多强,从测试基准来看直接在几乎所有基准上都达到了 SOTA,同时相当一部分大幅领先第二名,当然除了 SWE-Bench 这个。 用来验证 AI 是否脱离了“概率模仿”并开始产生“真正思考”的测试集 ARC-AGI v2 的得分上,甚至超过了现在最强模型的两倍以上,看看 Gemini 3 孤零零在的位置。
小米陈龙团队首作:统一具身与自动驾驶的开源模型
在发布多款自研大模型之后,小米又交出了一份重要成果。 小米具身智能团队正式发布了首篇论文,提出统一具身智能与自动驾驶的新模型 MiMo-Embodied。 模型在 17 项具身任务和 12 项自动驾驶任务中取得领先表现,更重要的是,它从工程层面展示了这两个长期分离的技术领域可以在同一框架下实现统一建模。
罗福莉首个小米成果!开源具身大模型
henry 发自 凹非寺. 量子位 | 公众号 QbitAI正式入职小米还不到10天,罗福莉的首篇论文,这就来了! 在这篇出自MiMo团队(主打空间智能)的研究中,罗福莉作为团队负责人担任核心作者,小米智驾团队首席科学家陈龙则作为项目负责人。
小米发布具身大模型 MiMo-Embodied 并开源
今日,小米公司正式对外发布具身大模型MiMo-Embodied,并宣布该模型将全面开源。 这一动作标志着小米在通用具身智能研究领域迈出了重要一步。 随着具身智能在家居场景的逐步落地以及自动驾驶技术的规模化应用,机器人与车辆如何更好地实现认知与能力互通,室内作业智能与室外驾驶智能能否相互促进,成为行业内亟待解决的关键问题。
Nano Banana Pro深度测评!中文字生成和多图融合能力太强了!
大家好,我是言川。 凌晨我刚躺下准备睡觉,结果就看到我期待已久的 Nano Banana 2 上线了! 记得初代小香蕉上线时也是这种情况,然后就测了一个通宵.......
3天紧急扩容8轮,蚂蚁灵光让普通人驾驭AI
2025年11月,中国AI圈有点热闹。 11月17日,阿里巴巴公测"千问"个人AI助手,直接对标ChatGPT。 目标很明确:抢AI生活入口。
具身智能大算力开发平台S600重磅亮相,地瓜机器人引领新范式
11月21日,以“无FUN不起浪”为主题的DDC2025地瓜机器人开发者大会在深圳成功举办。 作为业界领先的机器人软硬件通用底座提供商,地瓜机器人面向具身智能时代机器人对端侧算力和开发效率的极致追求,宣布全链路开发基础设施全新升级,前瞻揭晓具身智能机器人大算力开发平台S600,并宣布将于2026年第一季度正式发布;全新推出覆盖数据闭环系统、具身智能训练场、Agent开发服务的“地瓜机器人一站式开发平台”,以软硬结合、端云一体加速机器人智能进化。 S600和一站式开发平台的推出,不仅是地瓜机器人全栈软硬件技术能力与规模化量产经验的集之大成,也标志着其已构建起面向大算力通用具身机器人的软硬结合、端云一体全链路开发基础设施,持续引领机器人开发范式革新。
OpenAI CEO 薪资曝光: 2024 年收入增长显著,前董事因丑闻辞职
根据彭博社的报道,OpenAI 首席执行官萨姆・奥特曼(Sam Altman)在2024年的薪酬为113,674美元,相较于2023年的76,001美元增长了大约50%。 现年40岁的奥特曼同时也是 OpenAI 董事会的成员。 他曾表示,这一收入足以覆盖他的医疗和其他开支,并明确表示未持有 OpenAI 的股权,其财富主要来源于其他投资。
马斯克:未来五年太空 AI 算力将成新趋势,黄仁勋对此表示质疑
在近日的一次公开讲话中,特斯拉首席执行官埃隆・马斯克预测,未来 4 至 5 年内,太空中的 AI 算力将会成为最具成本效益的选择。 他认为,这得益于太空中 “免费的” 太阳能和便捷的辐射冷却方式。 马斯克提到,随着 AI 计算集群的规模不断扩大,地球的电力和散热需求将达到现有基础设施无法承受的水平。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉