AI
世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana
最新最强的开源原生多模态世界模型——北京智源人工智能研究院(BAAI)的悟界·Emu3.5来炸场了。 图、文、视频任务一网打尽,不仅能画图改图,还能生成图文教程,视频任务更是增加了物理真实性。 先感受一下它的高精度操作:一句话消除手写痕迹。
n8n + AI Agent 提示工程:2025 年最有效的实操技巧
为什么大多数 Prompting 方法会失效根据 Anthropic 的 Context Engineering 研究,在 2025 年,真正重要的不是“prompt engineering”,而是“context engineering”。 问题不再是“如何打造完美的 prompt”,而是“哪种 context 组合能引发期望的行为”。 我会带你走一遍当前研究(Anthropic、OpenAI、Google、Wharton)对 AI agent prompting 的结论——以及如何在 n8n 工作流中具体落地。
AI Agent的觉醒时刻:FlowithOS,一场数字革命的序幕
朋友们,当我们在谈论AI的时候,脑海中浮现的往往是那些能够“回答问题”、“生成内容”的强大模型。 但如果我告诉你,一场更深层次的变革正在悄然发生,AI不再满足于“动脑”,而是要“动手”了呢? 最近,AI圈子里炸开了一个重磅消息:一家名为Flowith的初创公司,在2025年10月28日,正式向世界推出了他们的全新产品——FlowithOS。
从 CIPS & CLM 迈进:中国大模型的智能跃迁
人工智能正以前所未有的速度重塑人类社会的运行逻辑。 从语言模型掀起的认知革命,到多模态、具身智能的崛起,AI 已经从“算法驱动”进入“智能共生”的新时代。 语言作为人类思维与交流的根基,也正在成为机器认知世界的核心媒介。
烧钱速度吓坏投资者:Meta、微软、谷歌 AI 支出暴增引“泡沫”质疑
10 月 30 日消息,科技巨头正押注未来人工智能的发展,其核心是依靠由成千上万台嗡嗡作响的服务器组成的庞大数据中心集群。 如今,这一雄心勃勃计划背后的惊人成本正逐渐清晰浮现,并开始考验华尔街的耐心与信心。 来自科技领域不同分支的三家领军企业 ——Alphabet 公司、Meta Platforms 公司和微软公司(Microsoft Corp.),在上个季度的资本支出总额高达约 780 亿美元(IT之家注:现汇率约合 5540.4 亿元人民币),较去年同期激增 89%。
老黄亲自站台,英伟达编程神器!Cursor 2.0自研模型狂飙4倍
Cursor迎来重大升级,2.0版本来了! 一直「套壳」的Cursor这次终于发布了首款自研编码模型Composer。 Composer的速度是同等模型的4倍。
别再迷信大模型!吴恩达亲授AI秘籍:小模型+边缘计算=财富密码
AI创业的真机遇不在「更大」,而在「更聪明」! 当巨头们在百亿美金的赛道上比拼模型参数时,真正的创业机会正在另一端悄然爆发——智能体的时代,正在打开。 这是AI世界的「中小企业革命」:它不追求通用智能的神话,而是用成千上万个专注、可靠、懂业务的智能体,去啃下那些不起眼却极其值钱的现实问题。
陶哲轩敲警钟!谷歌DeepMind联手五大神殿,用AI向世纪难题宣战
今天,谷歌DeepMind重磅发起「AI赋能数学计划」,集结了全球五大顶尖机构。 他们将用上谷歌最强数学AI,去探索发现新的疆域。 这其中,有夺下IMO金牌的Gemini Deep Think,有算法发现AI智能体AlphaEvolve,还有形式化证明自动补全AlphaProof。
Meta AI部门大地震!小扎急派心腹干将「救火」
Meta AI部门再现人事大地震! 刚刚,Meta传出重大人事调整:前元宇宙负责人Vishal Shah将转岗至Meta超级智能实验室,担任人工智能产品副总裁,并向Nat Friedman汇报。 这是Meta AI部门最新一次高管调整。
中科院联合清华等发布视觉语言行动推理模型VLA-R1,让机器人先思考再行动
还记得 DeepSeek R1吗? 它实现了大语言模型先思考再回答。 刚刚,中科院自动化所、清华和GigaAI联合发布视觉-语言-行动(Vision-Language-Action, VLA)模型的R1推理版本。
英伟达市值突破5万亿美元,推动 AI 行业蓬勃发展
英伟达(Nvidia)近日成为全球最有价值的公司,其市值突破了5万亿美元。 这一里程碑不仅标志着英伟达在市场中的主导地位,更反映了整个人工智能(AI)行业的蓬勃发展。 英伟达的图形处理单元(GPU)在过去三年里驱动了 AI 技术的快速增长,其创始人兼分析师 R "Ray" Wang 表示:“AI 的开始和结束都与英伟达息息相关。
大模型去全球接单平台赚外快,98%惨遭老板退货!ScaleAI宣布新智能体基准:AI绝对自动化几乎为0,大多知名基准过时、封闭
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)如果让大模型去外包平台去接单,它真的可以赚到钱吗? 现在终于有专业的评测机构站出来公布答案了。 不用硬夸AI,事实是让它接单,它会饿死。
当“骆驼打包行李”难倒AI:ImagerySearch如何让视频模型学会想象?
大家好,我是肆〇柒。 今天我们一起阅读一篇来自中国科学院大学(UCAS)、阿里巴巴高德地图(AMAP)与中科院智能系统与工程研究中心(CRISE) 联合团队的最新工作——《ImagerySearch: Adaptive Test-Time Search for Video Generation Beyond Semantic Dependency Constraints》。 这项研究直面当前视频生成模型在“想象力任务”中的系统性失效,提出了一种无需额外训练、仅靠测试时自适应策略即可显著提升长距离语义生成能力的新范式。
英伟达,全球首个5万亿美元公司诞生!「GPU帝国」超日本德国GDP
今夜,英伟达再次创造历史! 受GTC大会的影响,英伟达股价上涨4.15%,成为首家市值突破5万亿美元的公司! 这是一个前所未有的里程碑,不仅是英伟达,不仅是GPU芯片,更是AI时代的里程碑。
阿里新研究:统一了VLA和世界模型
如果说视觉让AI看见世界,动作让AI改变世界,那么——WorldVLA正在让AI理解世界。 顾名思义,WorldVLA是一个将视觉语言动作模型(VLA)与世界模型相融合的统一框架,由阿里巴巴达摩院、湖畔实验室和浙江大学共同提出。 在该框架下,世界模型通过结合对动作与图像的理解来预测未来图像,旨在学习环境的潜在物理规律,以提升动作生成的准确性;动作模型则基于图像观测生成后续动作,不仅有助于视觉理解,还反向促进世界模型的视觉生成能力。
估值上万亿、现金流见底:AI盛宴背后的真相没人敢说
最具价值的私有AI初创,都有谁? 投资人Deedy Das总结了目前估值最高的15家AI初创,以及最新的公开的营收和增长情况。 图片OpenAI、xAI和Anthropic毫无意外霸榜前三。
一文讲透AI Agent开发中的human-in-the-loop
前段时间确实有点忙,好久没有发文了。 不过最近有好多AI技术方面的想法要跟大家分享:-)今天我们主要聊一聊在AI Agent开发中非常重要的一个特性:human-in-the-loop。 为什么需要human-in-the-loop?
GEEKCON上的那一拳,击碎了具身智能的安全幻觉
如果上一代网络病毒的破坏还停留在“删光你的文件”,那么具身智能时代的安全威胁,可能已经升级为“砸烂你的家,甚至伤害你的人”。 当AI拥有了身体,从数字世界踏入物理世界,其安全问题也从屏幕后的隐忧,变成了房间里的“大象”——我们无法忽视,且刻不容缓。 “GEEKCON 2025”上的一拳上周的10月24号,发生在“GEEKCON 2025”安全极客大赛上的真实一幕引发了热议:两名“白帽黑客”——屈师培和徐梓凯,通过漏洞成功劫持了主办方提供的某知名品牌人形机器人,控制了机器人的“行为”。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉