AI
伯克利&Meta面向具身智能的世界模型:让AI通过全身动作「看见」未来
本文基于 Yutong Bai、Danny Tran、Amir Bar、Yann LeCun、Trevor Darrell 和 Jitendra Malik 等人的研究工作。 论文标题:Whole-Body Conditioned Egocentric Video Prediction论文地址:::,人工智能领域一直在思考一个看似简单但非常根本的问题:如果一个智能体要在真实世界中行动、规划,并且和环境互动,它需要一个怎样的「世界模型」? 在很多早期研究中,世界模型就是一个预测引擎:只要给它一个抽象的控制指令,比如「向前走一米」或者「向左转 30 度」,它就能模拟出未来的图像。
1080p飞升4k,浙大开源原生超高清视频生成方案,突破AI视频生成清晰度上限
为什么AI生成的视频总是模糊卡顿? 为什么细节纹理经不起放大? 为什么动作描述总与画面错位?
网络犯罪分子将恶意AI推向新高度
网络犯罪分子已开始利用地下论坛帖子和泄露数据来优化恶意的大型语言模型(LLM),以便为特定的诈骗方案定制AI模型,威胁情报公司Flashpoint警告称。 具体而言,诈骗者正在使用恶意数据集(如泄露的凭证、诈骗脚本和信息窃取日志)对非法LLM(包括WormGPT和FraudGPT)进行微调。 当对手利用这些模型生成输出时,他们会收集用户反馈来微调回应,从而形成一个恶性循环,使攻击能力随时间不断增强。
从聊天机器人到协作伙伴:智能体如何重塑企业工作模式
Scott White仍然对AI从一种新奇事物迅速转变为真正的工作伙伴感到惊叹。 就在一年多前,Anthropic公司的Claude AI产品负责人White还见证着早期的AI编码工具几乎无法完成一行代码,而如今,尽管他并非专业程序员,却也在亲自构建可用于生产的软件功能。 “我不再将自己的工作视为编写产品需求文档(PRD)并试图说服他人去做某事,”White表示,“我首先做的是,能否在我们的预发布服务器上构建一个可行的原型,然后分享一个它实际工作的演示。
上万点赞!AI辅助神器Cursor助力开发效率翻倍
一、灵魂拷问 - “AI提效200%? 我信你个鬼! ”提到AI辅助开发,很多同学都吐槽过。
Cursor + MCP:双剑合璧,解锁极致编程效率
前言近期,MCP在开发者社区中广受关注,成为业界热点。 值得关注的是,Cursor编辑器在0.45.x版本中已正式加入了对MCP的支持。 作为深度依赖Cursor的开发者们,理解MCP的核心概念及其应用场景,将有助于我们更高效地利用它来提升开发效率。
抗议者“审判”谷歌:AI 监管还不如三明治店
7月1日,谷歌旗下DeepMind伦敦办公室外遭抗议。PauseAI组织模拟法庭“审判”谷歌,指责其违背AI安全承诺。该组织指出谷歌未履行2024年承诺,监管现状差。目前正与英议会接触。#谷歌AI抗议活动#
Cloudflare 推出新举措:助力网站抵御 AI 爬虫,探索“按爬取付费”模式
互联网安全公司 Cloudflare 宣布新措施,帮网站抵御 AI 爬虫。签约新域名客户可选择是否允许访问,默认屏蔽。还启动“按爬取付费”测试,出版商可收费。目前该项目处早期,未来或演变。#Cloudflare #AI 爬虫 #按爬取付费#
苹果自研AI被爆失败!Siri拟换脑:GPT与Claude决胜负!后者开出天价:年费数十亿才给用,年年涨价!网友:这下苹果尴尬了
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)OpenAI和Claude的新一轮战争打响了! 这一次是争夺苹果Siri! 苹果终于放弃了幻想,已正式启动外部模型招标,为 Siri 提供 AI 支持。
Cursor 推出网页应用,用户可通过浏览器管理 AI 编码智能体网络
Cursor推出网页应用,用户可通过浏览器管理AI编码智能体网络,包括分配任务、监控进度等。该应用支持自然语言请求,适用于桌面和移动设备。Cursor年收入已突破5亿美元,被多家财富500强公司使用。#AI编程# #Cursor#
微软推出 AI 诊断工具 MAI-DxO:诊断复杂病例准确率 85.5%,超 21 位资深医生
微软公司昨日(6 月 30 日)发布博文,宣布推出 Microsoft AI Diagnostic Orchestrator(MAI-DxO)新 AI 工具,在诊断复杂病例方面击败了 21 位来自美国和英国,经验丰富的医生。
Meta 重组 AI 部门成立 MSL:未来几年投入数千亿美元,瞄准超级智能
彭博社今天(7 月 1 日)发布博文,报道称 Meta Platforms Inc.首席执行官马克・扎克伯格(Mark Zuckerberg)宣布重组公司人工智能部门,成立 Meta Superintelligence Labs(MSL),致力于开发能够比肩甚至超越人类能力的“超级智能”AI 系统。
小扎“挖人”超级智能团队名单泄露:华人占一半,Alexandr Wang领导
据报刚刚小扎在一份内部备忘录中,正式向员工介绍了其新组建的“超级智能”团队20几名成员,名单和简历显示,许多新入职的员工都来自AI领域的顶尖对手公司,其中华人占了快一半了整个组织命名为Meta超级智能实验室(MSL),包括所有的基础模型、产品和FAIR团队,以及一个专注于开发下一代模型的新实验室小扎向Scale AI投资了143亿美元,并聘请Scale AI CEO Alexandr Wang将担任公司的“首席AI官”并领导MSL。 同时,前GitHub CEO Nat Friedman将与Wang共同领导这个新实验室,专注于AI产品和应用研究小扎这一把砸下上百亿美金,真是下血本了,这其实也是Deepseek的威力,因为R1彻底颠覆了Meta的 llama开源模型名单以下是Zuckerberg备忘录中公布的新员工名单。 值得注意的是,这份名单并未包括从OpenAI苏黎世办公室加入的员工其中四名OpenAI华人顶尖研发领导。
只用2700万参数,这个推理模型超越了DeepSeek和Claude
大模型的架构,到了需要变革的时候? 在对复杂任务的推理工作上,当前的大语言模型(LLM)主要采用思维链(CoT)技术,但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。 近日,受到人脑分层和多时间尺度处理机制启发,来自 Sapient Intelligence 的研究者提出了分层推理模型(HRM),这是一种全新循环架构,能够在保持训练稳定性和效率的同时,实现高计算深度。
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
大模型可以不再依赖人类调教,真正“自学成才”啦? 新研究仅通过RLVR(可验证奖励的强化学习),成功让模型自主进化出通用的探索、验证与记忆能力,让模型学会“自学”! 当前主流的LLM Agent依然高度依赖于提示词工程、复杂的系统编排、甚至静态规则表,这使得它们在面对复杂任务时难以实现真正的智能行为演化。
刚刚,Meta宣布正式成立「超级智能实验室」!11人豪华团队首曝光
Meta 又有了新动向! 这几天,Meta 挖人简直挖疯了,先后夺走了 OpenAI 约十位员工,目前已公开确认有七人。 今天,据彭博社等最新消息,在周一给 Meta 员工的一份内部备忘录中,扎克伯格宣布重组公司人工智能团队(包括研究、基础设施和产品),合并到新成立的「Meta 超级智能实验室」(Meta Superintelligence Labs)。
黑化威胁操纵人类!Claude勒索,o1自主逃逸,人类「执剑人」紧急上线
我们可能都「被AI骗了」。 最先进的AI正走在一条「危险进化」的道路上,而绝大部分科学家们都被AI欺骗了! 当DeepSeek在年初将「推理过程」完全展示给世人后,我们突然发现「思考」好像也并不是人类专属的能力。
LeCun发布最新世界模型:首次实现16秒连贯场景预测,具身智能掌握第一视角!还打脸用了VAE
LeCun在干嘛呢? 就在扎克伯克亲自带队Meta的AI项目,千亿薪酬挖得硅谷人心浮动之际。 Meta在AI领域最负盛名的大佬、图灵奖得主、深度学习三巨头之一的Yann LeCun,却几乎声量全无,他没有参与LLM基础模型的研发,也开始在社交网络上消停了。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
大型语言模型
AI设计
生成式AI
搜索
视频生成
亚马逊
AI模型
DeepMind
特斯拉
场景
深度学习
Transformer
架构
Copilot
MCP
编程
视觉