资讯列表

分类

标签

伯克利&Meta面向具身智能的世界模型：让AI通过全身动作「看见」未来

伯克利&Meta面向具身智能的世界模型：让AI通过全身动作「看见」未来

本文基于 Yutong Bai、Danny Tran、Amir Bar、Yann LeCun、Trevor Darrell 和 Jitendra Malik 等人的研究工作。论文标题：Whole-Body Conditioned Egocentric Video Prediction论文地址：：：，人工智能领域一直在思考一个看似简单但非常根本的问题：如果一个智能体要在真实世界中行动、规划，并且和环境互动，它需要一个怎样的「世界模型」？在很多早期研究中，世界模型就是一个预测引擎：只要给它一个抽象的控制指令，比如「向前走一米」或者「向左转 30 度」，它就能模拟出未来的图像。

7/2/2025 8:40:00 AM

借助氛围编程用Python编写一个速读应用程序，只需15分钟

借助氛围编程用Python编写一个速读应用程序，只需15分钟

译者 | 布加迪审校 | 重楼少些滚动，多点专注。在这个用时15分钟的Python 项目中，我们将借助氛围编程编写一个简洁、无干扰的速读应用程序。想象一下：你想构建一个速读应用程序。

7/2/2025 8:38:11 AM 布加迪

1080p飞升4k，浙大开源原生超高清视频生成方案，突破AI视频生成清晰度上限

1080p飞升4k，浙大开源原生超高清视频生成方案，突破AI视频生成清晰度上限

为什么AI生成的视频总是模糊卡顿？为什么细节纹理经不起放大？为什么动作描述总与画面错位？

7/2/2025 8:30:00 AM

Meta“1亿美元年薪”震荡硅谷！奥特曼回应：总有人唯利是图，而且都算不上TOP

Meta“1亿美元年薪”震荡硅谷！奥特曼回应：总有人唯利是图，而且都算不上TOP

疯狂，太疯狂。这两天，硅谷乃至全球AI领域的注意力都被Meta老板扎克伯克带走了，毕竟也不是谁都能boss直聘，一举挖走8名OpenAI核心员工。更何况其中大部分，还是以聪明能干吃苦耐劳著称的华人研究员。

7/2/2025 8:17:58 AM 白交

当我们谈激活函数时，我们在谈什么？—— 从梯度消失到 ReLU 革命神经网络非线性的秘诀

当我们谈激活函数时，我们在谈什么？—— 从梯度消失到 ReLU 革命神经网络非线性的秘诀

激活函数本质上是神经网络的“秘密武器”，它使神经网络能够学习复杂的模式，并对现实世界中普遍存在的非线性关系进行建模。但这些函数究竟是什么，为什么它们如此重要呢？更重要的是，它们从何而来？

7/2/2025 7:30:13 AM 柏企阅文

提示工程运维崛起：应对错误输入和语境膨胀带来的隐性AI成本

提示工程运维崛起：应对错误输入和语境膨胀带来的隐性AI成本

模型提供商不断推出越来越复杂的大型语言模型(LLM)，这些模型具有更长的上下文窗口和增强的推理能力。这使得模型能够处理更多信息并进行更多“思考”，但同时也增加了计算量：模型处理和输出的信息越多，消耗的能量就越大，成本也就越高。再加上提示词调整(prompting)所涉及的反复试验——可能需要尝试几次才能得到预期结果，而且有时手头的问题根本不需要一个能像博士那样思考的模型——计算支出可能会失去控制。

7/2/2025 7:25:00 AM Taryn

网络犯罪分子将恶意AI推向新高度

网络犯罪分子将恶意AI推向新高度

网络犯罪分子已开始利用地下论坛帖子和泄露数据来优化恶意的大型语言模型(LLM)，以便为特定的诈骗方案定制AI模型，威胁情报公司Flashpoint警告称。具体而言，诈骗者正在使用恶意数据集(如泄露的凭证、诈骗脚本和信息窃取日志)对非法LLM(包括WormGPT和FraudGPT)进行微调。当对手利用这些模型生成输出时，他们会收集用户反馈来微调回应，从而形成一个恶性循环，使攻击能力随时间不断增强。

7/2/2025 7:25:00 AM John Leyden

X 平台将允许 AI 机器人撰写社区注释，由用户反馈决定相应内容是否公开展示

X 平台将允许 AI 机器人撰写社区注释，由用户反馈决定相应内容是否公开展示

X平台宣布本月将允许开发者创建AI机器人撰写社区注释，注释需经人类审核并标注“由AI撰写”。#AI社区注释# #X平台新功能#

7/2/2025 7:19:52 AM 漾仔

智能扩展之道：企业IT团队如何为AI配置恰到好处的算力

智能扩展之道：企业IT团队如何为AI配置恰到好处的算力

AI项目负责人很少会从深入讨论基础设施和硬件开始，但经验丰富的规模化实施者警告说，如果不持续战略性地关注企业级关键基础，部署高价值生产工作负载将难以圆满完成。好消息：企业越来越认识到，基础设施在推动收入增长、降低成本和提高效率的生成式、智能体及其他智能应用中发挥着关键作用。据IDC统计，到2025年，与去年同期相比，企业在AI部署的计算和存储硬件基础设施上的支出将增长97%，研究人员预测，全球在该领域的投资将从目前的1500亿美元激增至2028年的2000亿美元。

7/2/2025 7:16:00 AM Joe

CFO需要能创造价值的AI：实效指标胜过营销演示

CFO需要能创造价值的AI：实效指标胜过营销演示

近期多项调查表明，AI的蜜月期正迅速接近尾声。尽管2024年以试点项目和概念验证演示为主，但到了2025年年中，对可衡量成果的压力正不断增大，即便CFO们对AI的兴趣依然高涨。根据毕马威对300名美国金融高管的调查，投资者要求展示GenAI投资回报率的压力显著增加。

7/2/2025 7:10:00 AM James

从聊天机器人到协作伙伴：智能体如何重塑企业工作模式

从聊天机器人到协作伙伴：智能体如何重塑企业工作模式

Scott White仍然对AI从一种新奇事物迅速转变为真正的工作伙伴感到惊叹。就在一年多前，Anthropic公司的Claude AI产品负责人White还见证着早期的AI编码工具几乎无法完成一行代码，而如今，尽管他并非专业程序员，却也在亲自构建可用于生产的软件功能。 “我不再将自己的工作视为编写产品需求文档(PRD)并试图说服他人去做某事，”White表示，“我首先做的是，能否在我们的预发布服务器上构建一个可行的原型，然后分享一个它实际工作的演示。

7/2/2025 7:00:00 AM Michael

消息称三星 AI 家庭伴侣机器人 Ballie 推迟上市，预计定价超 2000 美元

消息称三星 AI 家庭伴侣机器人 Ballie 推迟上市，预计定价超 2000 美元

三星AI家庭伴侣机器人Ballie因需打磨体验推迟上市，预计定价超2000美元。这款机器人具备自然对话交互能力，可管理家居环境。未来AI技术发展后，此类产品将更具竞争力。#三星Ballie# #AI机器人#

7/2/2025 6:44:35 AM 漾仔

上万点赞！AI辅助神器Cursor助力开发效率翻倍

上万点赞！AI辅助神器Cursor助力开发效率翻倍

一、灵魂拷问 - “AI提效200%？我信你个鬼！ ”提到AI辅助开发，很多同学都吐槽过。

7/2/2025 4:00:00 AM 张晨朝

o3通关「俄罗斯方块」，碾压Gemini夺冠！UCSD新基准击碎宝可梦

o3通关「俄罗斯方块」，碾压Gemini夺冠！UCSD新基准击碎宝可梦

谁能想到，作为童年回忆的宝可梦，现在竟摇身一变，成了大模型的试金石！在无数人的童年记忆中，《宝可梦》是一款意义非凡的游戏——简单的操作哪怕是年纪尚小的孩子也能轻松上手。然而，要真正通关这款游戏，仍然需要缜密的规划和大量的时间投入。

7/2/2025 2:45:00 AM 新智元

Cursor + MCP：双剑合璧，解锁极致编程效率

Cursor + MCP：双剑合璧，解锁极致编程效率

前言近期，MCP在开发者社区中广受关注，成为业界热点。值得关注的是，Cursor编辑器在0.45.x版本中已正式加入了对MCP的支持。作为深度依赖Cursor的开发者们，理解MCP的核心概念及其应用场景，将有助于我们更高效地利用它来提升开发效率。

7/2/2025 2:10:00 AM 朱志国

小扎官宣Meta超级智能实验室，11 位 OpenAI / Anthropic 大牛火线加盟（七位华人）

小扎官宣Meta超级智能实验室，11 位 OpenAI / Anthropic 大牛火线加盟（七位华人）

据彭博社报道，Meta CEO扎克伯格宣布，对公司人工智能部门进行全面重组，成立“Meta超级智能实验室”（Meta Superintelligence Labs，简称MSL），目标是研发能够匹敌甚至超越人类的AI系统。他在内部备忘录中表示：“超级智能的实现已经开始进入视野。我相信这将是人类新纪元的开始。

7/2/2025 1:40:00 AM

人人都能轻松建模！4款大厂出品的AI建模工具深度测评

人人都能轻松建模！4款大厂出品的AI建模工具深度测评

随着生成式 AI 技术的飞速发展，3D 内容创作正迎来前所未有的变革。无论是游戏开发、影视动画、AR/VR、还是产品设计，3D 建模的时间和技术门槛一直是设计流程中的痛点。而现在，基于 AI 驱动的 3D 生成工具，正成为越来越多设计师和开发者的新利器。

7/2/2025 12:14:57 AM 58UXD 团队

保姆级教程！超详细的AI做图全流程案例演示

保姆级教程！超详细的AI做图全流程案例演示

今天给大家带来一个 APP 风格相机元素的设计，先来看图效果：效果很不错吧？马上给大家拆解制作步骤！往期教程：.

7/2/2025 12:06:02 AM 菜心¹

资讯热榜

AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉