资讯列表
伯克利&Meta面向具身智能的世界模型:让AI通过全身动作「看见」未来
本文基于 Yutong Bai、Danny Tran、Amir Bar、Yann LeCun、Trevor Darrell 和 Jitendra Malik 等人的研究工作。 论文标题:Whole-Body Conditioned Egocentric Video Prediction论文地址:::,人工智能领域一直在思考一个看似简单但非常根本的问题:如果一个智能体要在真实世界中行动、规划,并且和环境互动,它需要一个怎样的「世界模型」? 在很多早期研究中,世界模型就是一个预测引擎:只要给它一个抽象的控制指令,比如「向前走一米」或者「向左转 30 度」,它就能模拟出未来的图像。
借助氛围编程用Python编写一个速读应用程序,只需15分钟
译者 | 布加迪审校 | 重楼少些滚动,多点专注。 在这个用时15分钟的Python 项目中,我们将借助氛围编程编写一个简洁、无干扰的速读应用程序。 想象一下:你想构建一个速读应用程序。
1080p飞升4k,浙大开源原生超高清视频生成方案,突破AI视频生成清晰度上限
为什么AI生成的视频总是模糊卡顿? 为什么细节纹理经不起放大? 为什么动作描述总与画面错位?
Meta“1亿美元年薪”震荡硅谷!奥特曼回应:总有人唯利是图,而且都算不上TOP
疯狂,太疯狂。 这两天,硅谷乃至全球AI领域的注意力都被Meta老板扎克伯克带走了,毕竟也不是谁都能boss直聘,一举挖走8名OpenAI核心员工。 更何况其中大部分,还是以聪明能干吃苦耐劳著称的华人研究员。
当我们谈激活函数时,我们在谈什么?—— 从梯度消失到 ReLU 革命神经网络非线性的秘诀
激活函数本质上是神经网络的“秘密武器”,它使神经网络能够学习复杂的模式,并对现实世界中普遍存在的非线性关系进行建模。 但这些函数究竟是什么,为什么它们如此重要呢? 更重要的是,它们从何而来?
提示工程运维崛起:应对错误输入和语境膨胀带来的隐性AI成本
模型提供商不断推出越来越复杂的大型语言模型(LLM),这些模型具有更长的上下文窗口和增强的推理能力。 这使得模型能够处理更多信息并进行更多“思考”,但同时也增加了计算量:模型处理和输出的信息越多,消耗的能量就越大,成本也就越高。 再加上提示词调整(prompting)所涉及的反复试验——可能需要尝试几次才能得到预期结果,而且有时手头的问题根本不需要一个能像博士那样思考的模型——计算支出可能会失去控制。
网络犯罪分子将恶意AI推向新高度
网络犯罪分子已开始利用地下论坛帖子和泄露数据来优化恶意的大型语言模型(LLM),以便为特定的诈骗方案定制AI模型,威胁情报公司Flashpoint警告称。 具体而言,诈骗者正在使用恶意数据集(如泄露的凭证、诈骗脚本和信息窃取日志)对非法LLM(包括WormGPT和FraudGPT)进行微调。 当对手利用这些模型生成输出时,他们会收集用户反馈来微调回应,从而形成一个恶性循环,使攻击能力随时间不断增强。
X 平台将允许 AI 机器人撰写社区注释,由用户反馈决定相应内容是否公开展示
X平台宣布本月将允许开发者创建AI机器人撰写社区注释,注释需经人类审核并标注“由AI撰写”。#AI社区注释# #X平台新功能#
智能扩展之道:企业IT团队如何为AI配置恰到好处的算力
AI项目负责人很少会从深入讨论基础设施和硬件开始,但经验丰富的规模化实施者警告说,如果不持续战略性地关注企业级关键基础,部署高价值生产工作负载将难以圆满完成。 好消息:企业越来越认识到,基础设施在推动收入增长、降低成本和提高效率的生成式、智能体及其他智能应用中发挥着关键作用。 据IDC统计,到2025年,与去年同期相比,企业在AI部署的计算和存储硬件基础设施上的支出将增长97%,研究人员预测,全球在该领域的投资将从目前的1500亿美元激增至2028年的2000亿美元。
CFO需要能创造价值的AI:实效指标胜过营销演示
近期多项调查表明,AI的蜜月期正迅速接近尾声。 尽管2024年以试点项目和概念验证演示为主,但到了2025年年中,对可衡量成果的压力正不断增大,即便CFO们对AI的兴趣依然高涨。 根据毕马威对300名美国金融高管的调查,投资者要求展示GenAI投资回报率的压力显著增加。
从聊天机器人到协作伙伴:智能体如何重塑企业工作模式
Scott White仍然对AI从一种新奇事物迅速转变为真正的工作伙伴感到惊叹。 就在一年多前,Anthropic公司的Claude AI产品负责人White还见证着早期的AI编码工具几乎无法完成一行代码,而如今,尽管他并非专业程序员,却也在亲自构建可用于生产的软件功能。 “我不再将自己的工作视为编写产品需求文档(PRD)并试图说服他人去做某事,”White表示,“我首先做的是,能否在我们的预发布服务器上构建一个可行的原型,然后分享一个它实际工作的演示。
消息称三星 AI 家庭伴侣机器人 Ballie 推迟上市,预计定价超 2000 美元
三星AI家庭伴侣机器人Ballie因需打磨体验推迟上市,预计定价超2000美元。这款机器人具备自然对话交互能力,可管理家居环境。未来AI技术发展后,此类产品将更具竞争力。#三星Ballie# #AI机器人#
上万点赞!AI辅助神器Cursor助力开发效率翻倍
一、灵魂拷问 - “AI提效200%? 我信你个鬼! ”提到AI辅助开发,很多同学都吐槽过。
o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦
谁能想到,作为童年回忆的宝可梦,现在竟摇身一变,成了大模型的试金石! 在无数人的童年记忆中,《宝可梦》是一款意义非凡的游戏——简单的操作哪怕是年纪尚小的孩子也能轻松上手。 然而,要真正通关这款游戏,仍然需要缜密的规划和大量的时间投入。
Cursor + MCP:双剑合璧,解锁极致编程效率
前言近期,MCP在开发者社区中广受关注,成为业界热点。 值得关注的是,Cursor编辑器在0.45.x版本中已正式加入了对MCP的支持。 作为深度依赖Cursor的开发者们,理解MCP的核心概念及其应用场景,将有助于我们更高效地利用它来提升开发效率。
小扎官宣Meta超级智能实验室,11 位 OpenAI / Anthropic 大牛火线加盟(七位华人)
据彭博社报道,Meta CEO扎克伯格宣布,对公司人工智能部门进行全面重组,成立“Meta超级智能实验室”(Meta Superintelligence Labs,简称MSL),目标是研发能够匹敌甚至超越人类的AI系统。 他在内部备忘录中表示:“超级智能的实现已经开始进入视野。 我相信这将是人类新纪元的开始。
人人都能轻松建模!4款大厂出品的AI建模工具深度测评
随着生成式 AI 技术的飞速发展,3D 内容创作正迎来前所未有的变革。 无论是游戏开发、影视动画、AR/VR、还是产品设计,3D 建模的时间和技术门槛一直是设计流程中的痛点。 而现在,基于 AI 驱动的 3D 生成工具,正成为越来越多设计师和开发者的新利器。
保姆级教程!超详细的AI做图全流程案例演示
今天给大家带来一个 APP 风格相机元素的设计,先来看图效果:效果很不错吧? 马上给大家拆解制作步骤! 往期教程:.