MetaAI
以简胜繁:Meta AI 推出 Pixio 图像模型,凭借像素重建刷新3D 重建纪录
据 AIbase 报道,Meta AI 的研究团队近日发布了一项名为 Pixio 的图像模型研究,证明了即使采用更简单的训练路径,也能在深度估计和3D 重建等复杂视觉任务中展现出卓越的性能。 长期以来,学术界普遍认为掩码自编码器(MAE)技术在场景理解上逊色于 DINOv2或 DINOv3等复杂算法,但 Pixio 的出现打破了这一固有认知。 Pixio 的核心逻辑源于对2021年 MAE 框架的深度改良。
Meta AI研发核心团队600人被裁,新成立的超级智能实验室未受影响
当地时间周三,Meta 公司发言人正式确认,其人工智能部门将裁撤约 600 名员工,覆盖 AI 基础设施搭建、基础人工智能研究及产品相关核心岗位。 值得一提的是,此次裁员涉及大量长期投身 AI 技术研发的人员,成为 Meta 近期 AI 战略调整中最受关注的 “瘦身” 动作。 微信截图_20251023092537.jpg裁员由新加入的Scale AI汪滔宣布据 Meta 内部备忘录显示,裁员决策由今年 6 月新加入的首席人工智能官汪滔(Alexandr Wang) 宣布,被裁岗位集中在 AI 技术研发的关键环节。
Meta AI 用户突破10亿,扎克伯格透露未来付费服务计划
在日前举行的 Meta 公司年度股东大会上,首席执行官马克・扎克伯格公布了一个振奋人心的消息:Meta 的人工智能助手现已吸引超过10亿的月活跃用户。 扎克伯格在大会上表示,Meta 今年的核心战略是深化用户体验,致力于将 Meta AI 发展成为行业内领先的个性化人工智能助手。 他提到,个性化、语音对话和娱乐将是今年的主要发展方向,Meta 希望通过技术创新进一步提升用户交互体验。
苹果Apple Intelligence功能受限:Meta旗下应用禁用引发AI竞争热议
根外媒报道,苹果最新推出的Apple Intelligence功能在Meta旗下应用(包括Facebook、Instagram、WhatsApp和Threads)中遭到禁用,用户无法使用其核心功能,如写作工具(Writing Tools)和自定义表情符号生成器(Genmoji)。 此举被认为与Meta推动自家Meta AI工具的战略有关,凸显了两大科技巨头在人工智能领域的激烈竞争。 Apple Intelligence功能受限详情Apple Intelligence是苹果于2024年随iOS18推出的AI功能套件,旨在通过智能写作、图像生成和个性化体验提升用户生产力。
Meta 宣布重启 AI 训练,利用欧洲用户公开内容
Meta 近日宣布,将开始使用来自欧洲用户的公开内容来训练其人工智能模型。 这一决定是对去年因数据隐私问题而暂停训练工作后的恢复。 Meta 表示,此次 AI 训练将主要依赖于在27个欧盟国家的成年用户所分享的公开帖子和评论。
Meta 测试 AI 生成 Instagram 评论功能,用户反应存疑
Meta 正在测试一项新功能,允许用户利用人工智能在 Instagram 上生成评论建议。 X 用户乔纳·曼扎诺(Jonah Manzano)发现并分享了这一测试功能,显示用户可以点击帖子下方的铅笔图标来访问 Meta AI,该 AI 会分析照片并提供三条可能的评论。 如果用户不满意,还可以刷新获取更多建议。
Meta AI时隔近一年重返欧洲,率先开放文本对话功能
在暂停近一年后,Meta宣布其AI聊天机器人Meta AI已重新登陆欧洲市场。 从本周开始,Meta AI将在包括41个欧洲国家和21个海外地区的WhatsApp、Facebook、Instagram和Messenger四大平台上推出,但初期阶段仅限于基于文本的聊天功能。 Meta AI最初于2023年在美国推出。
Meta AI 发布新型视频学习模型V-JEPA :视频理解新突破
近日,Meta AI 团队推出了视频联合嵌入预测架构(V-JEPA)模型,这一创新举措旨在推动机器智能的发展。 人类能够自然而然地处理来自视觉信号的信息,进而识别周围的物体和运动模式。 机器学习的一个重要目标是揭示促使人类进行无监督学习的基本原理。
Meta AI推出MILS系统 教导 LLMs无需专门培训即可处理多媒体数据
Meta AI的研究人员与学术伙伴共同开发了一种创新系统——MILS(多模态迭代LLM求解器),该系统能在无需经过专门训练的情况下,教大型语言模型处理图像、视频和音频。 MILS依赖于语言模型的自然问题解决能力,而非大量的数据训练,展现了其独特的优势。 MILS的工作原理是通过将两个AI模型配对来进行任务解决:一个是“生成器”,负责提出任务解决方案,另一个是“评分器”,用来评估生成方案的效果。
Meta AI 推脑机接口模型Brain2Qwerty,可通过脑电波解码打字内容
在脑 - 机接口(BCI)技术日益发展的今天,Meta AI 最新推出的 Brain2Qwerty 模型为这一领域带来了新的希望。 BCI 旨在为有言语或运动障碍的人群提供沟通手段,但传统的方法通常需要侵入性手术,比如植入电极,这不仅存在医疗风险,还需要长期维护。 因此,研究者们开始探索非侵入性的替代方案,尤其是基于脑电图(EEG)的方法。
本地构建Llama 3.2-Vision多模态LLM聊天应用实战
译者 | 朱先忠审校 | 重楼本文将以实战案例探讨如何在类似聊天的模式下从本地构建Llama3.2-Vision模型,并在Colab笔记本上探索其多模态技能。 简介视觉功能与大型语言模型(LLM)的集成正在通过多模态LLM(MLLM)彻底改变计算机视觉领域。 这些模型结合了文本和视觉输入,在图像理解和推理方面表现出令人印象深刻的能力。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉