Meta
因监管问题,Meta 将不会在欧盟发布新的多模态 AI 模型
据 Axios 报道,Meta 在一份声明中表示,他们即将发布一个多模态的 Llama 模型,但由于监管环境的不确定性,该模型不会在欧盟发布。Meta 表示,这一决定也意味着即使在开放许可下发布,欧盟的客户和公司也无法使用多模态模型,Meta 将向欧盟的客户和公司提供仅支持文本(text only)的 Llama 3 模型。报道称,Meta 的问题不在于《人工智能法案》,而在于如何在遵守《通用数据保护条例》(GDPR)的同时,使用欧盟客户的数据来训练模型。Meta 表示使用当地数据进行训练,对于确保其产品正确反映该
7/18/2024 9:01:21 AM
沛霖(实习)
“最强开源 AI 模型”,4050 亿参数版 Meta Llama 3 被曝 7 月 23 日发布
感谢科技媒体 The Information 本周五发布博文,援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B,在现有 80 亿和 700 亿参数两个版本之外,推出 4050 亿参数版本,号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时,扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型,但当时没有透露太多的信息。AI在线注:上图为机翻字幕,存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型,
7/13/2024 8:09:19 AM
故渊
不到60秒就能生成3D「手办」,Meta发力3D生成,ChatGPT时刻要来了吗?
3D 生成,一直在等待它的「ChatGPT时刻」。一直以来,创作 3D 内容是设计和开发视频游戏、增强现实、虚拟现实以及影视特效中最重要的部分。然而,3D 生成具有独特而艰巨的挑战,这是图像和视频等其他生成内容所不具备的。首先,3D 内容在艺术质量、生成速度、3D 网格结构和拓扑质量、UV 贴图结构以及纹理清晰度和分辨率方面具有严格的标准;其次,与其他研究相比,可用的数据量少。虽然该领域有数十亿张图像和视频可供学习,但可用于训练的 3D 内容数量要少三到四个数量级。因此,现阶段的3D 生成还必须从非 3D 的图像和
7/4/2024 5:55:00 PM
机器之心
巴西政府机构出手,禁止 Meta 公司使用用户数据训练生成式 AI 模型
感谢据美联社报道,巴西国家数据保护局当地时间周二(2 日)认定,拥有 Facebook、Instagram、WhatsApp 等平台的社交网络巨头 Meta 将不得使用来自巴西的数据来训练其生成式 AI 模型。Meta 近期更新了隐私政策,允许公司可将人们的公开帖子用于训练其模型。根据巴西国家数据保护局的公报,Meta 此举将会对受影响数据主体的基本权利造成严重的、不可挽回的或难以修复的损害,此次下达的禁令是“预防性措施”。巴西是 Meta 的最大市场之一。在该国 2.03 亿的总人口(IT之家注:数据来自 202
7/3/2024 7:16:46 PM
清源
Meta 发布 3D Gen AI 模型:1 分钟内生成高质量 3D 内容
Meta 公司昨日(7 月 2 日)发布研究论文,介绍了名为 Meta 3D Gen(3DGen)的全新 AI 模型,可以在 1 分钟内基于用户输入的提示词,生成高质量的 3D 内容。Meta 公司表示 Meta 3D Gen(3DGen)所生成的 3D 内容具备高分辨率纹理和材质贴图,还支持基于物理的渲染(PBR),并能对此前生成的 3D 内容重新再生成新纹理。IT之家援引论文主要内容,Meta 3D Gen 包含 text-to-3D 生成和 text-to-texture 生成两个主要组件,其工作原理如下:第
7/3/2024 10:47:25 AM
故渊
Meta 推出 LLM Compiler 代码优化模型,可搭配其他 AI 改善代码生成 / 编译能力
Meta 前天推出了一款名为“LLM Compiler”的模型,该模型基于 Meta 现有的 Code Llama 打造,主打代码优化,目前相关模型已登陆 Hugging Face,提供 70 亿参数及 130 亿参数两个版本,允许学术及商业使用,IT之家附项目地址如下:点此访问。Meta 认为,尽管业界各大语言模型已在各种编程代码任务中展现了出色的能力,但此类模型在代码优化还有进步空间,目前推出的 LLM Compiler 模型便是一款专为优化代码任务设计的预训练模型,能够模拟编译器对代码进行优化,或将“已经过优
6/30/2024 5:47:55 PM
漾仔
Meta 发布基于 Code Llama 的 LLM 编译器:优化代码大小、反汇编
感谢Meta 官方在 X 平台宣布推出 LLM 编译器,这是一个基于 Meta Code Llama 构建的模型家族,具有额外的代码优化和编译器功能。这些模型可以模拟编译器,预测代码大小的最佳传递,并可反汇编代码,可以针对新的优化和编译器任务进行微调。Meta 在 HuggingFace 上公开了 LLM 编译器的 7B 和 13B 模型,采用宽松的许可协议,允许用于研究和商业用途。IT之家附链接:,LLM 在各种软件工程和编码任务中展示其能力,然而在代码和编译器优化领域的应用仍然未被充分探索。为了解决这一问题,M
6/28/2024 1:25:58 PM
沛霖(实习)
Meta 将真实照片标记为“AI 生成”,引发多名摄影师不满
据 TechCrunch 报道,多名摄影师对社交媒体巨头 Meta 旗下平台在他们上传的真实照片上添加“AI 生成”标签的做法表示不满。过去几个月里,已有摄影师分享了多个此类案例。例如,前白宫摄影师 Pete Souza 拍摄的一张篮球比赛照片,以及一张记录了加尔各答骑士队赢得印度超级联赛板球锦标赛的图片,都被 Meta 平台标记为“AI 生成”。值得注意的是,这些标签仅在手机端显示,电脑网页版并不会出现。Souza 表示他尝试取消该标签却未成功。他推测,使用 Adobe 的裁剪工具以及将图像转为 JPG 格式时进
6/25/2024 9:10:36 AM
远洋
消息称因隐私问题,苹果拒绝与 Meta 合作将其 AI 聊天机器人带入 iOS 18
感谢据彭博社报道,苹果公司因隐私问题拒绝了与 Facebook 母公司 Meta 的人工智能合作。今年 3 月,Meta 和苹果曾就可能的合作进行过简短讨论,但谈判没有取得进展,苹果也不计划将 Meta 的大型语言模型 (LLM) 集成到 iOS 系统中。IT之家注意到,上周末,《华尔街日报》暗示苹果和 Meta 正在积极讨论将 Facebook 的大型语言模型 Llama 集成到 iOS 18 的“Apple Intelligence”功能中。报道称双方仍在讨论中,尚未最终敲定。但彭博社的最新报道表明,苹果从未认
6/25/2024 6:44:37 AM
远洋
消息称苹果与 Meta 讨论合作,将生成式 AI 引入 Apple Intelligence
据“华尔街日报”报道,苹果和 Meta Platforms 讨论了人工智能方面的合作。据知情人士透露,Facebook 的母公司 Meta 已与苹果公司讨论,将 Meta 的生成式人工智能模型整合到最近发布的 Apple Intelligence 中,用于 iPhone 和其他设备。报道称,除了谷歌和 Meta,人工智能初创公司 Anthropic 和 Perplexity 也一直在与苹果商谈,希望把它们的生成式人工智能引入苹果智能系统。据IT之家此前报道,苹果在本月举行的 WWDC24 上重磅公布了 Apple
6/23/2024 5:54:41 PM
浩渺
“AI 教父”杰弗里・辛顿履新,担任绿色材料初创公司 CuspAI 董事会顾问
据《财富》杂志周二报道,“AI 教父”杰弗里・辛顿已经同意担任绿色材料初创公司 CuspAI 董事会顾问。他表示,“人类在未来十年将面临许多挑战。其中一些挑战将由 AI 引发,另一些则可以通过 AI 解决。”辛顿对这家初创公司给予了较高的评价,称该公司及其使命给自己留下了深刻印象。“他们利用 AI 为新材料设计过程提速,以应对人类最紧迫的挑战之一 —— 气候变化。”IT之家注:CuspAI 公司由剑桥大学创立,该公司计划利用搜索引擎的功能按需识别新型建筑材料所需的特性,从而帮助人们更好地发现它们。与此同时,Cusp
6/19/2024 1:57:44 PM
清源
解决Transformer根本缺陷,CoPE论文爆火:所有大模型都能获得巨大改进
即使最强大的 LLM 也难以通过 token 索引来关注句子等概念,现在有办法了。最近两天,马斯克和 LeCun 的口水战妥妥成为大家的看点。这两位 AI 圈的名人你来我往,在推特(现为 X)上相互拆对方台。LeCun 在宣传自家最新论文时,也不忘手动 @ 一把马斯克,并意味深长地嘱咐道:「马斯克,我们这项研究用来改善你家的 Grok 也没问题。」LeCun 宣传的这篇论文题目为《 Contextual Position Encoding: Learning to Count What’s Important 》,
5/31/2024 3:28:00 PM
机器之心
Meta 将使用来自欧洲用户的数据训练 AI,声称此举具有合法权益
感谢近日,美国 Meta 公司宣布将开始使用欧洲用户的数据来训练自己的人工智能,并声称此举具有合法权益。Meta 公司表示,为了帮助用户获得这些体验,现在将使用用户的信息来开发和改进 Meta 的 AI,用户有权反对将自己的信息用于这些目的。公司在隐私政策中加入更新内容,以反映这些变化。更新将于 2024 年 6 月 26 日生效。该通知已通过 Facebook 的应用内通知系统发送给欧洲用户:“我们正在为您规划新的人工智能功能。了解我们如何使用您的信息。”在此页面中,用户可以看到最新更新的隐私政策。Meta 表示
5/25/2024 1:27:08 PM
浩渺
消息称谷歌和 Meta 为训练 AI,砸钱向好莱坞电影公司购买内容
感谢AI 时代主要挑战之一,就是如何合法获取内容来训练模型,因此很多 AI 公司开始砸钱来买受版权保护的内容。在 OpenAI 和新闻集团签署多年合作之后,最新消息称 Meta 和谷歌母公司 Alphabet 正寻求和好莱坞电影公司达成协议,使用其相关内容。消息称两家巨头公司已经接触洽谈了多家好莱坞电影公司,涉及的交易高达数百万美元。这些交易可以这两家公司获得授权的视频内容,以训练他们的人工智能模型。IT之家援引该消息源,Netflix、迪斯尼和华纳兄弟等电影公司都曾参与其中。前两家都不太愿意加入,不过也没有断然拒
5/25/2024 11:42:00 AM
故渊
微软谷歌等 AI 巨头齐聚首尔:承诺安全开发人工智能模型,必要时关闭尖端系统
路透社报道,微软 、谷歌 、OpenAI 等 16 家科技公司在 21 日和 22 日举行的“人工智能(AI)首尔峰会”上承诺安全开发 AI 模型,在无法控制最极端风险的情况下关闭其尖端系统(cutting-edge systems)。参会的公司还包括国内企业智谱 AI(IT之家备注:腾讯、阿里、美团和小米曾对其投资)、IBM、亚马逊、Meta 和三星。安全承诺包括发布框架,阐明公司将如何衡量其模型的风险。在风险严重且“无法接受”的极端情况下,如果无法减轻风险,人工智能公司将不得不按下紧急停止开关,停止开发或部署其
5/22/2024 10:23:19 AM
沛霖(实习)
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
Meta FAIR 联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由于这些工作负载的规模和复杂性,导致训练大模型存在着独特的系统性挑战。最近,许多机构在训练 SOTA 生成式 AI 模型时报告了训练过程中的不稳定情况,它们通常以损失尖峰的形式出现,比如谷歌的 PaLM 模型训练过程中出现了多达 20 次的损失尖峰。数值偏差是造成这种训
5/13/2024 11:01:00 AM
机器之心
Llama3后,Meta又开放自家头显操作系统,打造元宇宙时代新安卓
虽然向第三方开放了操作系统,但 Meta 将继续开发 Quest 头显设备。Meta 誓将开放进行到底。这次把自家 VR 头显 Quest 采用的操作系统「Meta Horizon OS」向第三方硬件制造商开放了,包括华硕、联想和微软等一众企业。此举意在展示作为 MR 操作系统整合者的 Meta 对元宇宙开放的新愿景。至此,Meta 正式向实现元宇宙更开放的计算平台愿景迈出下一步。为实现该恢弘战略,Meta 同时在三方面不断发力,并竭力整合资源:向第三方硬件制造商开放 Meta Quest 设备的操作系统,为消费者
4/24/2024 11:14:00 AM
机器之心
Llama 3超大杯有何惊喜?Meta会一直开源吗?当初为何笃信元宇宙?扎克伯格新访谈回应一切
昨天凌晨,Meta 突然官宣了 Llama 3,把开源模型的实力又往上提了一截。Llama 3 总共有三个版本 ——8B、70B 和 405B。其中,8B 和 70B 版本已经开源,405B 版本仍在训练中。根据现有的评测数据,405B 版本的性能已经逼近 GPT-4(参见《开源大模型 Llama 3 王者归来!最大底牌 4000 亿参数,性能直逼 GPT-4》)。这可能促使 OpenAI 尽早发布下一代模型,从而保持其最强 AI 模型的地位。那么,这个还没有亮相的 Llama 3 405B 大模型将带来哪些惊喜?
4/22/2024 11:02:00 AM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉