Meta
Meta 发布基于 Code Llama 的 LLM 编译器:优化代码大小、反汇编
感谢Meta 官方在 X 平台宣布推出 LLM 编译器,这是一个基于 Meta Code Llama 构建的模型家族,具有额外的代码优化和编译器功能。这些模型可以模拟编译器,预测代码大小的最佳传递,并可反汇编代码,可以针对新的优化和编译器任务进行微调。Meta 在 HuggingFace 上公开了 LLM 编译器的 7B 和 13B 模型,采用宽松的许可协议,允许用于研究和商业用途。IT之家附链接:,LLM 在各种软件工程和编码任务中展示其能力,然而在代码和编译器优化领域的应用仍然未被充分探索。为了解决这一问题,M
6/28/2024 1:25:58 PM
沛霖(实习)
Meta 将真实照片标记为“AI 生成”,引发多名摄影师不满
据 TechCrunch 报道,多名摄影师对社交媒体巨头 Meta 旗下平台在他们上传的真实照片上添加“AI 生成”标签的做法表示不满。过去几个月里,已有摄影师分享了多个此类案例。例如,前白宫摄影师 Pete Souza 拍摄的一张篮球比赛照片,以及一张记录了加尔各答骑士队赢得印度超级联赛板球锦标赛的图片,都被 Meta 平台标记为“AI 生成”。值得注意的是,这些标签仅在手机端显示,电脑网页版并不会出现。Souza 表示他尝试取消该标签却未成功。他推测,使用 Adobe 的裁剪工具以及将图像转为 JPG 格式时进
6/25/2024 9:10:36 AM
远洋
消息称因隐私问题,苹果拒绝与 Meta 合作将其 AI 聊天机器人带入 iOS 18
感谢据彭博社报道,苹果公司因隐私问题拒绝了与 Facebook 母公司 Meta 的人工智能合作。今年 3 月,Meta 和苹果曾就可能的合作进行过简短讨论,但谈判没有取得进展,苹果也不计划将 Meta 的大型语言模型 (LLM) 集成到 iOS 系统中。IT之家注意到,上周末,《华尔街日报》暗示苹果和 Meta 正在积极讨论将 Facebook 的大型语言模型 Llama 集成到 iOS 18 的“Apple Intelligence”功能中。报道称双方仍在讨论中,尚未最终敲定。但彭博社的最新报道表明,苹果从未认
6/25/2024 6:44:37 AM
远洋
消息称苹果与 Meta 讨论合作,将生成式 AI 引入 Apple Intelligence
据“华尔街日报”报道,苹果和 Meta Platforms 讨论了人工智能方面的合作。据知情人士透露,Facebook 的母公司 Meta 已与苹果公司讨论,将 Meta 的生成式人工智能模型整合到最近发布的 Apple Intelligence 中,用于 iPhone 和其他设备。报道称,除了谷歌和 Meta,人工智能初创公司 Anthropic 和 Perplexity 也一直在与苹果商谈,希望把它们的生成式人工智能引入苹果智能系统。据IT之家此前报道,苹果在本月举行的 WWDC24 上重磅公布了 Apple
6/23/2024 5:54:41 PM
浩渺
“AI 教父”杰弗里・辛顿履新,担任绿色材料初创公司 CuspAI 董事会顾问
据《财富》杂志周二报道,“AI 教父”杰弗里・辛顿已经同意担任绿色材料初创公司 CuspAI 董事会顾问。他表示,“人类在未来十年将面临许多挑战。其中一些挑战将由 AI 引发,另一些则可以通过 AI 解决。”辛顿对这家初创公司给予了较高的评价,称该公司及其使命给自己留下了深刻印象。“他们利用 AI 为新材料设计过程提速,以应对人类最紧迫的挑战之一 —— 气候变化。”IT之家注:CuspAI 公司由剑桥大学创立,该公司计划利用搜索引擎的功能按需识别新型建筑材料所需的特性,从而帮助人们更好地发现它们。与此同时,Cusp
6/19/2024 1:57:44 PM
清源
解决Transformer根本缺陷,CoPE论文爆火:所有大模型都能获得巨大改进
即使最强大的 LLM 也难以通过 token 索引来关注句子等概念,现在有办法了。最近两天,马斯克和 LeCun 的口水战妥妥成为大家的看点。这两位 AI 圈的名人你来我往,在推特(现为 X)上相互拆对方台。LeCun 在宣传自家最新论文时,也不忘手动 @ 一把马斯克,并意味深长地嘱咐道:「马斯克,我们这项研究用来改善你家的 Grok 也没问题。」LeCun 宣传的这篇论文题目为《 Contextual Position Encoding: Learning to Count What’s Important 》,
5/31/2024 3:28:00 PM
机器之心
Meta 将使用来自欧洲用户的数据训练 AI,声称此举具有合法权益
感谢近日,美国 Meta 公司宣布将开始使用欧洲用户的数据来训练自己的人工智能,并声称此举具有合法权益。Meta 公司表示,为了帮助用户获得这些体验,现在将使用用户的信息来开发和改进 Meta 的 AI,用户有权反对将自己的信息用于这些目的。公司在隐私政策中加入更新内容,以反映这些变化。更新将于 2024 年 6 月 26 日生效。该通知已通过 Facebook 的应用内通知系统发送给欧洲用户:“我们正在为您规划新的人工智能功能。了解我们如何使用您的信息。”在此页面中,用户可以看到最新更新的隐私政策。Meta 表示
5/25/2024 1:27:08 PM
浩渺
消息称谷歌和 Meta 为训练 AI,砸钱向好莱坞电影公司购买内容
感谢AI 时代主要挑战之一,就是如何合法获取内容来训练模型,因此很多 AI 公司开始砸钱来买受版权保护的内容。在 OpenAI 和新闻集团签署多年合作之后,最新消息称 Meta 和谷歌母公司 Alphabet 正寻求和好莱坞电影公司达成协议,使用其相关内容。消息称两家巨头公司已经接触洽谈了多家好莱坞电影公司,涉及的交易高达数百万美元。这些交易可以这两家公司获得授权的视频内容,以训练他们的人工智能模型。IT之家援引该消息源,Netflix、迪斯尼和华纳兄弟等电影公司都曾参与其中。前两家都不太愿意加入,不过也没有断然拒
5/25/2024 11:42:00 AM
故渊
微软谷歌等 AI 巨头齐聚首尔:承诺安全开发人工智能模型,必要时关闭尖端系统
路透社报道,微软 、谷歌 、OpenAI 等 16 家科技公司在 21 日和 22 日举行的“人工智能(AI)首尔峰会”上承诺安全开发 AI 模型,在无法控制最极端风险的情况下关闭其尖端系统(cutting-edge systems)。参会的公司还包括国内企业智谱 AI(IT之家备注:腾讯、阿里、美团和小米曾对其投资)、IBM、亚马逊、Meta 和三星。安全承诺包括发布框架,阐明公司将如何衡量其模型的风险。在风险严重且“无法接受”的极端情况下,如果无法减轻风险,人工智能公司将不得不按下紧急停止开关,停止开发或部署其
5/22/2024 10:23:19 AM
沛霖(实习)
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
Meta FAIR 联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由于这些工作负载的规模和复杂性,导致训练大模型存在着独特的系统性挑战。最近,许多机构在训练 SOTA 生成式 AI 模型时报告了训练过程中的不稳定情况,它们通常以损失尖峰的形式出现,比如谷歌的 PaLM 模型训练过程中出现了多达 20 次的损失尖峰。数值偏差是造成这种训
5/13/2024 11:01:00 AM
机器之心
Llama3后,Meta又开放自家头显操作系统,打造元宇宙时代新安卓
虽然向第三方开放了操作系统,但 Meta 将继续开发 Quest 头显设备。Meta 誓将开放进行到底。这次把自家 VR 头显 Quest 采用的操作系统「Meta Horizon OS」向第三方硬件制造商开放了,包括华硕、联想和微软等一众企业。此举意在展示作为 MR 操作系统整合者的 Meta 对元宇宙开放的新愿景。至此,Meta 正式向实现元宇宙更开放的计算平台愿景迈出下一步。为实现该恢弘战略,Meta 同时在三方面不断发力,并竭力整合资源:向第三方硬件制造商开放 Meta Quest 设备的操作系统,为消费者
4/24/2024 11:14:00 AM
机器之心
Llama 3超大杯有何惊喜?Meta会一直开源吗?当初为何笃信元宇宙?扎克伯格新访谈回应一切
昨天凌晨,Meta 突然官宣了 Llama 3,把开源模型的实力又往上提了一截。Llama 3 总共有三个版本 ——8B、70B 和 405B。其中,8B 和 70B 版本已经开源,405B 版本仍在训练中。根据现有的评测数据,405B 版本的性能已经逼近 GPT-4(参见《开源大模型 Llama 3 王者归来!最大底牌 4000 亿参数,性能直逼 GPT-4》)。这可能促使 OpenAI 尽早发布下一代模型,从而保持其最强 AI 模型的地位。那么,这个还没有亮相的 Llama 3 405B 大模型将带来哪些惊喜?
4/22/2024 11:02:00 AM
机器之心
高通与 Meta 宣布合作,优化 Llama 3 大语言模型在智能手机等终端运行
Meta 公司昨日宣布推出下一代大语言模型 Llama 3,共有 80 亿和 700 亿参数两种版本,号称是最强大的开源大语言模型。与此同时,高通宣布支持 Meta Llama 3 在骁龙终端上运行。据介绍,双方将优化 Meta Llama 3 大语言模型(LLM)直接在智能手机、PC、VR / AR 头显和汽车等终端上的执行。开发者将能够访问高通 AI Hub 中的资源和工具,以实现在骁龙平台上优化运行 Llama 3,从而缩短产品上市时间并充分发挥终端侧 AI 的优势,包括出色的响应能力、增强的隐私性和可靠性,
4/20/2024 7:22:44 PM
浩渺
Meta AI 全球市场扩张,并上线网页版 meta.ai
Meta 公司近日宣布 Llama 3 大语言模型之外,扩展 Meta AI 服务到美国之外的 13 个国家和地区,还宣布上线专门的聊天网站:meta.ai。Meta 公司在新闻稿中表示开始在全球市场扩展 Meta AI,在澳大利亚、加拿大、南非和新加坡等国家和地区推出英语版本。IT之家附上 Meta AI 扩展的国家和地区如下澳大利亚加拿大加纳牙买加马拉维新西兰尼日利亚巴基斯坦新加坡南非乌干达赞比亚津巴布韦Meta AI 整合了 Llama 3 大语言模型,速度更快、智能性更高、功能更强,是执行各种任务的理想选择
4/19/2024 9:15:51 AM
故渊
Meta 发布 Llama 3,号称是最强大的开源大语言模型
感谢Meta 公司今天发布新闻稿,宣布推出下一代大语言模型 Llama 3,共有 80 亿和 700 亿参数两种版本,号称是最强大的开源大语言模型。Meta 声称,Llama 3 的性能优于 Claude Sonnet、Mistral Medium 和 GPT-3.5,IT之家附上 Llama 3 的主要特点如下:向所有人开放:Meta 开源 Llama 3 的 80 亿参数版本,让所有人都能接触最前沿的人工智能技术。全球各地的开发人员、研究人员和好奇心强的人都可以进行游戏、构建和实验。更聪明、更安全:Llama
4/19/2024 9:05:35 AM
故渊
Meta无限长文本大模型来了:参数仅7B,已开源
谷歌之后,Meta 也来卷无限长上下文。Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力,虽然存在线性注意力和状态空间模型等次二次解决方案,但从以往的经验来看,它们在预训练效率和下游任务准确性方面表现不佳。长文本是大语言模型一直在努力的方向。近日,谷歌提出的 Infini-Transformer 引入有效方法,可以将基于 Transformer 的大型语言模型 (LLM) 扩展到无限长输入,而不增加内存和计算需求,吸引了人们的关注。几乎就在同时,Meta 也提出了一种无限长文本技术。论
4/17/2024 5:59:00 PM
机器之心
Meta宣布全新训推一体加速器:完全集成PyTorch 2,性能3倍提升
Meta 疯狂砸入数十亿美元,一部分招揽人才,一部分造芯片。Meta 正在不遗余力地想要在生成式 AI 领域赶上竞争对手,目标是投入数十亿美元用于 AI 研究。这些巨资一部分用于招募 AI 研究员。但更大的一部分用于开发硬件,特别是用于运行和训练 Meta AI 模型的芯片。在英特尔宣布其最新人工智能加速器硬件的第二天,Meta 便迅速公布了关于芯片研发的最新成果:下一代 MTIA(Meta Training and Inference Accelerator),其中 MTIA 是专为 Meta AI 工作负载而设
4/11/2024 3:10:00 PM
机器之心
Meta 发布新一代 AI 训练与推理芯片,性能为初代芯片三倍
Meta Platforms 当地时间 10 日发布了其训练与推理加速器项目(MTIA)的最新版本,MTIA 是 Meta 专门为 AI 工作负载设计的定制芯片系列。据介绍,此次发布的新一代 MTIA 与第一代 MTIA 相比,显著改进了性能,并有助于强化内容排名和推荐广告模型。其架构从根本上侧重于提供计算、内存带宽和内存容量的适当平衡。该芯片还可帮助提高训练效率,使推理(即实际推理任务)变得更容易。Meta 在其官方博客文章中表示,“实现我们对定制芯片的雄心壮志,意味着我们不仅要投资于计算芯片,还要投资于内存带宽
4/10/2024 11:30:30 PM
清源
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
AI新词
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
Claude
腾讯
Stable Diffusion
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
AI视频
研究
大语言模型
生成
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
深度学习
架构
生成式AI
DeepMind
编程
视觉
Transformer
AI模型
预测
亚马逊
特斯拉
MCP