AI在线 AI在线

应用

苹果:曾使用谷歌硬件来训练 Apple Intelligence 模型

苹果:曾使用谷歌硬件来训练 Apple Intelligence 模型

苹果公司周一在一篇技术论文中表示,支撑其人工智能系统 Apple Intelligence 的两个人工智能模型是在谷歌设计的云端芯片上进行预训练的。这篇名为《Apple Intelligence 基础语言模型(Apple Intelligence Foundation Language Models)》的论文详细介绍了该模型的构建过程和数据来源。论文中的一段描述暗示,苹果可能在初期阶段使用了谷歌的硬件。论文提到,苹果的基础模型(AFM)及其背后的服务器技术最初是在“v4 和 v5p 云端 TPU 集群”上构建的,使
7/30/2024 7:15:19 AM 远洋
数据安全看得见:苹果 Apple Intelligence 提供详细隐私报告

数据安全看得见:苹果 Apple Intelligence 提供详细隐私报告

苹果公司在 iOS 18.1 和 macOS Sequoia 15.1 的首个测试版中推出了名为“Apple Intelligence”的新 AI 功能的预览。该公司不仅详细介绍了这些功能的工作原理和背后的隐私机制,还允许用户查看一份详细的隐私报告,了解 Apple Intelligence 如何处理他们的请求。Apple Intelligence 是苹果对新 AI 功能的统称。例如,用户现在可以要求系统改写文本,或总结消息或电子邮件。这些功能既可以使用设备上的语言模型,也可以使用在线语言模型。为了确保用户隐私,苹
7/30/2024 6:44:15 AM 远洋
别认为对话式交互是进步!详解对话式交互的6大缺点

别认为对话式交互是进步!详解对话式交互的6大缺点

最近两年很多 AI 产品出现之后都采用了对话式(Chat)的形式。导致很多人认为对话形式(Chat)交互相对于常见的图形化界面是一种进步。事实并非如此。 这种错误认知可能因为把 AI 技术与对话式交互画上了等号,在看到 AI 技术迅猛发展的时候。就同样认为对话式更优秀。 但这种交互形式被众多 AI 产品使用的原因只是因为这一波 AI 浪潮最大的技术进步是大语言模型。而大语言模型的核心功能之一就是生成内容。加上 OpenAI 最早使用了这种形式被后来者效仿。 在 2017 年前后上一波 AI 浪潮中,主要的技术发展方
7/30/2024 6:43:55 AM 杜昭⁰
因用户数据自动被用于训练 xAI, X(推特)面临欧洲监管机构质询

因用户数据自动被用于训练 xAI, X(推特)面临欧洲监管机构质询

感谢据《金融时报》当地时间周六报道,欧洲数据保护监管机构正在“寻求澄清”埃隆・马斯克的 X(推特)决定允许用户数据自动输入其人工智能初创公司 xAI 的举动,此举对该平台提出了新的监管审查。AI在线附事件背景:当地时间上周五,X 用户发现他们已“自动选择”将其帖子以及与 xAI 旗下 Grok 聊天机器人的互动用于“训练和微调”xAI 系统,此举是在未事先获得用户明确同意的情况下进行的数据共享。但是,用户只能通过 X 的桌面版本中进行设置,目前无法通过移动端 App 选择拒绝。负责执行欧盟隐私法的爱尔兰数据保护委员
7/29/2024 7:50:26 PM 清源
Llama3.1 训练平均 3 小时故障一次,H100 万卡集群好脆弱,气温波动都会影响吞吐量

Llama3.1 训练平均 3 小时故障一次,H100 万卡集群好脆弱,气温波动都会影响吞吐量

每 3 个小时 1 次、平均 1 天 8 次,Llama 3.1 405B 预训练老出故障,H100 是罪魁祸首?最近有人从 Meta 发布的 92 页超长 Llama 3.1 论文中发现了华点:Llama 3.1 在为期 54 天的预训练期间,经历了共 466 次任务中断。其中只有 47 次是计划内的,419 次纯属意外,意外中 78% 已确认或怀疑是硬件问题导致。而且 GPU 问题最严重,占了 58.7%。Llama 3.1 405 模型是在一个含 16384 块 Nvidia H100 80GB GPU 集群
7/29/2024 5:54:34 PM 清源
GPT-4o mini 凭什么登顶竞技场?OpenAI 刷分秘诀被扒,原来奥特曼早有暗示

GPT-4o mini 凭什么登顶竞技场?OpenAI 刷分秘诀被扒,原来奥特曼早有暗示

为啥 GPT-4o mini 能登顶大模型竞技场??原来是 OpenAI 会刷分呀。这两天,lmsys 竞技场公布了一份充满争议的榜单。其中才面世不久的 GPT-4o mini 和满血版并列第一,把 Claude 3.5 Sonnet 甩在身后。结果网友炸锅了,大家凭体感觉得这不可能。哪怕后面 lmsys 做过一次声明,表示大家别只看总榜,还要更关注细分领域的情况。也没能让大家满意,不少人觉得 lmsys 就是从 OpenAI 那收钱了。终于,官方晒出了一份完整数据,展示了 GPT-4o mini 参与的 1000
7/29/2024 5:49:58 PM 远洋
英伟达最新技术分享:手把手教你用 Llama 3.1 合成数据改进模型!附代码

英伟达最新技术分享:手把手教你用 Llama 3.1 合成数据改进模型!附代码

适逢 Llama 3.1 模型刚刚发布,英伟达就发表了一篇技术博客,手把手教你如何好好利用这个强大的开源模型,为领域模型或 RAG 系统的微调生成合成数据。Epoch AI 上个月刚刚发文预言「数据墙」迫近,结果英伟达转头就甩出了 340B 开源巨兽 Nemotron。真实数据稀缺可能不再是问题了,Nemotron 9T token 的预训练预料中,98% 都是合成数据。也许你还对合成数据存在顾虑,或者不知道如何应用 LLM 驱动数据生成。或许,英伟达的这篇博客可以提供答案。原文地址:,用 LLM 合成数据的本质究
7/29/2024 4:20:08 PM 清源
智谱获华策 1 亿元战略投资,打造影视 AI 研究平台;杨红霞入职香港理工大学;蔚来发布中国首个智能驾驶世界模型丨AI情报局

智谱获华策 1 亿元战略投资,打造影视 AI 研究平台;杨红霞入职香港理工大学;蔚来发布中国首个智能驾驶世界模型丨AI情报局

今日融资快报智谱华章获得浙江华策投资战略投资智谱华章是一家AI知识智能技术开发商,由清华大学计算机系知识工程实验室的技术成果转化而来。 智谱宣布获得浙江华策投资有限公司的战略投资。 华策影视全资子公司华策投资拟与海南智桥共同设立盐城智华创业投资基金,华策投资以自有资金出资1亿元,占比99.99%。
7/29/2024 4:05:00 PM 我在思考中
智平方打通具身智能核心痛点:将AGI拓展到物理世界

智平方打通具身智能核心痛点:将AGI拓展到物理世界

近日,清华大学五道口金融学院“金融PLUS系列产业峰会2024·人工智能赋能千行百业”盛大举办。智平方(深圳)科技有限公司(以下简称智平方)创始人兼CEO郭彦东博士受邀出席,并与工信部原副部长杨学山,中国科学院院士、清华大学人工智能研究院名誉院长张钹,百川智能创始人兼CEO王小川,易显智能创始人兼董事长马宏等参会嘉宾一道,同探讨人工智能赋能实体经济、推动实体经济高质量发展之路。第三代人工智能的发展趋势是从数字世界AGI到物理世界AGI大语言模型问世标志着第三代人工智能时代大幕开启,人工智能从特定领域、特定算法、完成
7/29/2024 3:15:00 PM 新闻助手
日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?

日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?

2024 年的 AI 图像生成技术,又提升到了一个新高度。技术的飞速迭代,让这一领域的商业化落地进入加速阶段。前有 Midjourney v6 史诗级更新,后有开源巨头 Stable Diffusion 3 独领风骚,而 DALL・E 3 背靠 ChatGPT 这棵「大树」,也收获了众多用户的关注。当然了,在这条赛道上,来自国内的选手毫不逊色。近日,国产大模型「顶流」—— 字节跳动豆包大模型,迎来一场集中放送:在 2024 火山引擎 AI 创新巡展成都站活动上,豆包大模型团队公布了豆包大模型的最新进展,以及文生图模
7/29/2024 1:22:00 PM 机器之心
私有数据、删掉的内容可以永久访问,GitHub官方:故意设计的

私有数据、删掉的内容可以永久访问,GitHub官方:故意设计的

最近,一个消息震惊开源社区:在 GitHub 上删掉的内容、私有存储库的数据都是可以永久访问的,而且这是官方故意设计的。开源安全软件公司 Truffle Security 在一篇博客中详细描述了这个问题。Truffle Security 引入了一个新术语:CFOR(Cross Fork Object Reference):当一个存储库 fork 可以访问另一个 fork 中的敏感数据(包括来自私有和已删除 fork 的数据)时,就会出现 CFOR 漏洞。与不安全的直接对象引用类似,在 CFOR 中,用户提供提交(c
7/29/2024 1:15:00 PM 机器之心
标签贴错,AMD召回所有新一代CPU

标签贴错,AMD召回所有新一代CPU

因为有 typo,召回所有已铺货芯片。上个月,AMD 首席执行官苏姿丰博士在 ComputeX 开幕主题演讲上揭开了 Zen 5 架构的神秘面纱。作为 AMD 未来几年 CPU 的台柱子,Zen 5 立刻被引入消费级市场,面向笔记本和台式机的产品在几周内相继发布。然而临近上市日期,AMD 突然宣布,由于「对 Ryzen 9000 系列处理器的包装产品测试流程」存在问题,其将推迟数周推出搭载 Zen 5 的 Ryzen 9000 处理器。由于最近英特尔酷睿芯片曝出问题,人们对高端芯片质量的关注度很高,AMD 的这一消
7/29/2024 1:10:00 PM 机器之心
AI 歌曲生成神器 Udio 重磅更新!可拆分音轨/控制音调/中文优化明显

AI 歌曲生成神器 Udio 重磅更新!可拆分音轨/控制音调/中文优化明显

大家好,这里是和你们一起探索 AI 的花生~ 之前为大家推荐过的 AI 歌曲生成神器 Udio 最近推出了最新的 v1.5 模型,整体生成质量比之前有了大幅提升;还新增了音调控制、音轨拆分、音乐视频一键分享等新功能,使用更方便;中文歌曲的表现也比之前好很多,今天就一起来看看此次更新的具体细节。 还不了解 Udio 小伙伴可以先看这里:一、生成质量整体大提升 Udio 官网直达: 在 4 月份刚推出的时候,Udio 虽然在歌曲质量上令人惊艳,但是只能生成 32s 的音乐片段,无法直接构成一首完整的歌曲,因此整体效果
7/29/2024 7:31:51 AM 夏花生
让输出结果更稳定!超好用的 GPTs “窗口定向”策略

让输出结果更稳定!超好用的 GPTs “窗口定向”策略

在前面几篇我分别讲解了 GPT 的基本使用、高阶技巧和 GPTs 的创建。GPTs 确实很好用,当我们预设好 prompt,可以创建一个个专属的、定向输出的 GPT 助手。然而,我在使用 GPTs 的过程中遇到了一个问题:每次使用自己创建的 GPTs 时,输出的结果仍存在随机性,难以保证一致的格式和风格。这增加了我对预设 Prompt 的顾虑,我开始的时候怀疑是因为我的 Prompt 定义的不够清楚,开始反复调试,并针对输出格式做三令五申般的限制,但在测试中仍然发现 GPT 的输出具有不稳定性。 为了应对这一问题,
7/29/2024 12:12:53 AM 小普
AI有哪些提高效率的落地应用场景?实战案例来了!

AI有哪些提高效率的落地应用场景?实战案例来了!

如果说今年的风口,那一定是 AI。不过 AI 像一把双刃剑,既有助益也有风险。我们将从 IBM Watson 的高飞与坠落,到 Google Allo 的黯然失色,探索 AI 应用中的教训。同时,瑞幸咖啡的成功故事展现了凭借策略得当的 AI 应用,即使在困境中也能崛起。通过 ChatGPT 实践案例,我们进一步揭示 AI 在日常工作中的潜能,从 PRD 文档编写到内容管理的自动化。最后,我们讨论如何与 AI 高效交流,确保 AI 是成为推动进步的力量而非阻碍。在整篇文章中,我将分享 AI 的正确应用价值,和如何嵌入
7/29/2024 12:02:29 AM 小普
防不胜防:黑客可利用 AI 通过 HDMI 线远程窃取屏幕信息

防不胜防:黑客可利用 AI 通过 HDMI 线远程窃取屏幕信息

乌拉圭的研究人员发现,黑客可以使用人工智能通过拦截电脑显示器和主机之间 HDMI 线缆泄露的电磁辐射来窥探屏幕内容。他们表示,这种攻击可能已经存在,但普通家庭电脑用户不必过于担心。图源 Pexels据AI在线了解,攻击者可以通过多种方式实施攻击,包括使用放置在建筑物外的天线来拦截 HDMI 线缆的信号,这种间谍活动通过拦截从电脑 HDMI 线缆泄露的电磁辐射进行。研究人员表示,虽然数字视频传输比模拟信号复杂得多,但仍然存在可乘之机。乌拉圭共和国大学的费德里科・拉罗卡和他的团队开发了一种人工智能模型,可以从几米外的泄
7/28/2024 9:39:25 PM 远洋
Meta 训练 Llama 3 遭遇频繁故障:16384 块 H100 GPU 训练集群每 3 小时“罢工”一次

Meta 训练 Llama 3 遭遇频繁故障:16384 块 H100 GPU 训练集群每 3 小时“罢工”一次

Meta 发布的一份研究报告显示,其用于训练 4050 亿参数模型 Llama 3 的 16384 个英伟达 H100 显卡集群在 54 天内出现了 419 次意外故障,平均每三小时就有一次。其中,一半以上的故障是由显卡或其搭载的高带宽内存(HBM3)引起的。由于系统规模巨大且任务高度同步,单个显卡故障可能导致整个训练任务中断,需要重新开始。尽管如此,Meta 团队还是保持了 90% 以上的有效训练时间。AI在线注意到,在为期 54 天的预预训练中,共出现了 466 次工作中断,其中 47 次是计划中断,419 次
7/28/2024 7:20:54 PM 远洋
阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进

阿里大模型元老杨红霞去向官宣:入职香港高校!被曝创业项目也在推进

最新消息,阿里大模型元老杨红霞入职香港理工大学,任电子计算机系教授。杨红霞是 AI 领域知名科学家。她曾在 IBM T.J.沃森研究中心担任研究人员,并在雅虎担任首席科学家。2016 年加入阿里巴巴,就职于达摩院智能计算实验室;2023 年 3 月入职字节跳动。她在达摩院期间领导了通义千问前身 M6 大模型的研发,是 M6 大模型从百亿、千亿参数量进化到万亿规模的主要功臣,并领导通义大模型核心技术“统一学习范式 OFA-M6”的开发。任职字节期间,她主要负责大模型研发,向字节 AML 和豆包大模型 Foundati
7/28/2024 5:47:12 PM 远洋