AI在线 AI在线

应用

AI 训 AI 遭投毒 9 次后大崩溃,牛津剑桥等发现登 Nature 封面

感谢AI在线网友 刺客 的线索投递!用 AI 生成的数据训练 AI,模型会崩溃?牛津、剑桥、帝国理工、多伦多大学等机构的这篇论文,今天登上了 Nature 封面。如今,LLM 已经强势入侵了人类的互联网,极大地改变了在线文本和图像的生态系统。如果网络上的大部分文本都是 AI 生成的,我们用网络数据训练出的 GPT-n,会发生什么?论文地址:,如果在训练中不加区别地使用 AI 产生的内容,模型就会出现不可逆转的缺陷 —— 原始内容分布的尾部(低概率事件)会消失!这种效应,被称为「模型崩溃」。换句话说,合成数据就像是近
7/25/2024 4:41:11 PM
汪淼

豆包大模型日均Tokens使用量破5000亿,模型家族再升级

7月25日,火山引擎2024“AI创新巡展”首站成都站透露了字节豆包大模型的最新进展:截至7月,豆包大模型日均Tokens使用量已突破5000亿,平均每家企业客户日均Tokens使用量较5月15日模型发布时期增长22倍。豆包大模型由字节跳动自研,原名“云雀”,是国内首批通过算法备案的大模型之一,目前通过字节跳动旗下云服务平台火山引擎面向企业提供服务。自发布之初,豆包大模型便主打使用量大、应用场景丰富。据火山引擎副总裁张鑫介绍,在字节内部,有超过50多个业务在使用豆包大模型,覆盖了协同办公、数据分析、文案创作、辅助编
7/25/2024 3:47:00 PM
新闻助手

消息称 OpenAI 公司 2024 年资金缺口达到 50 亿美元

科技媒体 The Information 昨日(7 月 24 日)发布博文,爆料称 OpenAI 目前用于 AI 推理的算力,预估相当于 35 万台包含英伟达 A100 芯片的服务器,其中约 29 万台用于 ChatGPT,而且近乎满负荷运行。报道称截至今年 3 月,OpenAI 公司花费近 40 亿美元使用微软服务器为 ChatGPT 运行推理工作负载;此外 OpenAI 今年训练 ChatGPT 以及新 AI 模型的成本预估达到 30 亿美元,因此训练和推理 AI 的成本可能达到 70 亿美元(AI在线备注:当
7/25/2024 2:57:08 PM
故渊

字节大模型同传智能体,一出手就是媲美人类的同声传译水平

无论是语速超快、发音复杂的绕口令,还是精妙绝伦的文言文,又或是充满即兴和灵感的随意聊天,模型都能流畅自然地给出准确而地道的翻译结果。近年来,人工智能(Aritificial Intelligence, AI),尤其是以大语言模型(Large Language Models, LLMs)为代表的 AI 正以惊人的速度发展,这些模型在多种自然语言处理任务中展现了卓越的能力。然而,尽管在许多领域取得了突破,代表着人类顶尖语言水平的同声传译(Simultaneous Interpretation, SI)依然是一个未被完全
7/25/2024 2:06:00 PM
机器之心

Nature封面:AI训练AI,越训越离谱

训练数据是用 GPT-4o 生成的?那质量不好说了。我们知道,大模型面临的三大挑战是算法、算力和数据。前两者靠优化升级,后者靠积累。随着技术的不断发展,高质量数据已经逐渐成为最大的瓶颈。在很多新模型上,人们为了提升模型能力,都采用了使用 AI 生成数据来训练的方式。人们普遍认为,使用合成数据可以显著提升模型质量。不过,最新的研究认为,使用 AI 生成的数据并不是什么好办法,反而可能会让模型陷入崩溃。今天发表在学术顶刊《自然》杂志的封面研究认为,如果放任大模型用自动生成的数据训练自己,AI 可能会自我退化,在短短几代
7/25/2024 2:01:00 PM
机器之心

育碧 7 月 27 日分享最新研究成果:游戏 AI 的可见性测试计算

育碧中国工作室今日宣布,在 ChinaJoy 期间举办的 2024 中国游戏开发者大会(CGDC)上,育碧 La Forge 中国团队的研发工程师应治将分享育碧一项最新研究成果 —— 游戏 AI 的可见性测试计算。AI在线获悉,神经表示是一系列利用神经网络来表示三维信息的新兴技术,已经应用于新视角合成、三维重建、三维生成和编辑等领域。在游戏 AI 领域,育碧研究员们作出了首次尝试。研发工程师应治将会为与会者展示利用神经表示解决游戏 AI 可见性测试计算瓶颈的第一个方法。该项技术有望在游戏领域得到更多应用以提升玩家的
7/25/2024 1:57:48 PM
浩渺

加大调整力度,教育部支持高校布局集成电路、AI 等专业

7 月 23 日,教育部高等教育司公布《关于开展 2024 年度普通高等学校本科专业设置工作的通知》,提出加大本科专业调整力度,着力优化同新发展格局相适应的专业结构和人才培养结构。《通知》要求“服务国家战略需求”,支持高校面向集成电路、人工智能、量子科技、生命健康、能源、绿色低碳、涉外法治、国际传播、国际组织、金融科技等关键领域布局相关专业,有的放矢培养国家战略人才和急需紧缺人才。《通知》提出“推动专业优化升级”,支持高校深化新工科、新医科、新农科、新文科建设,对现有专业进行改造,培育交叉融合的新兴专业,打造特色优
7/25/2024 1:38:52 PM
浩渺

AI 生产力罗生门:96% 老板力推,77% 员工认为增加工作量

研究机构 Upwork Research Institute 公布的最新报告指出,AI 正在增加全职员工的工作量。研究发现,77% 的员工表示,AI 增加了他们的工作量,阻碍了工作效率,并导致倦怠;此外,47% 使用 AI 的员工表示,他们不知道如何实现预期的生产力提升。另一方面,96% 的企业领导者对 AI 提高生产力寄予厚望。Upwork 研究院常务董事凯利・莫纳汉(Kelly Monahan)表示:我们的研究表明,在过时的工作模式和系统中引入新技术,并不能完全释放 AI 的预期生产力价值。AI 当然有可能同时
7/25/2024 11:55:26 AM
故渊

MAIA 新系统亮相:洞悉 AI 模型内在机制,审查其安全性

麻省理工学院计算机科学与人工智能实验室的研究人员开发了一种名为“MAIA”的多模式自动化可解释性代理系统,该系统可以使用视觉语言模型来自动执行各种神经网络可解释性任务。麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)最新研发了名为 MAIA 系统,可以使用视觉语言模型来自动执行各种神经网络可解释性任务。MAIA 的全称是 Multimodal Automated Interpretability Agent,直译过来为“多模态自动可解释性代理”,主要利用视觉语言模型,自动执行各种神经网络可解释性任务,
7/25/2024 11:12:50 AM
故渊

Reddit 被曝屏蔽多个搜索引擎和 AI 爬虫,官方称与谷歌合作无关

感谢今年 2 月,谷歌宣布与 Reddit 达成一项新协议,Reddit 数据将用于训练谷歌的 AI 模型,并在谷歌搜索结果中着重显示 Reddit 结果。彭博社报道称,这笔交易的金额约为 6000 万美元。从那时起,Reddit 在谷歌搜索中的展示次数也大幅增加。而最新消息称,Reddit 已禁止其他搜索引擎检索其网站内容。外媒 404 Media 最先报道了此行为,并指出 Reddit 已更新其 robots.txt 文件(AI在线注:网站与爬虫的协议文件),阻止所有机器人抓取网站的任何内容。AI在线查询 Re
7/25/2024 10:56:05 AM
汪淼

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

AI 竞赛正以前所未有的速度加速,继 Meta 昨天推出其新的开源 Llama 3.1 模型之后,法国 AI 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来,而这一模型的特点是 ——「足够大」。具体来
7/25/2024 10:20:00 AM
机器之心

AI 法律公司 Clio 获 9 亿美元融资;阿里云、腾讯云推出 Llama3.1 训练推理服务;可灵国际版上线丨AI科技评论

今日融资快报AI 法律公司 Clio 完成 F 轮 9 亿美元融资AI 法律科技公司 Clio 宣布完成 F 轮 9 亿美元融资,估值达到 30 亿美元。 Clio 的正式名称为 Themis Solutions Inc.,销售律师事务所用来管理其业务运营的一套云应用程序。 旗下产品 Clio Accounting 是一款应用程序,可帮助律师事务所的财务团队更高效地开展日常工作。
7/25/2024 9:46:00 AM
我在思考中

每小时1200张素材图!保姆级教程帮你搭建批量生图的SOP工程

AI 起来以后,很多公司都在寻找 AI 的落地应用场景,都在思考项目工程的流程节点怎么用 AI 去做提效。随着人工智能技术的快速发展,图像生成需求在许多行业中迅速增长。目前,许多企业已经开始广泛使用 Stable Diffusion(SD)技术进行图像生成。例如创作 IP 的延展,或应用于广告、产品设计、游戏开发等多个领域。然而,面向企业的大规模图像生成需求,批量化是一种刚需。 企业在使用 SD 进行图像生成时,往往需要处理大量的图像素材。这一过程中包括编写 CSV 需求单、审核素材、打标和命名等步骤,传统的手工操
7/25/2024 8:05:53 AM
小普

设计素材不用愁!12 组高质量运动主题 Midjourney 提示词

大家好,这里是和你们一起探索 AI 的花生~ 巴黎奥运会马上就要开始了,肯定有小伙伴在准备相关的设计物料。今天就为大家推荐一波运动主题的 Midjourney 提示词,包含人物、场景及相关小元素,非常适合用在海报、banner 的设计中。 相关推荐:一、人物角色 A young chinese short distance runner, in a red and white sports uniform, sprint to the finish line. in the style of 3D Pixar ca
7/25/2024 7:47:52 AM
夏花生

1230 亿参数,Mistral 发布 Large 2 旗舰 AI 模型:支持 80 多种编程语言,增强代码生成、数学和推理能力

AI 竞赛日益激烈,Meta 公司昨日推出开源 Llama 3.1 模型之后,法国人工智能初创公司 Mistral 也加入了竞争行列,推出了新一代旗舰模型 Mistral Large 2。模型简介该模型共有 1230 亿个参数,在代码生成、数学和推理方面比其前身功能更强大,并提供更强大的多语言支持和高级函数调用功能。Mistral Large 2 拥有 128k 的上下文窗口,支持包括中文在内的数十种语言以及 80 多种编码语言。该模型在 MMLU 上的准确度达到了 84.0%,并在代码生成、推理和多语言支持方面有
7/25/2024 6:53:16 AM
故渊

ComfyUI 进阶 (一):超实用的 Comfyroll 插件+8个优质节点推荐

前言: 学习 ComfyUI 是一场持久战,而 Comfyroll Studio 是一款功能强大的自定义节点集合,专为 ComfyUI 用户打造,旨在提供更加丰富和专业的图像生成与编辑工具。借助这些节点,用户可以在静态图像的精细调整和动态动画的复杂构建方面进行深入探索。Comfyroll Studio 的节点设计简洁易用,功能强大,是每个希望提升 ComfyUI 使用体验的用户的必备选择。祝大家学习顺利,早日成为 ComfyUI 的高手!一、安装 方法一: ① 直接在 ComfyUI 界面打开 Manager 管理
7/25/2024 6:08:01 AM
AI实战

马斯克的“世界最强大 AI 数据中心”目前由 14 台移动发电机供电,引环保担忧

埃隆・马斯克的孟菲斯超级计算集群(Memphis Supercluster)已上线,据马斯克介绍称,该集群在单个 RDMA fabric 上使用 10 万张液冷 H100,是“世界上最强大的 AI 训练集群”。如此庞大的算力自然需要惊人的电力供应,每个 H100 GPU 至少消耗 700 瓦电力,这意味着整个数据中心同时运行需要超过 70 兆瓦的电力,这还不包括其他服务器、网络和冷却设备的耗电量。令人惊讶的是,由于与当地电网的供电协议尚未敲定,马斯克目前使用 14 台大型移动发电机为这个巨型设施供电。AI 和半导体
7/24/2024 8:13:09 PM
远洋

北京今年上半年累计上线大模型 71 款,占全国总量超四成

据新京报消息,北京市上半年经济形势和政策解读新闻发布会今日召开。北京市在人工智能领域取得了显著成就,上半年,全市累计上线大模型 71 款,占全国总量超过四成。北京市发改委高技术处副处长蒋海峰在发布会上指出,2024 年上半年,北京市创新和高技术产业表现强劲,特别是在人工智能领域取得了重要进展,全市数字经济的增加值同比增长 7.8%,其中信息服务业实现增加值 4944.6 亿元,同比增长 12.4%,拉动 GDP 增长 2.6 个百分点。据AI在线此前报道,北京市经信局去年宣布,北京市将形成人工智能产业发展新突破,助
7/24/2024 8:06:30 PM
清源