应用

豆包大模型公布价格清单，支持国内最高并发标准

近期，火山引擎官网更新了豆包大模型的定价详情，全面展示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上，豆包通用模型的 TPM（每分钟Tokens）、RPM（每分钟请求数）均达到国内最高标准。以豆包主力模型 pro-32k 为例，价格比行业低99%，TPM限额则高达同规格模型的2.7倍到8倍。图：豆包系列模型“后付费”定价信息官方信息显示：在按照 Tokens 实际使用量计算费用的“后付费”模式下，豆包通用模型-pro、豆包通用模型-lite的 32k 及以下窗口版本，模型限流为 1

5/21/2024 10:55:00 AM 新闻助手

感到震惊与愤怒，斯嘉丽・约翰逊控诉 OpenAI 擅用其声音

据IT之家此前报道，OpenAI 宣布将暂停 ChatGPT 的“Sky” 语音，起因是用户指出该声音与演员斯嘉丽・约翰逊 (Scarlett Johansson) 的声音十分相似。OpenAI 在一篇博客文章中表示，“Sky”是五个可用语音之一，其来源为某位女演员，但并非刻意模仿斯嘉丽・约翰逊。斯嘉丽・约翰逊曾出演电影《Her》，片中饰演让男主角坠入爱河的虚拟助手系统。CNN 报道称，斯嘉丽・约翰逊昨天晚上发布了一份声明，称 OpenAI 在去年 9 月份联系她，希望能够提供声音，OpenAI 首席执行官阿尔特曼

5/21/2024 10:37:08 AM 沛霖（实习）

声称“媲美人类专家”，谷歌 Gemini 1.5 Pro 数学版“提智”：MATH 基准准确率 91.1%

谷歌公司上周发布技术报告，表示 Gemini 1.5 Pro 模型在经过专门的数学领域训练之后，大幅提高了数学成绩，并成功解决了国际数学奥林匹克竞赛的部分问题。谷歌针对数学场景有针对性地训练 Gemini 1.5 Pro 模型，并通过 MATH 基准、美国数学邀请考试（ AIME) 和谷歌内部的 HiddenMath 基准进行测试。根据谷歌的数据，数学型 Gemini 1.5 Pro 在数学基准测试中的表现“与人类专家的表现相当”，与标准的非数学型 Gemini 1.5 Pro 相比，数学型 Gemini 1.5

5/21/2024 9:03:42 AM 故渊

速度更快！新版 SD WebUI Forge 保姆级安装教程

不知道平时经常使用 SD WebUI 的小伙伴发现没有，随着安装插件和模型越来越多，WebUI 时不时会出现卡顿或爆显存的情况，尤其在低显存的硬件上更加明显，只能不停的重启来解决。估计是 WebUI 的作者张吕敏博士自己也发现了这个问题，于是升级版的 SD WebUI Forge 它来了！操作界面虽然和原来的一模一样，但运行效率和图像生成速度都有了不错的提升，下面快跟着我来看看吧～一、Forge 基础介绍首先关于为什么取 Forge 这个名字：单词 Forge 有「锻造」的意思，根据作者解释，该词的灵感是来源

5/21/2024 12:55:58 AM 乐伊ROY

AI 网页设计神器 Wegic！5分钟帮你创建一个专属网站！

大家好，这里是和你一起探索 AI 的花生~ 对大部分人来说，建一个网站肯定是一件比较复杂的事情，需要找具有专业技能的设计师或者公司来处理。今天我们一起来认识一位 “AI 网页设计师” Wegic，你只需要告诉它你的想法，它就能在几分钟之内帮你生成一个完整精美的网站，让原本专业的事情对普通人来说也变得无比简单。相关推荐：Wegic 网站直达： Wegic 是一个支持仅通过自然对话交互就完成网站创建和管理的在线工具，新用户有 120 个积分，可用于 3 次网站生成或者 12 次内容修改。在官网主页点击「create

5/21/2024 12:11:29 AM 夏花生

OpenAI GPT-4o 推动 ChatGPT 订阅服务需求激增，移动端营收暴涨

5/20/2024 11:11:04 PM 远洋

摩根大通：新员工都将接受人工智能培训

美国最大金融服务机构之一摩根大通（JPMorgan Chase & Co.）将让所有新入职的员工接受人工智能 (AI) 培训，以应对这项被首席执行官杰米・戴蒙 (Jamie Dimon) 类比为印刷术和蒸汽机的颠覆性技术。图源 Pexels“今年入职的所有员工都将接受‘提示词工程’培训，为迎接未来的 AI 时代做好准备，”摩根大通资产管理部门负责人玛丽・埃尔多斯 (Mary Erdoes) 在周一举行投资者大会上表示。埃尔多斯女士指出，人工智能在她的部门正发挥着节省时间和提高收益两大方面的作用。通过人工智能，银行家

5/20/2024 10:47:27 PM 远洋

谷歌搜索“AI 摘要”功能闹笑话：推荐用户喝尿以快速排出肾结石

感谢谷歌一直致力于利用人工智能革新搜索引擎领域，然而新功能在正式发布之前却闹出了笑话：它建议用户饮用大量‘浅色’尿液作为快速排出肾结石的方法。图源 Pexels这个名为“搜索生成式体验”（Search Generative Experience，SGE）的人工智能功能在测试阶段就给出过该建议，如今改头换面为“AI 摘要”（AI Overviews）的它已在美国率先上线，并计划陆续登陆其他地区，但在上线前一周仍出现过上述建议。IT之家注意到，与以往的搜索结果摘要不同，“AI 摘要”不会仅仅展示网站的链接，而是尝试用人

5/20/2024 9:18:54 PM 远洋

“人工智能教父”Geoffrey Hinton 忧心 AI 取代劳动力，建议英国政府实施全民基本收入制度

人工智能领域先驱 Geoffrey Hinton 因其在神经网络方面的开创性工作而被誉为“人工智能教父”，近日他对人工智能的发展表达了担忧。他表示，人工智能可能会取代大量传统工作，并建议英国政府实施全民基本收入制度来应对这一挑战。YouTube 截图据 BBC 报道，Hinton 在采访中坦承，“我非常担心人工智能会取代许多简单的工作。” 为了解决这一问题，他认为全民基本收入不失为一个可行的方案。“我曾受邀到唐宁街与政府官员进行商讨，” Hinton 说道，“当时我建议他们考虑全民基本收入制度。”据IT之家了解，全

5/20/2024 7:43:24 PM 远洋

网易天音 AI 工具已开放使用：词、曲、编、唱、混等音乐创作辅助

感谢网易天音平台现对网易云音乐的全部用户开放使用权限。网易云音乐 App 同步开启“神奇礼物店”活动，用户参与活动即可生成“AI 音乐”关键词，可在网易天音官网进行 AI 创作时使用。官网还提供乐理知识学习，分为入门篇和进阶篇，包含作曲、作词等内容，针对音乐领域的常见问题也有解答。目前，网易天音属于 Beta 版阶段。IT之家查询网易天音官网获悉，网易天音是网易云音乐旗下一站式 AI 音乐创作工具，具备词、曲、编、唱、混等音乐创作全流程的 AI 创作辅助功能。网易天音在 2022 年 1 月便完成小程序上线，小程序

5/20/2024 7:14:58 PM 归泷（实习）

掌阅与亚马逊云科技达成合作，将探索文生视频等多维阅读交互方式

掌阅科技日前宣布与亚马逊云科技达成合作，将借助亚马逊云科技在北京、宁夏区域的机器学习平台 Amazon SageMaker 及 Stable Diffusion 亚马逊云科技插件解决方案等技术，为用户提供文生图、文生视频在内的多维度阅读交互方式，打造“沉浸式”的阅读体验。掌阅方面表示，借助亚马逊 Amazon SageMaker 获得了快速构建、训练和部署机器学习模型的能力，加速了模型训练效果的验证与优化；依托 Stable Diffusion 亚马逊云科技插件方案，可将现有 SD 模型训练、推理和调优等工作负载从

5/20/2024 7:14:56 PM 清源

闷声狂奔一年，字节大模型的进阶之路

2024 年初，字节跳动 CEO 梁汝波在年会中提到，公司层面的半年度技术回顾里，2023 年才出现 GPT 相关讨论。作为对比，业内做得比较好的大模型创业公司基本在 2018 年到 2021 年之间已经创立。简而言之，这场由 Open AI 在 2022 年底发布 ChatGPT 3.5 而掀起的“大模型”盛宴，字节没有成为最早的“入场嘉宾”。

5/20/2024 6:51:00 PM 代聪飞

声音太像斯嘉丽・约翰逊，OpenAI 停用 ChatGPT 语音选项“Sky”

感谢OpenAI 宣布将暂停供聊天机器人 ChatGPT 语音功能使用的“Sky” 语音，起因是用户指出该声音与演员斯嘉丽・约翰逊 (Scarlett Johansson) 的声音十分相似。IT之家注意到，OpenAI 在一篇博客文章中表示，“Sky”只是五个可用语音之一，其来源为某位女演员，但并非刻意模仿斯嘉丽・约翰逊。斯嘉丽・约翰逊曾出演电影《Her》，片中饰演让男主角坠入爱河的虚拟助手系统。5 月 14 日 OpenAI 发布了新的 GPT-4o 模型，GPT-4o 可以理解用户的语音提问并用语音进行回答。

5/20/2024 6:29:53 PM 远洋

高德地图：拟与浙江衢州共同打造首个时空智能城市，将逐步开放 AI 能力

感谢IT之家从高德官方获悉，在今日的 AI Day 技术开放日活动期间，高德地图旗下高德云图宣布将逐步开放云睿时空融合大模型和云境 AI 三维重建平台，打造时空智能体应用生态，助力智慧城市向时空智能城市进化。高德地图董事长刘振飞表示，高德将助力构筑 AI 时代的时空智能新基建。活动中，高德宣布已经与浙江省衢州市达成合作意向，双方拟共同打造首个时空智能城市。据介绍，上一代智慧城市建设是基于二维的城市还原，通过城市多元数据融合，解决城市管理中碰到的诸如“数据烟囱”（不能与其他相关信息系统进行互操作或者协调工作的信息系统

5/20/2024 5:08:32 PM 清源

AI在用｜一款AI视频换脸神器，让安吉丽娜·朱莉秒变「女版」马斯克

机器之能报道编辑：山茶花以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。（一大早的选题会上）A：今天的选题是 Faceswap，一款 AI 换脸工具。B：有啥创新性使用场景？A：诈骗…… 呃，电影制作……不得不说，AI 进化得越来越颠了！Faceswap 官网放出了不少演示，个顶个地以假乱真。它不

5/20/2024 4:53:00 PM 机器之能

集聚场景驱动力，激发AI生产力——WAIC 2024“人工智能+”应用场景持续广泛征集

今年的政府工作报告提出，大力推进现代化产业体系建设，加快发展新质生产力。同时要深化大数据、人工智能等研发应用，开展“人工智能 ”行动。近年来，上海市委、市政府不断创新政策举措，探索应用场景，深入推进城市转型、产业升级，为新一代人工智能发展开辟了广阔天地。世界人工智能大会（WAIC）作为行业标杆性盛会，每年都集聚了全球人工智能领域最具影响力的科学家、企业家、政界人士、高校组织、投资人及初创团队，已然成为全球人工智能领域学术与行业交流、展览展示、合作洽谈的重要平台和窗口。2024世界人工智能大会将于7月初在上海举办，大

5/20/2024 4:33:00 PM 新闻助手

国产端侧小模型超越 GPT-4V，「多模态」能力飞升

在刚刚过去的机器人学术顶会 ICRA 2024 上，「具身智能」成为热议，其中围绕具身智能的一个普遍疑问是：若将 AI 大模型应用到消费级机器人领域，首先是模型适配终端，还是终端适配模型？过去一年，由于 6B、7B 等小模型的成果井喷，以及 MoE 训练技术的越发成熟，将模型跑在手机、学习机、平板电脑、机器人甚至汽车等等终端应用上的想象力开始变大，无论算法层还是硬件层都「蠢蠢欲动」。诚然，这已经成为一个明朗的行业方向，但在系统整合上却要面临不同话语体系之间的博弈。

5/20/2024 4:10:00 PM 陈彩娴

大模型进入「实用」时代！腾讯助力「销冠」量产，5 分钟创建智能助手

今年年初，英伟达 CEO 黄仁勋因为劝人「别再学习计算机」被送上热搜。但其实，他的原话是「过去，几乎每个人都会告诉你，学习计算机至关重要，每个人都应该学会编程。但事实恰恰相反，我们的工作是创造计算技术，让大家都不需要编程，编程语言就是人类语言。」编程，是为了不再编程，这一愿景由来已久，而且在大模型出现之后逐渐成为可能。但在现阶段，直接把一个大模型丢给某个人或某个企业去用效果仍然不好。比如，你不能指望一个不会写 Prompt 的人利用大模型去构建一整个网站，也不能指望一个没有配置 AI 人才的公司把某个大模型变成公司

5/20/2024 4:00:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

应用

豆包大模型公布价格清单，支持国内最高并发标准

感到震惊与愤怒，斯嘉丽・约翰逊控诉 OpenAI 擅用其声音

声称“媲美人类专家”，谷歌 Gemini 1.5 Pro 数学版“提智”：MATH 基准准确率 91.1%

速度更快！新版 SD WebUI Forge 保姆级安装教程

AI 网页设计神器 Wegic！5分钟帮你创建一个专属网站！

OpenAI GPT-4o 推动 ChatGPT 订阅服务需求激增，移动端营收暴涨

摩根大通：新员工都将接受人工智能培训

谷歌搜索“AI 摘要”功能闹笑话：推荐用户喝尿以快速排出肾结石

“人工智能教父”Geoffrey Hinton 忧心 AI 取代劳动力，建议英国政府实施全民基本收入制度

网易天音 AI 工具已开放使用：词、曲、编、唱、混等音乐创作辅助

掌阅与亚马逊云科技达成合作，将探索文生视频等多维阅读交互方式

闷声狂奔一年，字节大模型的进阶之路

声音太像斯嘉丽・约翰逊，OpenAI 停用 ChatGPT 语音选项“Sky”

高德地图：拟与浙江衢州共同打造首个时空智能城市，将逐步开放 AI 能力

AI在用 ｜ 一款AI视频换脸神器，让安吉丽娜·朱莉秒变「女版」马斯克

集聚场景驱动力，激发AI生产力——WAIC 2024“人工智能+”应用场景持续广泛征集

国产端侧小模型超越 GPT-4V，「多模态」能力飞升

大模型进入「实用」时代！腾讯助力「销冠」量产，5 分钟创建智能助手

AI在用｜一款AI视频换脸神器，让安吉丽娜·朱莉秒变「女版」马斯克