应用

OpenAI 官宣新任首席财务官、首席产品官，并与苹果达成合作

感谢OpenAI 今日官宣聘请了两名高管，并与苹果建立合作伙伴关系。该公司在博客文章中宣布，Nextdoor 前首席执行官兼 Square 财务总监 Sarah Friar 将加入公司，担任首席财务官（CFO）。Friar 还是斯坦福大学数字经济实验室的联合主席。此外，Kevin Weil 加入 OpenAI 担任首席产品官（CPO）。他将领导一个产品团队，专注于将研究应用于消费者、开发者和企业的产品和服务。他曾经担任 Planet Labs 前总裁、Twitter 产品高级副总裁、Facebook 和 Insta

6/11/2024 12:10:18 PM 汪淼

Copilot Pro 订阅魅力下降，微软 7 月 10 日下线用户自建 GPT 服务

微软今天发布公告，宣布 Copilot Pro 服务将移除 GPT Builder，意味着订阅用户无法继续创建自己的 Copilot GPT。GPT Builder 也称为 Copilot GPT，订阅 Copilot Pro 的用户可以使用文档、外部或内部资源以及自定义指令创建自己的 Copilot GPT。Copilot Pro 是售价 20 美元的 Microsoft Copilot 订阅版本，具有一些附加功能，如 GPT 生成器和 Copilot 在 Word、Excel、PowerPoint 和 Outl

6/11/2024 10:18:46 AM 故渊

中国第一台全天候激光智能除草机器人落地：哈工大新成果，环境零污染

据华工科技消息，6 月 5 日-7 日，华工科技中央研究院同哈尔滨工业大学机器人技术与系统全国重点实验室（简称哈工大机器人实验室）正式签约并举行专家聘任仪式，中国第一台全天候激光智能除草机器人落地。据介绍，哈工大机器人实验室与华工科技合作研发的中国第一台全天候智能激光除草机器人，以“环境零污染、土地零破坏、昼夜作业”为研发目标，实现了该领域的国内首创，目前已经在黑龙江黑河市爱辉区开展田间试验。据介绍，激光除草是通过激光照射杂草，使草叶内部细胞脱水破裂死亡的物理靶向除草方法。全天候智能激光除草机器人集成深度学习的人工

6/11/2024 8:24:56 AM 汪淼

独家专访Pika：Sora is not very hard to beat，我们的算法能够以小胜大｜AI Pioneers

人类正在迎来人工智能领域的爆炸式更新，技术向未知拓展的每一步，几乎都引起惊人的关注度。在人工智能边界扩张的过程中，重要赛道的技术路线创新与分歧并存。技术先锋者的判断和选择，影响着众多跟随者的脚步。过去一年，机器之心独家率先将月之暗面、生数科技、爱诗科技、无问芯穹等优秀公司介绍给大家，为他们在互联网世界留下了第一份 “万字访谈底稿”。在技术路线尚未收敛的阶段，我们看到了到真正拥有信念、勇气以及系统化认知的 AI 创业者的引领力量。因此，我们推出 “AI Pioneers” 的专栏，希望继续寻找和纪录 AGI 时代人工

6/11/2024 1:05:00 AM 机器之心

Karpathy最新四小时视频教程：从零复现GPT-2，通宵运行即搞定

这是Karpathy「Neural Networks：zero to hero」系列视频的最新内容。AI 大牛 Andrej Karpathy 又「上新」了，这次一口气放出了长达四个小时的视频。视频主题为「让我们来复现 GPT-2（1.24 亿参数）」。Karpathy 表示，此次视频之所以这么长，是因为它很全面：从空文件开始，最后得到一个 GPT-2（124M）模型。具体实现步骤包括如下：首先构建 GPT-2 网络。然后对其进行优化，以便快速训练。然后通过参考 GPT-2 和 GPT-3 论文来设置训练运行优化和

6/11/2024 12:57:00 AM 机器之心

具身智能赋能机器人，「AI+人形机器人」论坛在浦东新区成功举行

6 月 6 日下午，在上海市浦东新区科技和经济委员会指导下，由上海市浦东新区投资促进中心、人形机器人（上海）有限公司主办，上海浦东科技创业中心、机器之心（上海）科技有限公司承办，中国银行股份有限公司上海市分行协办的「AI 人形机器人」论坛暨张江机器人全球生态峰会具身智能开发者论坛在浦东新区张江科学会堂成功举行。来自具身智能、运动控制、云计算以及人形机器人整机等领域高校院所、行业企业以及投资机构的 200 多位嘉宾参加了本次论坛，在线观看人次超 30000。本次论坛邀请了 12 位来自具身智能领域的学者、企业代表

6/11/2024 12:53:00 AM 机器之心

偏微分方程有了基础模型：样本需求数量级减少，14项任务表现最佳

本文提出的 Poseidon 在样本效率和准确率方面都表现出色。偏微分方程（PDEs）被称为物理学的语言，因为它们可以在广泛的时间 - 空间尺度上对各种各样的物理现象进行数学建模。常用的有限差分、有限元等数值方法通常用于近似或模拟偏微分方程。然而，这些方法计算成本高昂，特别是对于多查询问题更是如此，因而人们设计了各种数据驱动的机器学习（ML）方法来模拟偏微分方程。其中，算子学习（ operator learning）算法近年来受到越来越多的关注。然而，现有的算子学习方法样本效率并不高，因为它们需要大量的训练样例才能

6/11/2024 12:52:00 AM 机器之心

大模型的高考数学成绩单：及格已经非常好了

让考生头皮发麻的高考数学，可难倒了顶尖 AI 大模型。一年一度的高考即将落幕，衷心希望各位考生都超常发挥，考出满意的好成绩！！和往年一样，除了让 AI 大模型写写高考作文，我们也选取了六家国内头部大模型公司的产品与考生们一同参与一场客观且公平（让众多考生头皮发麻）的高考数学考试（新课标 Ⅰ 卷），其中包括 GPT-4o、GLM-4、文心一言 4.0、豆包、百小应（百川 4）以及通义千问 2.5。先来瞧一瞧这份「大模型成绩单」：令人惊讶的是，在这次模拟考试中，大模型（产品）的表现并未达到预期，甚至出现了几乎全部不及格

6/11/2024 12:38:00 AM 机器之心

AI降噪耳机，可在嘈杂人群中单独通话，看一眼锁定目标

千万种声音里，只听到你。最近几年来，很多人都在使用降噪耳机。这种设备能让人在吵闹的环境中享受安静，安心地听音乐或工作。通常，降噪耳机会通过内置的芯片算法对外界噪音信号进行计算，然后由喇叭发出反向声波进行抵消的方式创造安静环境。不过安静归安静，大多数情况下人们还是需要交流的，这就带来了不小的挑战。人们曾提出过各种解决方案，比如苹果最新款的 AirPods Pro 就会自动调整，如果耳机感知到人在说话就会停止降噪，但用户是无法控制听谁说话，或何时关掉降噪的。近日，华盛顿大学的一个团队开发了一种 AI 系统，让戴着耳机的

6/11/2024 12:22:00 AM 机器之心

可信度超越GPT-4V，清华&面壁揭秘「小钢炮」模型背后的高效对齐技术

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文主要作者来自 MiniCPM-V 团队，其中第一作者余天予是清华大学 2021 级硕士研究生，他的主要研究方向是通用多模态基础大模型构建及其对齐方法。近期，由清华大学自然语言处理实验室

6/11/2024 12:15:00 AM 机器之心

深度解析！Midjourney 三大常用参数 --s/c/w 的区别与使用技巧

大家好，这里是和你们一起探索 AI 的花生~ 之前为大家推荐了很多期 midjourney 提示词，然后有小伙伴问我推荐的提示词后跟着的参数，比如 --s 250、--c 6 等，是随便添加的还是有意识地用它们控制出图效果；如果是有意识的，又是如何确定使用哪一项参数和具体数值的。那今天就专门开一篇文章，为大家详细介绍一下 Midjourney 的三大常用参数 stylize、chaos 和 werid 的区别以及使用技巧 (本文中仅讨论仅限于目前最新的 v6 版本) 。相关推荐：一、--Stylize 风格化 S

6/11/2024 12:07:30 AM 夏花生

“AI 预测宝宝长相是不是智商税”上热搜，专家：娱乐性大于准确性

今天下午，一条 #AI 预测宝宝长相是不是智商税#的话题登上了微博热搜，目前位于榜单第 10 位。据极目新闻报道，在电商平台上，利用四维彩超图生成一张宝宝照片最低只需 6.8 元，等待半小时就能出片，最火的商家已接了上万单。在某微信小程序，用户也可自行上传四维彩超图，免费生成预测照片。对此，人工智能领域专业人士郭涛表示，通过一些算法和数据确实可以对图像进行处理和推测，但胎儿在母体发育以及出生后的成长会受到多种因素影响，AI 很难准确预测出最终模样。中国企业资本联盟副理事长柏文喜表示：“不少宝爸宝妈对未出生宝宝怀着好

6/10/2024 4:55:16 PM 浩渺

语音克隆技术引发担忧，OpenAI 再次解释其文本转语音工具

OpenAI 在几个月内第二次就其文本转语音工具进行解释，并再次强调该工具目前并未大范围开放，且未来也可能不会。图源 Pexels“无论我们最终是否会大规模部署这项技术，让世界各地的人们理解这项技术的发展方向都非常重要，”OpenAI 公司周五在其网站上发布的一份声明中表示，“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教育，以及我们如何围绕该技术实施安全措施的原因。”据IT之家了解，去年年底，OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频剪辑，即可

6/10/2024 9:57:21 AM 远洋

OpenAI 旧金山办公室被指神秘兮兮，便衣保安引周边商户不安

位于旧金山的 OpenAI 人工智能公司因其办公室的安保措施引起周边商户的不安。据《旧金山标准报》报道，该公司办公室里到处都是便衣保安，他们对来自邻居的询问守口如瓶，这种神秘兮兮的气氛让周边商户感到不安。《旧金山标准报》的摄影记者最近注意到，OpenAI 办公楼外有可疑人员站岗，身着黑色棒球帽、太阳镜，并隐蔽地佩戴着耳机，看起来像是便衣保安。附近 In-Symmetry Spa 美容院的老板坎达斯・科姆斯 (Candace Combs) 称，她曾询问过这些可疑人员的工作单位和所在的公司，但他们都拒绝透露任何信息。据

6/10/2024 9:33:41 AM 远洋

广东：到 2025 年全省 AI 核心产业规模将超过 3000 亿元

广东省人民政府办公厅在 6 月 6 日发布《广东省关于人工智能赋能千行百业的若干措施》文件，主要围绕 2025/2027 年广东省内 AI 发展进行规划。IT之家从文件中获悉，广东省计划到 2025 年全省算力规模达到 40EFLOPS，AI 核心产业规模超过 3000 亿元；到 2027 年，全省 AI 产业底座进一步夯实，算力规模超过 60EFLOPS，全国领先的算法体系和算力网络体系基本形成。具体看来，文件中提到广东省将建立 AI 芯片生态体系，打造智能感知产业体系。在 2027 年初步建成“AI 芯片生态体

6/9/2024 8:16:20 PM 漾仔

成功率达 53%，研究显示 GPT-4 可自主利用“零日”漏洞攻破网站

据 NewAtlas 报道，研究人员利用自主协作的 GPT-4 机器人小组成功入侵了一半以上的测试网站，这些机器人可以自主协调行动并根据需要生成新的“帮手”。更令人吃惊的是，他们利用的是以前未知的、现实世界中从未公开的“零日”漏洞（zero-day vulnerabilities）。图源 Pexels早在几个月前，同一批研究人员就发表了一篇论文，声称他们能够使用 GPT-4 自动利用“N day”漏洞，即业界已知但尚未修复的漏洞。实验中，GPT-4 仅凭已知的常见漏洞和披露列表 (CVE)，就能自主利用其中 87%

6/9/2024 1:05:35 PM 远洋

原作者带队，LSTM卷土重来之Vision-LSTM出世

与 DeiT 等使用 ViT 和 Vision-Mamba (Vim) 方法的模型相比，ViL 的性能更胜一筹。AI 领域的研究者应该还记得，在 Transformer 诞生后的三年，谷歌将这一自然语言处理届的重要研究扩展到了视觉领域，也就是 Vision Transformer。后来，ViT 被广泛用作计算机视觉中的通用骨干。这种跨界，对于前不久发布的 xLSTM 来说同样可以实现。最近，享誉数十年的 LSTM 被扩展到一个可扩展且性能良好的架构 ——xLSTM，通过指数门控和可并行化的矩阵内存结构克服了长期存在

6/9/2024 12:51:00 AM 机器之心

329篇图像、视频生成论文，今年CVPR最火的研究主题是这些

图像与视频合成、3D 视觉、人体行为识别、视觉与语言推理等研究方向论文最多，属于最热门的方向，体现当前学界对视觉生成、三维感知、人机交互等方向的高度重视。另外，多模态学习、以人为本的设计和自适应机器人可能构成人形机器人的未来。一年一度的计算机视觉和模式识别会议（CVPR）一直是 CV 界前沿研究的灯塔。CVPR 2024 录用结果显示，今年共有 2719 篇论文被接收，录用率 23.6%。那么大模型时代，今年的研究主题有哪些变化？最近，乔治亚理工学院计算机学院（College of Computing, Georg

6/9/2024 12:47:00 AM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉