应用

泄露！Apple Intelligence提示词原来是这样，还告诉大模型：别幻觉

从泄露的信息来看，Apple Intelligence 背后的提示语还是挺简单的。当苹果的 Apple Intelligence 还未完全开放体验时，其提示词就已经曝光了。苹果如何指挥 AI 干活，这次被泄露的非常彻底。我们就拿邮件来说，借助 AI，收发及回复邮件变得非常简单，但背后的逻辑是内置提示词在拿捏。比如下面这样，AI 在帮助人类回复邮件时，已经提前规定好了字数等限制。暴露的提示语是这样的：「你是一个可以帮助识别给定邮件和简短回复相关问题的邮件助手。给定邮件和回复片段，提出邮件中明确提出的相关问题。收件

8/7/2024 2:33:00 PM 机器之心

李飞飞亲自撰文，数十名科学家签署联名信，反对加州AI限制法案

AI真的已经危险到要如此监管的地步了吗？在创新的热土硅谷，李飞飞、吴恩达等 AI 科学家正在与监管部门展开一场关于安全与创新的拉锯战。这场拉锯战的核心是一个名叫 SB-1047 的法案。该法案的全称是「Safe and Secure Innovation for Frontier Artificial Intelligence Act（《前沿人工智能模型安全创新法案》）」，试图为高风险的 AI 模型建立明确的安全标准，以防止其被滥用或引发灾难性后果。该法案于今年 2 月份在参议院被提出，随后引起了很大的争议。很

8/7/2024 2:29:00 PM 机器之心

李飞飞「空间智能」之后，上交、智源、北大等提出空间大模型SpatialBot

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文第一作者为斯坦福大学研究生蔡闻骁，此前，他以绩点第一名的成绩在东南大学取得学士学位。他的研究兴趣为多模态大模型、具身智能。此工作为其在上海交通大学访问和北京智源人工智能研究院实习期间完

8/7/2024 2:18:00 PM 机器之心

月之暗面 Kimi 开放平台上下文缓存 Cache 存储费用降价 50%：现价 5 元 / 1M tokens / min

感谢AI 独角兽公司月之暗面今日宣布，Kimi 开放平台的上下文缓存 Cache 存储费用降价 50%，Cache 存储费用由 10 元 / 1M tokens / min 降低至 5 元 / 1M tokens / min，即日起生效。7 月 1 日，Kimi 开放平台上下文缓存（Context Caching）功能开启公测。官方表示，该技术在 API 价格不变的前提下，可为开发者降低最高 90% 的长文本旗舰大模型使用成本，并提升模型响应速度。AI在线附 Kimi 开放平台上下文缓存功能公测详情如下：技术简介据

8/7/2024 1:41:26 PM 清源

AI 模型提早 5 年预警乳腺癌，MIT 研究登 Science 获 LeCun 转发

科学家正在通过 AI 的力量，改变乳腺癌的现状。在全球范围内，每年有超过 60 万名女性因乳腺癌而无法存活。美国有八分之一的女性一生中会被诊断出患有乳腺癌。这些数字听起来很可怕，但并非毫无希望。当处于最早的局部阶段时，5 年相对生存率为 99%。近年来，早期检测和治疗方法的进步显著提高了乳腺癌的生存率，目前美国有超过 400 万乳腺癌幸存者。AI，就是这项进步背后的一个重要推动性力量。近日，Science 在 X 上连发多篇帖子，展现了 AI 在乳腺癌检测方面的应用潜力。「人工智能提前 5 年检测出乳腺癌」。这条推

8/7/2024 1:29:23 PM 清源

AI 编码无需人类插手：Claude 工程师摔断右手后，一周狂肝 3000 行代码

一次意外右手骨折，Claude 工程师的工作竟被 AI 挽救了。近两个月的时间，他们一起结对编程，甚至在一周内肝出 3000 行代码。他疯狂暗示，未来 1-3 年，就是「AI 工程师」的天下。原来，摔断胳膊也是一件幸事......当事人表示，「我再也不想回到过去了」。这是为何？事情是这样的，几个月前，Claude 工程师 Erik Schluntz 骑车上班的路上，意外摔断右手，打上了石膏。为了生计，他不得已用左手打字。即便如此，Schluntz 依旧在 Anthropic 旧金山的办公室里，一周狂肝了 3000

8/7/2024 1:19:22 PM 清源

OpenAI GPT-4o 新版本突然上线：丝滑解决 9.11 和 9.9 谁大，更强也更便宜了

GPT-4o 新版本突然上线，更强更便宜。能力全方位提升，ZeroEval 基准测试直接跃居第一。输入和输出分别节省 50%、33%。四舍五入就是 API 降价啊。token 输出扩展到 16k，此前支持 4k。9.11 和 9.9 谁大这个问题，也能丝滑解决。这是因为 OpenAI 给 API 中引入了结构化输出。通过 JSON 模式确保模型输出符合开发者定义的结构，能让模型变得更可靠安全。最新版模型“GPT-4o-2024-08-06”在 JSON 模式评估中，得分 100%。相比之下，去年 6 月的版本得分还

8/7/2024 1:13:07 PM 汪淼

无一大模型及格！北大 / 通研院提出超难基准 LooGLE，专门评估长文本理解生成

在长文本理解能力这块，竟然没有一个大模型及格！北大联合北京通用人工智能研究院提出了一个新基准数据集：LooGLE，专门用于测试和评估大语言模型（LLMs）长上下文理解能力。该数据集既能够评估 LLMs 对长文本的处理和检索能力，又可以评估其对文本长程依赖的建模和理解能力。结果不评不知道，一评估发现这些模型在复杂的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像 Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex 这种商业模型，

8/7/2024 12:46:42 PM 汪淼

在线设计平台 Canva 可画发布一站式 AI 创作套件“魔力工作室”：支持生成花字、转场动画

感谢在 8 月 6 日的“Canva Connect 连接你我，可画未来”主题活动中，在线视觉传播和协作平台 Canva 可画宣布，一站式 AI 创作套件“魔力工作室”在中国正式上线。该套件号称“人人可用的一站式 AI 创作套件”，功能包括基于 AIGC 的文案生成、图片生成、花字特效生成、图片编辑、转场动画设计生成等。用户仅需输入简单的文字描述，即可快速生成图片插画、花字特效和演示文稿等等。此外，该套件内置“魔力橡皮擦”“魔力抓取”，用户可去除图片中的指定元素或提取、移动图片主体。官网显示，智能抓取、魔力特效、魔

8/7/2024 11:39:58 AM 清源

腾讯元宝上线深度阅读模式：原生支持最长近 50 万字输入，可提炼论文、生成杜邦分析图等

8/7/2024 10:32:08 AM 沛霖（实习）

AI 威胁生计，美国游戏演员发起大罢工

感谢自 7 月 26 日起，美国演员工会（SAG-AFTRA）的成员开始针对游戏行业发起罢工，此次罢工涉及超过 16 万名 SAG-AFTRA 成员，对从大型发行商到小型独立工作室的游戏开发造成巨大冲击。罢工的核心争议在于 AI 技术的使用。工会方要求对演员的数字复制品和生成式 AI 的应用进行严格保护，以防止未经授权使用演员形象和声音。然而，游戏行业谈判委员会 —— 代表着包括动视暴雪、Take-Two、顽皮狗等 30 家公司的利益，对保护范围存在分歧。工会方要求保护所有涉及声音和动作捕捉的演员，而游戏公司最初仅

8/7/2024 10:20:08 AM 远洋

面壁智能开源 MiniCPM-V 2.6 模型：号称端侧 AI 多模态能力对标 GPT-4V，6G 内存可用

面壁智能昨日开源了 MiniCPM-V 2.6 模型，官方表示将端侧 AI 多模态能力拉升至全面对标 GPT-4V 水平。官方称 MiniCPM-V 2.6 模型仅 8B 参数，取得 20B 以下单图、多图、视频理解 3 SOTA 成绩，有以下特点：“三合一最强”端侧多模态：首次在端侧实现单图、多图、视频理解等多模态核心能力全面超越 GPT-4V，单图理解越级比肩多模态王者 Gemini 1.5 Pro 和新晋顶流 GPT-4o mini多项功能首次上端：实时视频理解、多图联合理解、多图 ICL 视觉类比学习、多图

8/7/2024 10:05:21 AM 沛霖（实习）

传月之暗面完成 3 亿美元融资，最新估值 33 亿美元；OpenAI 加持，最强人形机器人 Figure 02 登场丨AI情报局

今日融资快报月之暗面完成3亿美元新一轮融资，投后估值33亿美元，月之暗面回应：不予置评据彭博社报道，月之暗面刚刚完成了新一轮 3 亿多美元融资，此次融资将月之暗面的估值推高至 33 亿美元，并吸引了包括腾讯、高榕资本和老股东阿里巴巴在内的其他投资者。对此，有接近公司的知情人士表示，此次腾讯参投消息属实。而月之暗面则回应称，对该融资消息不予置评。

8/7/2024 9:57:00 AM 我在思考中

OpenAI 在 API 中引入结构化输出，最新版 GPT-4o AI 模型达到 100% 满分

感谢OpenAI 公司昨日（8 月 6 日）发布新闻稿，宣布在 API 中引入结构化输出（Structured Outputs）。OpenAI 公司此前已提供结构化输出，用户可以指定 "response_format": {"type": "json_object"}} 来请求一个有效的 JSON 对象，也可以使用函数调用机制来请求符合特定模式的响应。OpenAI 在导言中表示，结构化输出功能可确保模型生成的响应始终符合用户提供的 JSON 模式，因此用户无需担心模型会遗漏必填键或生成无效的枚举值。AI在线附上结构

8/7/2024 9:54:41 AM 故渊

让「GPT-4V」跑在手机上，这家中国大模型公司做到了

真实世界的视觉信息是流动的，而在处理流动性的视觉信息上，端侧视频理解具有天然优势，手机、PC、AR、机器人、智能座驾等端侧设备自带的摄像头，具有天然的多模态输入能力。与云端相比，端侧离用户更近，链路更短，效率更高，同时具有更强的信息安全优势。今日，面壁正式发布了 MiniCPM-V 2.6，在端侧性能实现全面对标 GPT-4V——据介绍，MiniCPM-V 2.6 首次在端侧实现单图、多图、视频理解等多模态核心能力全面超越GPT-4V，三项能力均取得 20B 以下 SOTA 成绩，单图理解越级比肩 Gemini 1.5 Pro 和 GPT-4o mini 。

8/7/2024 9:42:00 AM 朱可轩

搭载字节豆包大模型，smart首款豪华中型SUV精灵5即将发布

近日，新奢智能纯电汽车品牌smart在官方渠道透露，旗下首款豪华中型SUV精灵#5将于8月28日在澳洲全球首秀。官方路透显示，精灵#5除了沿袭概念车的前瞻开拓性设计，在智能座舱方面，还通过与火山引擎深度合作，搭载字节跳动豆包大模型，为用户带来更加人性化、智能化的座舱新体验。smart精灵#5概念车首次亮相于2024年4月北京国际车展。梅赛德斯-奔驰全球设计团队以“感性·灵锐”的设计语言”对该款车型的外观进行了大胆方正、极具力量感的设计，也让精灵#5成为smart品牌有史以来最大尺寸的车型。除了设计上的突破，smar

8/7/2024 9:32:00 AM 新闻助手

阿里通义 App 推出“角色扮演”功能，可将视频人物换成“孙悟空”“机器人”

8 月 6 日，通义 App 上线新功能“角色扮演”，用户只需要上传一段视频即可完成“现实与虚拟”的跨界，实现诸如机器人“带娃”、孙悟空“跳舞”、二次元女生“职场搬砖”的效果。AI在线附操作方法：用户准备一段不超过 15 秒的视频，通过“通义 App 频道角色扮演开始创作”的顺序进入功能入口，用户也可以在官方提供的视频模板中选择视频，最多可替换视频中的 3 个角色。可选角色方面，官方提供了孙悟空、机器人及两款不同风格的女性角色供用户选择。据介绍，“角色扮演”功能背后的“核心技术”是通义实验室研发的 AI

8/7/2024 9:30:49 AM 清源

AI 绘画新标杆！一文详解最新开源模型 Flux.1（附新版工作流&模型资源包）

大家好，这里是和你们一起探索 AI 的花生~ 继 SD 3 Medium、Kolors 之后，开源领域又新增了一款文本-图像生成模型 Flux.1。它由 Stability AI 前核心成员主导开发，模型质量远超 SD 3，甚至与闭源的 Midjourney v6.1 模型不相上下，成为了 AI 文生图模型的新标杆，也给开源 AI 绘画带来了新的发展活力。今天就一起来看看 Flux.1 模型的特点和安装使用方法。相关推荐：一、Flux.1 简介 Black Forest Labs 官网： Flux.1 是由 B

8/7/2024 8:15:14 AM 夏花生

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉