AI在线 AI在线

大语言模型也有“健忘症”?Supermemory推出“无限记忆外挂”,让你的AI永不失忆!

在与ChatGPT或Claude等大语言模型长时间对话时,你是否也遇到过对话内容突然"失忆"的尴尬场景?这并非AI有意为之,而是受限于大语言模型固有的上下文窗口限制。 无论是8k、32k还是128k tokens的容量,一旦超过这个阈值,先前的对话内容就会被截断丢失,导致交互体验严重受损。 近日,一家名为Supermemory的公司推出了一项颠覆性技术——Infinite Chat API,号称能无限扩展任何大语言模型的上下文长度,让AI拥有"长期记忆"能力,且无需开发者重写任何应用逻辑。

在与ChatGPT或Claude等大语言模型长时间对话时,你是否也遇到过对话内容突然"失忆"的尴尬场景?这并非AI有意为之,而是受限于大语言模型固有的上下文窗口限制。无论是8k、32k还是128k tokens的容量,一旦超过这个阈值,先前的对话内容就会被截断丢失,导致交互体验严重受损。

QQ20250516-154109.jpg

近日,一家名为Supermemory的公司推出了一项颠覆性技术——Infinite Chat API,号称能无限扩展任何大语言模型的上下文长度,让AI拥有"长期记忆"能力,且无需开发者重写任何应用逻辑。

核心解密:智能代理 + 记忆系统 = 永不失忆!

这项技术的核心在于其创新的智能代理架构,主要包含三个关键环节:

首先是透明代理机制。Supermemory充当中间层,只需将原有OpenAI等API的请求URL更改为Supermemory的地址,系统就会自动将请求转发给相应的LLM。这意味着开发者几乎无需更改代码,就能立即获得"无限记忆"功能。

image.png

其次是智能分段与检索系统。该系统会将长对话内容分成保持语义连贯性的块,并在需要时只提取与当前对话最相关的上下文片段传给大模型,而非全部历史记录,这极大提高了效率并降低了资源消耗。

第三是自动Token管理。系统能根据实际需求智能控制token使用量,避免因上下文过长导致的性能下降,同时防止成本失控及请求失败。

image.png

简单到令人发指:一行代码,立即生效!

更令人惊喜的是,Supermemory的接入流程极为简便,仅需三步:获取API Key、更换请求URL、添加请求头中的认证信息,几乎零学习成本。

性能与费用:实力派,实用又不贵!

在性能方面,Supermemory表现出色。它完全突破了OpenAI等模型的token限制,据称可节省高达70%甚至90%的token使用量,同时几乎不增加延迟。价格模式也相当亲民,提供10万tokens免费存储额度,之后每月仅需20美元固定费用,超出部分按增量计费。

为保障稳定性,Supermemory还设计了容错机制——即使系统自身出现异常,也会自动绕过,直接将请求转发给原LLM,确保服务不中断。

兼容性方面,Supermemory支持所有兼容OpenAI API的模型和服务,包括OpenAI的GPT系列、Anthropic的Claude3系列,以及其他提供OpenAI接口兼容层的服务商。

业内专家认为,Supermemory的出现标志着AI代理正从孤立工具向前端驱动软件产品进化,将大幅降低开发者将AI代理集成到生产环境的门槛,有望加速交互式AI应用的普及。尽管技术仍处于早期阶段,但其开源性质和广泛框架支持,已吸引大量开发者关注,共同构建更智能的AI应用未来。

体验地址:https://supermemory.chat/

相关资讯

OpenAI 发布“学院”计划:为开发者提供 100 万美元 API 信用额度及技术指导

OpenAI 今天宣布推出“OpenAI 学院”,旨在帮助开发者和组织利用 AI 解决难题,并推动社区经济增长。该平台将确保生成式 AI 的强大功能在全球范围内广泛普及,包括中低收入国家。OpenAI 表示,许多国家的科技行业发展迅速,拥有才华横溢的开发者和创新型组织,但仍然缺乏高级培训和技术资源的支持。通过投资于本地 AI 人才的发展,可以促进包括医疗、农业、教育和金融等行业的经济增长与创新。该项目将提供如下方面的支持:培训与技术指导:OpenAI 专家将为利用 AI 的开发者和使命驱动型组织提供支持。API 使
9/23/2024 11:38:16 PM
清源

OpenAI 发布 Realtime API,助力第三方应用集成其语音合成技术

科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 OpenAI 在旧金山开发者大会(DevDay)上,发布了 Realtime API,可以让开发者调用该 API 在第三方应用中集成语音合成技术。OpenAI 表示开发者通过调用新的 Realtime API,可以在其应用中添加 6 种 AI 语音,AI在线注:OpenAI 为了避免法律问题,开发者不能使用第三方语音。OpenAI 还展示了其它应用场景,表示可用于客户支持、语言学习、教育软件等,开发者可以利用语音交互增强用户体验:OpenA
10/2/2024 1:41:37 PM
故渊

如何使用 Gemini API 构建视频字幕生成器

译者 | 崔皓审校 | 重楼开篇在本教程中,你将使用 Google 的 Gemini API 构建人工智能驱动的字幕生成器。 我们将创建一个名为“AI-Subtitle-Generator”的项目,该项目的前端使用 React,后端使用 Express。 准备好了吗?
12/23/2024 8:00:00 AM
崔皓
  • 1