AI在线 AI在线

百页专业报告一次直出!Jürgen团队开源框架WriteHERE,重塑AI写作天花板

在 AI 长文写作领域,一项革命性突破正在改写行业规则 —— 由「人工智能之父」Jürgen Schmidhuber 领衔的团队,正式开源其长文写作框架 WriteHERE。 该框架凭借异质递归规划(Heterogeneous Recursive Planning)技术,实现单次生成超 4 万字、100 页专业报告的能力,在小说创作、报告生成场景中全面超越 Perplexity 付费版「深度研究」、DeepMind 的 Agent's Room 及斯坦福 STORM 等顶尖方案。 论文标题:Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models论文地址: & 在线 Demo: 仓库:「大纲先行」到「实时编织」现有 AI 长文生成系统(如 Agent's Room、STORM)多将写作简化为「规划 - 填充」的线性流程,而 WriteHERE 首次通过数学形式化揭示:长文写作本质上是检索(Retrieval)、推理(Reasoning)、写作(Composition)三类异构任务的动态编织。

在 AI 长文写作领域,一项革命性突破正在改写行业规则 —— 由「人工智能之父」Jürgen Schmidhuber 领衔的团队,正式开源其长文写作框架 WriteHERE。该框架凭借异质递归规划(Heterogeneous Recursive Planning)技术,实现单次生成超 4 万字、100 页专业报告的能力,在小说创作、报告生成场景中全面超越 Perplexity 付费版「深度研究」、DeepMind 的 Agent's Room 及斯坦福 STORM 等顶尖方案。

图片

  • 论文标题:Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models
  • 论文地址:https://arxiv.org/pdf/2503.08275
  • 项目主页 & 在线 Demo:http://writehere.site/
  • GitHub 仓库:https://github.com/principia-ai/WriteHERE

图片

动态规划颠覆传统

从「大纲先行」到「实时编织」

现有 AI 长文生成系统(如 Agent's Room、STORM)多将写作简化为「规划 - 填充」的线性流程,而 WriteHERE 首次通过数学形式化揭示:长文写作本质上是检索(Retrieval)、推理(Reasoning)、写作(Composition)三类异构任务的动态编织。

1. 写作代理系统的五元组定义

研究团队将写作系统抽象为数学元组:

图片

其中:

  • 图片:Agent 内核,负责任务调度与决策。
  • 图片:内部记忆,存储大纲、草稿、检索结果。
  • 图片:外部数据库,包括搜索引擎、参考文献。
  • 图片:工作空间,承载文本生成与编辑。
  • 图片:输入输出接口,连接用户与信息源。

这一形式化框架突破了传统 AI 写作工具「重生成、轻管理」的设计范式。写作不再是简单的文本扩展,而是记忆空间、工作空间与外部环境的持续交互过程。

2. 任务类型的数学建模

研究团队将写作过程解构为三类原子操作:

  • 检索任务图片:针对信息需求图片,从环境获取知识更新记忆图片
  • 推理任务图片:基于知识图片解决推理问题图片,如逻辑校验、结构优化。
  • 写作任务图片:基于知识图片,在状态为图片的工作空间中生成满足目标图片的文本。

规划问题的形式化革命

从 HTN 到异质递归

研究团队受层次任务网络(HTN)规划启发,提出写作规划问题的数学定义:

图片

  • 顶层写作任务图片:包含目标图片、初始工作空间状态图片、初始记忆内容图片
  • 原子任务集合图片:可执行的检索、推理、写作原子操作。

解决方案为满足以下条件的原始操作序列:

  • 可执行性:每个操作的前置条件均被满足。
  • 目标达成:最终工作空间状态符合写作目标。

核心技术

异质性递归与状态化 DAG 任务管理

WriteHERE 的核心突破体现在两大技术创新:

1. 异质任务递归分解:每个写作任务被动态标注类型(检索 / 推理 / 写作),并基于类型分解为子任务,直至可执行的原子任务。例如,当执行「撰写贸易报告第六章:行业深度剖析:识别赢家与输家」,系统进一步分解为以下子任务:

  • 检索任务:收集最新 (截至 2025 年 4 月) 的行业数据,包括科技 (半导体、软件、硬件)、汽车、农业、制药 / 医疗保健、能源和消费品行业的贸易统计、市场份额、公司财务表现、行业报告及专家评论。
  • 推理任务(8 个子任务):构建统一分析框架,确立「赢家」和「输家」识别标准;分别分析科技、汽车、农业、制药 / 医疗保健、能源和消费品行业的关税、非关税措施、宏观经济状况及全球价值链重构影响;规划行业绩效对比可视化内容。
  • 写作任务(8 个子任务):撰写章节引言;分别撰写科技、汽车、农业、制药 / 医疗保健、能源和消费品六大行业的详细分析;撰写章节结论,综合关键发现并过渡至下章区域视角。

2. 状态化层次调度算法:任务依赖关系以有向无环图(DAG)管理,结合任务状态(激活 / 挂起 / 静默)实现自适应执行。该机制确保系统能根据实时反馈动态调整规划深度,例如在贸易报告中,系统能追踪每个子任务的状态,确保在撰写特定章节(如区域分析)前完成其所有依赖任务(如宏观经济影响分析)。

实验表现

全面碾压现有方案

团队在小说创作(Tell me a story 数据集)和技术报告生成(WildSeek 数据集)两大任务中验证了 WriteHERE 的优越性:

  • 小说写作:基于 GPT-4o 和 Claude-3.5-Sonnet,WriteHERE 在情节结构、创意性、角色塑造等维度全面领先。当生成长度从 2000 词扩展至 8000 词时,其优势进一步扩大,整体胜率较 Agent's Room 超过 90%(见图 1)。
  • 技术报告:在信息相关性、覆盖广度、深度等关键指标上,WriteHERE 以接近满分的表现(平均 4.9/5)超越 STORM 和 Co-STORM。对比移除异质递归规划模块的消融实验,性能显著下降,印证了该设计的核心价值(见图 2)。

图片

图 1 小说写作任务评测

图片

图 2 报告写作任务评测

压力测试

百页报告生成

研究团队公开的超 100 页《2025 年 Q2 全球贸易战深度报告》展现了框架的极致能力:

系统自动构建了一个包含 16 个主要章节、超过 80 个子任务的异质递归计划,涵盖引言、全球关税结构、非关税壁垒、宏观经济冲击、全球价值链重构、行业赢家与输家、地区分析、未来预测等内容。整个生成过程体现了异质递归规划的优势 —— 系统能够自动根据需要深入研究特定主题(如美国 232 条款钢铝关税扩张),同时保持对整体结构的把控,确保各章节之间的连贯性和一致性。最终报告包含超过 44,000 字的正文,覆盖从关税机制到行业赢家的全面分析。

开源生态与社区反响

作为完全开源(MIT 协议)的框架,WriteHERE 支持开发者自由调用异构 Agent(如专用检索模型、推理引擎),或将彻底改变长文写作工具的商业模式。

英伟达高级研究科学家 Enze Xie 试用后评价模型表现惊艳:

图片

社区用户 @AIExplorer 反馈:

「WriteHERE 太棒了。我把它和 GPT-4o-mini 一起使用,它能有效替代我的大部分 OpenAI 深度搜索。」

图片

知名 AI 领域推特大 V Ben Tossell 更直言:

「这个写作模型太棒了。」

图片

此刻,长文写作的「自动化天花板」已被打破。访问 writehere.site,即可加入这场 AI 写作的革命。

相关资讯

Claude创始人:AI全面超越人类,只剩2-3年

在最新的对话访谈当中,Claude厂家Anthropic的CEO Dario Amodei谈论了他对于AI未来的看法。 他认为,AI确有可能在短期内替代部分人类的工作,但让AI与人类形成互补才是对生产力最有益的方式。 对于当下的年轻人,Amodei也给出了他的建议,鼓励其学会使用AI工具并培养批判思维能力。
1/23/2025 8:40:00 AM
量子位

浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

大模型智能体正在迅速发展,能力已不再局限于 API 调用。 诸如OpenAI的Operator和Anthropic的Computer Use等,能够像人类一样直接与界面交互,执行复杂操作。 在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。
2/8/2025 2:10:00 PM
量子位

攻破AI最强守卫,赏金2万刀!Anthropic新方法可阻止95% Claude「越狱」行为

最近,Anthropic安全研究团队「有点忙」。 本月4日,Anthropic在X上,邀请网友挑战新的AI防护系统。 两天后,Anthropic称:目前,没有人完全越狱新系统,因此提高了赌注。
2/17/2025 2:41:31 PM
新智元
  • 1