百页专业报告一次直出！Jürgen团队开源框架WriteHERE，重塑AI写作天花板

在 AI 长文写作领域，一项革命性突破正在改写行业规则 —— 由「人工智能之父」Jürgen Schmidhuber 领衔的团队，正式开源其长文写作框架 WriteHERE。该框架凭借异质递归规划（Heterogeneous Recursive Planning）技术，实现单次生成超 4 万字、100 页专业报告的能力，在小说创作、报告生成场景中全面超越 Perplexity 付费版「深度研究」、DeepMind 的 Agent's Room 及斯坦福 STORM 等顶尖方案。论文标题：Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models论文地址： & 在线 Demo：仓库：「大纲先行」到「实时编织」现有 AI 长文生成系统（如 Agent's Room、STORM）多将写作简化为「规划 - 填充」的线性流程，而 WriteHERE 首次通过数学形式化揭示：长文写作本质上是检索（Retrieval）、推理（Reasoning）、写作（Composition）三类异构任务的动态编织。

论文标题：Beyond Outlining: Heterogeneous Recursive Planning for Adaptive Long-form Writing with Language Models
论文地址：https://arxiv.org/pdf/2503.08275
项目主页 & 在线 Demo：http://writehere.site/
GitHub 仓库：https://github.com/principia-ai/WriteHERE

动态规划颠覆传统

从「大纲先行」到「实时编织」

现有 AI 长文生成系统（如 Agent's Room、STORM）多将写作简化为「规划 - 填充」的线性流程，而 WriteHERE 首次通过数学形式化揭示：长文写作本质上是检索（Retrieval）、推理（Reasoning）、写作（Composition）三类异构任务的动态编织。

1. 写作代理系统的五元组定义

研究团队将写作系统抽象为数学元组：

其中：

：Agent 内核，负责任务调度与决策。
：内部记忆，存储大纲、草稿、检索结果。
：外部数据库，包括搜索引擎、参考文献。
：工作空间，承载文本生成与编辑。
：输入输出接口，连接用户与信息源。

这一形式化框架突破了传统 AI 写作工具「重生成、轻管理」的设计范式。写作不再是简单的文本扩展，而是记忆空间、工作空间与外部环境的持续交互过程。

2. 任务类型的数学建模

研究团队将写作过程解构为三类原子操作：

检索任务：针对信息需求，从环境获取知识更新记忆。
推理任务：基于知识解决推理问题，如逻辑校验、结构优化。
写作任务：基于知识，在状态为的工作空间中生成满足目标的文本。

规划问题的形式化革命

从 HTN 到异质递归

研究团队受层次任务网络（HTN）规划启发，提出写作规划问题的数学定义：

顶层写作任务：包含目标、初始工作空间状态、初始记忆内容。
原子任务集合：可执行的检索、推理、写作原子操作。

解决方案为满足以下条件的原始操作序列：

可执行性：每个操作的前置条件均被满足。
目标达成：最终工作空间状态符合写作目标。

核心技术

异质性递归与状态化 DAG 任务管理

WriteHERE 的核心突破体现在两大技术创新：

1. 异质任务递归分解：每个写作任务被动态标注类型（检索 / 推理 / 写作），并基于类型分解为子任务，直至可执行的原子任务。例如，当执行「撰写贸易报告第六章：行业深度剖析：识别赢家与输家」，系统进一步分解为以下子任务：

检索任务：收集最新 (截至 2025 年 4 月) 的行业数据，包括科技 (半导体、软件、硬件)、汽车、农业、制药 / 医疗保健、能源和消费品行业的贸易统计、市场份额、公司财务表现、行业报告及专家评论。
推理任务（8 个子任务）：构建统一分析框架，确立「赢家」和「输家」识别标准；分别分析科技、汽车、农业、制药 / 医疗保健、能源和消费品行业的关税、非关税措施、宏观经济状况及全球价值链重构影响；规划行业绩效对比可视化内容。
写作任务（8 个子任务）：撰写章节引言；分别撰写科技、汽车、农业、制药 / 医疗保健、能源和消费品六大行业的详细分析；撰写章节结论，综合关键发现并过渡至下章区域视角。

2. 状态化层次调度算法：任务依赖关系以有向无环图（DAG）管理，结合任务状态（激活 / 挂起 / 静默）实现自适应执行。该机制确保系统能根据实时反馈动态调整规划深度，例如在贸易报告中，系统能追踪每个子任务的状态，确保在撰写特定章节（如区域分析）前完成其所有依赖任务（如宏观经济影响分析）。

实验表现

全面碾压现有方案

团队在小说创作（Tell me a story 数据集）和技术报告生成（WildSeek 数据集）两大任务中验证了 WriteHERE 的优越性：

小说写作：基于 GPT-4o 和 Claude-3.5-Sonnet，WriteHERE 在情节结构、创意性、角色塑造等维度全面领先。当生成长度从 2000 词扩展至 8000 词时，其优势进一步扩大，整体胜率较 Agent's Room 超过 90%（见图 1）。
技术报告：在信息相关性、覆盖广度、深度等关键指标上，WriteHERE 以接近满分的表现（平均 4.9/5）超越 STORM 和 Co-STORM。对比移除异质递归规划模块的消融实验，性能显著下降，印证了该设计的核心价值（见图 2）。

图 1 小说写作任务评测

图 2 报告写作任务评测

压力测试

百页报告生成

研究团队公开的超 100 页《2025 年 Q2 全球贸易战深度报告》展现了框架的极致能力：

系统自动构建了一个包含 16 个主要章节、超过 80 个子任务的异质递归计划，涵盖引言、全球关税结构、非关税壁垒、宏观经济冲击、全球价值链重构、行业赢家与输家、地区分析、未来预测等内容。整个生成过程体现了异质递归规划的优势 —— 系统能够自动根据需要深入研究特定主题（如美国 232 条款钢铝关税扩张），同时保持对整体结构的把控，确保各章节之间的连贯性和一致性。最终报告包含超过 44,000 字的正文，覆盖从关税机制到行业赢家的全面分析。