AI在线 AI在线

Litex:面向高效形式化验证的极简语言设计与实践

上海人工智能实验室和复旦大学的研究团队近日开源了 Litex——一门专为降低形式化推理门槛而设计的极简语言。 该项目致力于解决传统形式化语言(如 Lean、Coq)学习曲线陡峭的问题,使任何背景的开发者都能够在 1-2 小时内掌握基本的形式化证明编写能力,而非传统的 3-6 个月学习周期。 在过去的一年里,Litex 在开源社区引起了持续关注。

上海人工智能实验室和复旦大学的研究团队近日开源了 Litex——一门专为降低形式化推理门槛而设计的极简语言。该项目致力于解决传统形式化语言(如 Lean、Coq)学习曲线陡峭的问题,使任何背景的开发者都能够在 1-2 小时内掌握基本的形式化证明编写能力,而非传统的 3-6 个月学习周期。

在过去的一年里,Litex 在开源社区引起了持续关注。上周,该项目登上 Hacker News 全球趋势榜前十,引发了大量开发者围绕形式化语言可用性展开讨论。这一关注度背后,反映的是形式化验证技术在 AI 推理领域日益凸显的重要性。

当前,从 DeepSeek-R1 到 Alpha-Proof 等顶级推理模型都在采用形式化语言来确保推理过程的可验证性。这意味着 AI 系统不仅需要给出答案,还要能够提供严格的推导证明。然而,现有形式化语言的高学习成本成为了技术普及的主要障碍——即使是经验丰富的程序员,也往往需要数月时间才能熟练编写形式化证明。

Litex 的设计目标是让形式化推理过程变得如同编写数学算式一般自然。通过简化语法和概念模型,该项目有望显著降低构建形式化数据集的成本,从而加速这一领域的研究进展。目前,Litex 已在 GitHub 开源,并吸引了来自全球的开发者参与贡献。Litex:面向高效形式化验证的极简语言设计与实践

图1:Litex项目在Hacker News全球趋势榜上排名前十,显示了国际开发者社区对Litex的高度关注

试想一下,即使是10岁的小朋友,也能直觉地理解数学推理是怎么回事,也能进行简单的数学推理并读懂他人的推理。他们也可以阅读福尔摩斯,理解他探案的思路。人类的推理过程,被数学家证明是可以代码化的。写成代码的数学语言,被称为形式化语言。形式化语言作为推理逻辑最直白、最简洁的表达方式,理应比用自然语言来描述推理过程更加高效。

Litex致力于在1-3年内成为AI推理的基础设施,通过降低门槛让形式化推理从专家级技术变为普及级工具,提升效率将数据构建成本降低10倍加速AI推理能力发展

技术背景:AI推理的"最后一公里"难题Litex:面向高效形式化验证的极简语言设计与实践

                          图2:Litex官方Logo,体现了简洁直观的设计理念

强化学习让 AI 能与自己对弈,并以胜负作为奖励不断提升;同样的方法也可以用于“自出题、自解题”,借助形式化语言提供的绝对精准奖励来增强解题能力。由此可见,形式化语言有望加速 AI 数学能力、AI推理能力的突破,迎来属于它的 AlphaGo 时刻。在强化学习之外,大模型在自然语言理解和生成方面取得了显著进展,但在需要严格逻辑推理的数学和科学计算领域,仍然存在准确性和可解释性的挑战,因此对形式化语言也有很大需求。

然而,现有的形式化语言如Lean、Coq等存在一个根本性问题:学习门槛极高。即使是经验丰富的程序员,也需要花费数月时间才能掌握这些语言的基本用法。这严重限制了形式化推理技术的普及和应用。

Litex的技术创新:从"翻译"到"直觉"

Litex的核心创新在于其设计哲学的根本转变。传统形式化语言要求用户将数学思维"翻译"成复杂的语法结构,而Litex则追求与人类数学直觉的"零差异"表达。传统形式化语言学习需要3-6个月,而Litex学习需要1-2小时。

技术对比:直观性革命

让我们通过一个具体的数学问题来对比Litex与传统形式化语言的差异:

问题:求解二元一次方程组

2x + 3y = 10

4x + 5y = 14Litex:面向高效形式化验证的极简语言设计与实践

Litex实现(2分钟完成):

对比结果令人震撼:Litex的代码几乎就是数学表达式的直接映射,而Lean需要掌握大量的tactics(如rw、ring、norm_num等)和复杂的类型系统。更多例子欢迎访问Litex官网。

Litex虽然年轻,但已经构建了非常完备的工具链,包括可交互的在线沙盒、LaTeX翻译功能、Python集成等。

在线交互沙盒:

能告诉用户一步步的推理是怎么被Litex验证的。这里的例子是三段论:乔丹是人,人都有智慧,所以乔丹有智慧。可以看到,最后我们问Litex为什么乔丹有智慧,它告诉我们,因为乔丹是人,人都有智慧。Litex:面向高效形式化验证的极简语言设计与实践

图3:Litex三段论推理演示,展示如何用Litex表达和验证"乔丹是人,人都有智慧,所以乔丹有智慧"的逻辑推理

Python集成:

可以直接在Python中调用。这对AI研究员来说非常方便,因为AI研究员通常使用Python进行数据处理和模型训练。Litex:面向高效形式化验证的极简语言设计与实践

图4:Litex Python集成演示,展示如何在Python环境中直接调用Litex进行形式化推理

LaTeX翻译功能:

Litex代码甚至能被Litex内核翻译成LaTeX(不借助大模型,用固定的规则)。这对用户接受Litex非常友好。下面是一个例子以及它被翻译成LaTeX后,用户可以看到的展示效果。

Litex:面向高效形式化验证的极简语言设计与实践图5:Litex在线沙盒演示,展示Litex代码如何自动翻译成LaTeX格式,便于用户理解和分享

设计原则:三大核心特性

Litex的设计围绕三个核心原则展开:

1、直观性(Intuitive):代码与数学表达式的"零差异"

2、简单性(Simple):摒弃复杂的语法和语义结构

3、表达力(Expressive):支持从基础数学到高级抽象的各种推理任务

实际效果验证:数据说话

Litex团队已经通过多个维度的实验验证了其技术优势:

AI推理性能测试

GSM8K数据集上SFT模型准确率达93.5%,显著超越传统方法

用Agent把GSM8k翻译成Litex,成功率100%,无需任何训练

自然语言→Litex翻译准确度检查器,准确率已达98%

核心语言特性

Litex摒弃了传统形式化语言中的复杂概念:

无需掌握have、by、rw、simp、exact等tactics

无需复杂的类型声明和证明策略:这对人类用户非常友好,因为人从小到大学习数学的思考方式,与Litex的书写方式高度一致

直接支持数学表达式的自然书写:这对大模型训练很重要,因为大模型阅读过无数的自然语言文本,而Litex接近自然语言的特性,使得大模型很容易学会Litex并进行推理

行业认可:顶级机构的背书Litex:面向高效形式化验证的极简语言设计与实践

图6:Litex吉祥物Little Little O,象征着Litex让形式化推理变得简单友好的理念

Litex项目虽然年轻,但已经获得了广泛的行业认可:

GitHub获得512+⭐,关注者来自DeepSeek、字节Seed、蚂蚁数科、清华、北大、港中文、复旦等顶尖机构

CCF(中国计算机协会),蚂蚁数科,联合上海人工智能实验室 举办AIfor formal language比赛,基于Lean语言和Litex语言

相关机构非常看好它在科学探索、可信AI、AI for Math、Math for AI等领域的应用。Litex致力于未来成为AI推理的基础设施,通过构建大规模数学推理数据集和训练专用推理模型,最终打造可信AI生态,让形式化推理从专家级技术变为普及级工具。

Litex采用完全开源策略,欢迎全球开发者和研究者参与。已经开源的项目包括官网上的在线沙盒、教程、语法速查表,Hugging Face上的数据集,GitHub上的内核、标准库、Agent、任务验证器、LLM开发框架等。可以关注Litex的社交媒体账号,获取最新的项目进展和社区动态。

- 官网:https://litexlang.org

- GitHub(欢迎点⭐️支持!):https://github.com/litexlang/golitex

- 社区: https://litex.zulipchat.com/join/c4e7foogy6paz2sghjnbujov/

- 邮箱:[email protected]

- 小红书: 名字是 Litexlang,id是 27446152057

- B站: 关注 Litexlang

- x.com: Litex@litexlang 

相关资讯

AI革新科研模式,上海AI Lab「AI4S攀登者行动计划」开放申请

驱动科学研究的人工智能(AI for Science,以下简称 AI4S)正逐渐改变科学研究的模式,然而学科之间的「烟囱式」发展模式,既容易造成资源分散和重复投入,也在一定程度上制约颠覆性成果涌现。 同时,由于 AI4S 具有「极宏观拓展、极微观深入、极端条件迈进、极综合交叉」的特性,使得具有重大意义的变革性突破,难以从现有组织模式中诞生——这类突破超出了单一团队的研究能力,需要依赖大规模研究、工程与系统协作,而早期价值又难以被商业风投支持——「AI4S 攀登者行动计划」旨在解决这一难题。 如果你渴望突破 AI4S 传统研究模式的限制,欢迎申请加入「AI4S 攀登者行动计划」,与我们共同推动下一代技术变革。
1/24/2025 5:36:00 PM
机器之心

合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源

近日,上海人工智能实验室(上海 AI 实验室)开源了生成式世界模型 AETHER。 该模型全部由合成数据训练而成,不仅在传统重建与生成任务中表现领先,更首次赋予大模型在真实世界中的 3D 空间决策与规划能力,可助力机器人完成目标导向的视觉规划、4D 动态重建、动作条件的视频预测等复杂任务。 研究团队将几何重建与生成式建模深度融合,首创「重建 — 预测 — 规划」 一体化框架,通过 AETHER 使大模型能够感知周围环境,理解物体之间的位置、运动和因果关系,从而做出更智能的行动决策。
4/20/2025 2:31:00 PM
机器之心

视觉语言模型新突破!Visual ARFT 助力多模态智能体能力

随着人工智能的迅猛发展,尤其是在大型推理模型领域,如 OpenAI 的 o3,研究者们正在努力让这些模型具备更强的智能体能力。 这种能力不仅仅局限于文本处理,更扩展到了图像理解与操作。 近日,来自上海交通大学、上海人工智能实验室、香港中文大学和武汉大学的研究团队推出了一种名为 Visual-ARFT(视觉智能体强化微调)的新方法,旨在提升视觉语言模型的多模态智能体能力,使其能够更灵活地执行复杂任务。
5/27/2025 6:00:50 PM
AI在线
  • 1