AI在线 AI在线

连续俩月霸榜全球第一的数据分析智能体,终于开源啦!

12月13日,第二届CCF中国数据大会上,蚂蚁数科宣布开源旗下数据智能体关键技术Agentar SQL全套论文、代码、模型和使用指南。 该智能体技术可让非专业人员通过日常语言进行商业数据查询和分析,为企业数智化提供更精准可用的智能数据分析基座。 蚂蚁数科首期开源实时文本转化结构化查询语言(Text-to-SQL)框架,为开发者提供一套开箱即用的数据查询方案,提升文本与数据库查询交互效率。

12月13日,第二届CCF中国数据大会上,蚂蚁数科宣布开源旗下数据智能体关键技术Agentar SQL全套论文、代码、模型和使用指南。该智能体技术可让非专业人员通过日常语言进行商业数据查询和分析,为企业数智化提供更精准可用的智能数据分析基座。

蚂蚁数科首期开源实时文本转化结构化查询语言(Text-to-SQL)框架,为开发者提供一套开箱即用的数据查询方案,提升文本与数据库查询交互效率。2026年,蚂蚁数科将陆续开源数据库理解与挖掘、行业知识挖掘、实时多轮交互技术框架,覆盖意图理解、业务理解到数据理解的全链路数据能力。

记者了解到,在某头部城商行试运营期间,蚂蚁数科Agentar SQL多个工具的平均查询准确率超92%,较传统查询方案提升超3倍。

连续俩月霸榜全球第一的数据分析智能体,终于开源啦! 今年9月25日,由该技术支持的蚂蚁数科数据分析智能体Agentar-Scale-SQL登顶全球最具权威性的自然语言转结构化查询语言(NL2SQL)评测基准BIRD-SQL,超越Google等诸多国内外厂商。目前,该智能体仍在执行准确率排行榜以及执行效率榜保持双榜第一,已持续领跑超两月。  BIRD-SQL要求AI模型将自然语言查询转换为SQL,并且在真实复杂的大规模生产级数据库中稳定执行。其数据集覆盖金融、电力、医疗等37个真实行业场景,总量33GB,包含超过1万条高复杂度查询任务,被认为是全球最难的NL2SQL测试。

连续俩月霸榜全球第一的数据分析智能体,终于开源啦!

研究机构预测,全球商业智能市场规模2025年达474.8亿。中国商业智能与分析软件市场规模2025年达12亿。预计到2028年,中国商业智能软件市场规模将达到17.9亿美元,未来5年市场年复合增长率(CAGR)为12.7%,成为未来构建企业智能技术的重要且必要的投资领域。

目前,中国企业对商业智能与分析产品的使用深度差异较大,大部分集中在报表、驾驶舱、仪表板、数据大屏等数据可视化和简单分析需求。而如何在保持准确性的前提下,提升在真实生产环境中的可用性被认为是NL2SQL在产业中规模化落地的普遍挑战。

蚂蚁数科AI技术负责人章鹏在会上指出,NL2SQL在实际落地中面临四大严峻挑战:理解模糊多义的人类口语、注入庞大的行业专业知识、解析复杂的数据库结构与关联,以及生成准确无误的复杂SQL语句。这些挑战意味着,简单的模型“套壳”远不足以满足企业级应用的可靠性与准确性要求。

例如金融领域从业者往往需要结合复杂业务规则与多条件组合进行数据查询才能有效地进行产品数据分析;业务管理中,非专业数据分析人员口语化提问,则需要背后的产品保证行业术语、询问意图的正确理解,再与数据库字段精准匹配,才能产出真实准确的结果。

章鹏强调,BIRD-SQL主要评测SQL的复杂度生成能力(在线扩展Online Scaling),但要真正实现产业可用的NL2SQL乃至数据智能体技术,必须构建更完整的能力栈。除了在线扩展,还需包含:

1. 离线扩展(Offline Scaling):对数据库的深度理解与知识结构化。 2. 人机交互(Human Interaction):智能体识别自身不确定性,主动与用户澄清意图,实现白盒化、可纠错的协作。 3. 自我进化(Self Evolution):通过“记忆”优化、工具(如UDF)创建与复用等“免调优”技术,使智能体能够从错误中学习,持续提升,降低对大量标注数据和专家调优的依赖。

蚂蚁数科计划逐步将这些更全面的能力模块持续开源,如理解数据库的Agentar Profiling-SQL、实现免调优进化的Agentar TuningFree-SQL等。首期在线扩展框架Agentar-Scale-SQL开源内容已发布在arXiv、GitHub、ModelScope及Hugging Face等平台,并迅速获得了开发者的关注。

相关资讯

蚂蚁数科发布金融智能体开发平台Agentar  内测上线超百个金融MCP服务

4月29日,在数字中国建设峰会期间,蚂蚁数科正式对外发布智能体开发平台Agentar,为金融机构提供一站式、全栈的智能体开发工具,助力金融机构高效打造能够自主决策、可信可靠的金融智能体应用,加速AI技术从“辅助工具”真正成为驱动体验变革、效率跃升的“生产力引擎”。 随着生成式AI的快速发展,行业大模型及智能体应用正在重塑金融服务。 然而,大模型训练成本高昂难以在普惠场景中规模化复制;金融行业数据的高敏感性与安全合规要求;以及金融核心场景数据样本量较小、通用模型在金融专业场景中泛化能力不足等问题都在制约大模型技术在金融行业应用的深度与广度。
4/29/2025 4:00:40 PM
AI在线

​蚂蚁数科发布金融智能体开发平台 Agentar,推动 AI 技术在金融领域应用

在数字中国建设峰会期间,蚂蚁数科正式推出了智能体开发平台 Agentar。 该平台旨在为金融机构提供一站式、全栈的智能体开发工具,帮助它们高效地打造具备自主决策能力、可信赖的金融智能体应用。 此次发布标志着 AI 技术从 “辅助工具” 转变为推动金融服务变革和效率提升的 “生产力引擎”。
4/30/2025 12:00:40 PM
AI在线

ScaleOT框架亮相AAAI 2025:提升隐私保护50%,降算力成本90%

近日,在全球人工智能顶级学术会议AAAI2025期间,蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出创新的跨域微调(offsite-tuning)框架——ScaleOT。 该框架能在模型性能无损前提下,将隐私保护效果提升50%,与知识蒸馏技术相比,算力消耗显著降低90%,为百亿级参数模型的跨域微调提供高效轻量化方案,论文因创新性入选AAAI的oral论文(本届大会近13000篇投稿,口头报告比例仅4.6%)。 跨域微调是目前业内保护模型产权与数据隐私的主流方案,通过有损压缩将大模型转换为仿真器,数据持有方基于其训练适配器并返回给大模型完成调优,数据和模型均未出域,可保护双方隐私,但存在局限性:一是“均匀抽积木”式处理易致模型关键层缺失,使性能显著下降;二是用蒸馏技术弥补性能损失,计算成本高;且现有方法隐私保护缺乏灵活性。
2/26/2025 2:13:00 PM
AI在线