AI在线 AI在线

讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型

AI在线 7 月 25 日消息,科大讯飞今日发布公告,宣布基于全国产算力训练的深度推理大模型 —— 讯飞星火 X1 升级版正式上线。 此次升级,星火 X1 在多个任务上持续进步,综合能力再升级,特别是在翻译、推理、文本生成、数学、多语言上效果亮眼。 同时,在幻觉治理方面,对于大模型自身生成内容是否符合客观事实的事实性幻觉治理,以及在用户给定额外参考资料时大模型回复是否忠于原文的忠实性幻觉治理两方面均取得明显进步,显著提高了大模型行业落地应用的可靠性。

AI在线 7 月 25 日消息,科大讯飞今日发布公告,宣布基于全国产算力训练的深度推理大模型 —— 讯飞星火 X1 升级版正式上线。

此次升级,星火 X1 在多个任务上持续进步,综合能力再升级,特别是在翻译、推理、文本生成、数学、多语言上效果亮眼。

同时,在幻觉治理方面,对于大模型自身生成内容是否符合客观事实的事实性幻觉治理,以及在用户给定额外参考资料时大模型回复是否忠于原文的忠实性幻觉治理两方面均取得明显进步,显著提高了大模型行业落地应用的可靠性。

这是一次全面的跃升:

综合能力大幅提升。整体效果对标 OpenAI o3 等国内外一流大模型最新版本效果,在翻译、推理、文本生成、数学等方面保持领先。

幻觉治理取得显著进步。幻觉问题是掣肘大模型落地应用的关键问题,升级后的星火 X1 在幻觉治理方面领先业界主流模型。

多语言能力已覆盖 130 + 语种。为世界提供全栈自主可控大模型底座的“第二种选择”。

基于星火 X1 底座的语音同传大模型在翻译效果、实时响应、语音听感、专业精深等方面大幅跃升,持续行业领先。

得益于星火 X1 模型的升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体也取得了新的进步,在复杂行业场景任务上进一步解决用户关键刚需。

星火 X1 最新升级的能力可直接在讯飞星火网页版和 App 进行体验,全新 API 已同步上线讯飞开放平台

测试方面,今年 6 月,在国内大模型挑战全国高考数学一卷的评测中,星火 X1-0420 版本突破了 140 分。本次升级,数学能力再次精进。

讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型

讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型

讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型

科大讯飞表示,它采用了业界首创基于文本自适应调度的流式语音合成技术,让“译”与“说”无缝耦合,在语音听感上的自然度、拟人度和舒适度显著跃升。

在翻译效果上,基于内容完整度、信息准确度、语言质量等多方面主客观评价计算翻译综合质量得分(分值 0~100 分),新版本同传大模型效果较 2025 年 1 月首发版本提升 20%,特别是有效消除了传统同传的碎片化割裂感,在多人会议等复杂场景中英双向翻译得分可达 80 分以上,单人演讲翻译得分超 90 分。

新模型还具备智能双语识别功能,能够自动识别中英文混合发言并实时切换翻译方向。在双边会议、国际商务洽谈等中英交替的场景中,参会者可以随时用母语发言,有效避免了因语言切换操作而造成的交流中断。最新语音同传大模型已经在讯飞双屏翻译机 2.0、讯飞 AI 录音笔、讯飞同传等产品中全面上线。

讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型

讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型

讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型

讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型

讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型

讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型

面向软件研发提质增效的星火代码大模型有效提升了项目级代码理解与生成、单元测试智能体、WEB 应用对话式编程等核心任务表现。目前,星火代码大模型已深度赋能金融、制造、能源、科技等 100 余家关键领域客户,在典型应用场景中驱动研发效率提升超过 50%。

AI在线附讯飞星火 X1 官方地址:https://xinghuo.xfyun.cn/deskhttps://xinghuo.xfyun.cn/sparkapihttps://agent.xfyun.cn/home

相关资讯

答对有资格入职特斯拉?马斯克这道数学题,我们用七大 AI 模型测了一遍

此前,马斯克在社交平台 X 上贴出了一道数学题,并表示如果有人解开这个问题,就有资格在特斯拉公司工作,引起了很多网友的讨论
4/27/2025 2:57:01 PM
汐元

讯飞星火医疗大模型称霸 MedBench 榜单,助力基层医疗再升级

讯飞官方发布消息,旗下的讯飞星火医疗大模型在最新的 MedBench 榜单中脱颖而出,以95.4的高分荣登榜首。 这一成就标志着讯飞在医疗人工智能领域的又一次突破,尤其是在复杂医学推理、医学语言理解和医疗安全等核心能力上,均展示出强大的优势。 MedBench 是由上海人工智能实验室联合多家机构共同建立的中文医疗大模型评测平台,旨在为医疗领域提供全面的能力评估。
6/18/2025 10:01:54 AM
AI在线

基于全国产算力训练,讯飞星火 X1 升级版深度推理大模型后天上线

AI在线 7 月 23 日消息,科大讯飞今天通过官方公众号宣布,讯飞星火 X1 升级版将于 7 月 25 日(后天)正式上线。 讯飞星火 X1 是基于全国产算力训练的深度推理大模型,官方表示,此次升级将带来如下亮点:综合能力大幅提升:在数学、翻译、推理、文本生成等方面保持领先。 幻觉治理显著进步:慢思考模式的幻觉治理准确率大幅领先,大模型回复更加可靠。
7/23/2025 3:07:01 PM
清源
  • 1