AI在线 AI在线

华为与浙大携手发布 DeepSeek-R1-Safe 大模型:AI安全与性能完美平衡

在刚刚结束的华为全联接大会上,华为技术有限公司联合浙江大学推出了国内首个基于昇腾千卡算力平台的基础大模型 ——DeepSeek-R1-Safe。 这一创新性产品旨在解决当前 AI 领域面临的安全与性能问题,开创了智能科技的新篇章。 浙江大学计算机科学与技术学院的院长任奎在会上详细介绍了这一模型的核心创新。

在刚刚结束的华为全联接大会上,华为技术有限公司联合浙江大学推出了国内首个基于昇腾千卡算力平台的基础大模型 ——DeepSeek-R1-Safe。这一创新性产品旨在解决当前 AI 领域面临的安全与性能问题,开创了智能科技的新篇章。

浙江大学计算机科学与技术学院的院长任奎在会上详细介绍了这一模型的核心创新。DeepSeek-R1-Safe 是通过一个全流程的安全后训练框架构建而成,涵盖了高质量的安全语料库、平衡优化的安全训练以及自主创新的软硬件平台。这一框架的设计旨在从底层解决 AI 模型在安全训练中的关键问题。

值得一提的是,DeepSeek-R1-Safe 在千亿级参数的安全训练中实现了突破,其防御能力表现惊人。测试数据显示,该模型在对抗有毒有害言论、政治敏感内容及违法行为教唆等 14 个维度的有害信息时,整体防御成功率接近 100%。而在多种越狱模式的防御上,成功率也超过了 40%。综合安全防御能力高达 83%,在与同类模型 Qwen-235B 和 DeepSeek-R1-671B 的对比中,表现优越,超出 8% 至 15%。

此外,在 MMLU、GSM8K、CEVAL 等通用能力基准测试中,DeepSeek-R1-Safe 的性能损耗控制在 1% 以内,这表明其不仅提高了安全防护能力,同时也确保了模型的可用性,成功达成了安全与性能的平衡。

华为昇腾计算业务总裁张迪煊在会上表示,华为正在积极推动基础软件创新与 AI 安全能力建设,通过开放协作与高校和产业伙伴共同推动技术进步。同时,该模型也已在 ModelZoo、GitCode、GitHub、Gitee 等社区全面开源,让更多开发者和研究人员能够参与其中。

这一里程碑式的发布不仅为 AI 安全领域带来了新的希望,更为未来的 AI 产业生态协同发展铺平了道路。

相关资讯

DeepSeek称遭到大规模恶意攻击,注册或受影响

DeepSeek发布公告称其线上服务近期遭受了大规模恶意攻击,导致注册过程可能变得繁忙。 DeepSeek提醒用户,如果遇到注册困难,可以稍等后重试。 已注册用户可以正常登录,不受影响。
1/28/2025 10:37:00 AM
AI在线

“新神登场”,消息称 DeepSeek R2 模型有望 5 月前发布

据路透社报道,三位知情人士透露,DeepSeek 正在加速推出其 R2 人工智能模型,该公司最初计划在五月推出,但目前正在努力尽快推出。
2/25/2025 8:18:29 PM
归泷(实习)

“腾讯元宝电脑版”正式发布:混元大模型 / DeepSeek 双模切换,支持 AI 搜索、总结、写作等核心能力

腾讯元宝电脑版正式上线,支持Windows和macOS系统,集成了混元大模型和DeepSeek大模型,提供AI搜索、总结、写作等核心功能。此外,还能解析多种格式文档,并融入腾讯文档、电脑管家等生态产品,提升工作效率。#腾讯元宝##AI助手#
3/1/2025 12:39:46 PM
漾仔
  • 1