Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

【CDT关注】德国之声|华为浙大开发基于核心价值观的DeepSeek-R1-Safe

25 September 2025 at 19:56

9月18日,华为技术有限公司与浙江大学联合发布了中国首个基于升腾千卡算力平台的DeepSeek-R1-Safe基础大模型。据悉,DeepSeek-R1-Safe基于国内外法律法规与核心价值观,构建了中英文双语的安全语料。测试结果表明,DeepSeek-R1-Safe针对“有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题”整体防御成功率近100%。

相关阅读:

CDT 档案卡
标题:原标题:华为浙大开发Deep Seek安全版,百分百防御“有害问题”
作者:德国之声
发表日期:2025.9.25
来源:德国之声
主题归类:DeepSeek
CDS收藏:老大哥馆
版权说明:该作品版权归原作者所有。中国数字时代仅对原作进行存档,以对抗中国的网络审查。详细版权说明

以下是德国之声相关报道的节选内容:

华为在公司微信公众号上发布消息称,它使用了1000块升腾AI芯片来训练大语言模型,该模型是根据DeepSeek-R1的开源模型进行调整而来的。据华为的发布,测试结果表明,DeepSeek-R1-Safe 针对“有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题”整体防御成功率近100%。(德国之声)

另据昇腾社区的DeepSeek-R1-Safe介绍页面,其中提到:

我们基于国内外法律法规与核心价值观,构建了中英文双语的安全语料。其中语料不仅包含了带有安全思维链的标注,还提供了相应的安全回复,可用于大模型的安全训练、微调以及测试。

file

而在浙江大学ZJUAISafety的github页面上,“核心价值观”的内容未提及:

我们严格依据中国、美国、欧盟等多地域法律与伦理标准进行了安全规则融合,在语料结构中加入了显式安全推理链,并引入了最新越狱攻击方法,丰富了训练样本攻击策略,从而使得模型在实际场景中的安全鲁棒性得到强化。这份高质量的数据集,可用于大模型的安全训练、微调以及测试。

file

❌
❌