新浪科技讯 7月19日下午消息,为准确衡量AI模型的效果和鲁棒性,7月18日,清华大学、阿里安全、RealAI发布了全新版本的AI安全对抗攻防基准平台,提前给AI找好“陪练”和“标尺”,打造更健壮可靠的AI。据介绍,相较于去年三方发布的AI Benchmark 1.0,今年AI Benchmark 2.0包含全面、系统的攻防基准,更符合工业界的评测基准,更贴近线上的攻击评测基准。
“新平台从原来只有CIFAR10数据上的实验,拓展到了ImageNet 百万级数据集上的攻防评测,更加贴近工业界的实际场景。今年还覆盖了对模型未知情况下的迁移攻击,贴近线上攻击评测。此外,今年还增加了分布外的鲁棒性评测,更加全面地评估模型鲁棒性。”阿里高级安全专家越丰介绍。
清华大学计算机系副研究员苏航介绍,鲁棒性benchmark的构建对评估人工智能模型的安全风险、推动该领域的发展具有重要意义。AI Benchmark 2.0将对使用者免费提供18个ImageNet上的对抗训练模型,包含更多的攻击场景,覆盖几十种典型的攻防算法,并提供了SOTA的鲁棒模型,为人工智能安全的研究具有一定的推动作用,可让研究人员发现AI被攻击后产生的问题,为行业提供参考,并将AI学术研究引导至更贴近实际场景的应用研究。