基于语义和隐蔽性约束的知识图谱嵌入投毒攻击 焦点精选
2023-06-14 10:14:29 来源:互联网
在2023年5月举办的Proceedings of the ACM Web Conference 2023 (WWW 2023)中,我实验室白泽智能团队提出了基于语义和隐蔽性约束的知识图谱嵌入投毒攻击(MaSS: Model-agnostic, Semantic and Stealthy Data Poisoning Attack on Knowledge Graph Embedding),该研究揭示了基于开放式知识图谱的图谱嵌入的数据投毒攻击风险,通过插入恶意事实到开放知识图谱实现相应知识图谱嵌入的控制,同时该攻击方法能绕过现有的检测防御算法。
随着图嵌入模型技术的不断发展,其相关技术在近年来被越来越多地应用在知识图谱的数据挖掘场景中。例如,在问答系统中,图嵌入模型通过对海量知识图谱中数据的建模,可以有效地挖掘实体之间的潜在关联,从而帮助系统更好地推荐符合要求的答案。为了使得知识图谱的数据量满足图嵌入模型的学习需求,现有系统往往通过公开的数据源来扩充数据集,例如通过自动化爬取维基百科上的信息来构建大规模的知识图谱。然而,这样开放式的数据爬取机制也带来了数据投毒攻击的安全风险,即攻击者可以通过对公开的数据源(例如维基百科)进行篡改(比如插入带有恶意目标的知识,以下称为恶意事实),影响基于该公开数据源的知识图谱,从而进一步影响图嵌入模型的学习和基于相应知识图谱嵌入的下游机器学习模型(如图1所示)。
(资料图片)
图(1)针对知识图谱图嵌入模型的数据投毒攻击示意图
文章从:(1)黑盒假设:攻击者通常无法观测到图嵌入模型的参数甚至结构;(2)语义约束:开放式数据库或者知识图谱通常会使用一些错误事实检测模型对异常信息做过滤,想要插入恶意信息需要绕过这些检测方法;(3)攻击隐蔽性:当嵌入模型完成训练后,模型部署者会通过验证集来检验图嵌入模型的质量,当攻击者插入的错误事实影响嵌入的质量时比如在验证集上的预测准确度,就会被模型部署者意识到数据源被污染过或被丢弃;三个知识图谱嵌入投毒攻击需要考虑的约束出发设计了攻击框架。
首先,针对黑盒假设,基于现有知识图谱嵌入模型可以有效地学习知识图谱的拓扑结构,文章设计了一种基于逻辑推理事实链插入的知识图谱数据投毒攻击框架。知识图谱嵌入模型在有效地学习拓扑结构的时候,就可以捕捉到插入的推理事实链包含的信息,从而得出指定的学习结果。
基于以上攻击框架,针对第二点,文章引入了知识图谱上实体和关系的先验信息,提出了一种语义约束下的推理事实链搜索方法。在知识图谱上,每种关系都可以被表示成已有关系组成的语义逻辑链;对于每个实体,根据其种类其可以相连接的关系是固定的。根据以上实体和关系的约束,使得搜索得到的逻辑链满足语义的同时帮助极大缩小搜索空间。
最后针对第三点,为了不影响知识图谱嵌入的正常性能,在黑盒攻击框架的基础上,提出了隐蔽性约束下的推理事实链排序方法。详细而言,在生成事实链的过程中要使得插入的恶意事实的不能是异常事实,否则将影响其他正常事实的学习。这要求攻击者插入的恶意事实对于嵌入模型的置信度要比较高,接近于正常的事实。为了能在学习嵌入之前获得该这些事实的置信度,文章引入预训练的知识图谱嵌入模型,根据这些模型对待插入逻辑链中的事实进行分别打分并计算总体置信度分数,从而确定最终插入的逻辑链。整体攻击框架如图(2)所示。
图(2)基于语义和隐蔽性约束的黑盒攻击框架
大量实验结果验证了提出的理论框架的有效性,黑盒攻击成功率相比于已有研究相对提升了约300%(在三个数据集和五种图嵌入模型上的平均结果)。同时,得益于提出的两种约束(语义性和隐蔽性),攻击所产生的错误事实不仅可以躲避潜在的异常检测算法,同时不会影响图嵌入模型的正常性能,比如在WN18RR数据集上,接近100%的错误事实都不会被异常检测算法检测出来,知识图谱嵌入模型在干净数据上的预测表现几乎没有下降。
团队简介
白泽智能团队负责人为张谧教授,隶属于杨珉教授领衔的复旦大学系统软件与安全实验室的白泽智能团队。该团队主要研究方向为AI系统安全,包括AI供应链安全、数据隐私与模型保护、模型测试与优化、AI赋能安全等研究方向,在S&P、USENIX Security、CCS、TPAMI、ICML、NeurIPS、KDD等网络安全和AI领域国际顶会顶刊已发表论文30余篇。
张谧教授个人主页:https://mi-zhang-fdu.github.io/index.chn.html
白泽智能团队(Whizard AI):https://whitzard-ai.github.io/
供稿:游小钰
审核:高泽晨、潘旭东、洪赓
排版:边顾
[责任编辑:]
相关阅读
- (2023-06-14)基于语义和隐蔽性约束的知识图谱嵌入投毒攻击 焦点精选
- (2023-06-14)“龙舟水”发威 降雨“车轮战” 广西启动重大气象灾害(暴雨)Ⅳ级应急响应,高温暂时退场|世界快消息
- (2023-06-14)当前最新:中国为促进城乡可持续发展提供示范
- (2023-06-14)把握制造业转型升级趋势
- (2023-06-14)破产清算赔偿顺序_破产清算赔偿顺序 播资讯
- (2023-06-14)任泽平:首次降息来了!政策转向全力拼经济
- (2023-06-14)多方反对日本强推核污染水排海-环球速看料
- (2023-06-14)创新积分制:精准破解科技企业融资难题|世界报道
- (2023-06-14)三明治宣传文案? 全球速递
- (2023-06-14)全球实时:嘉必优:6月13日融券卖出2900股,融资融券余额7566.25万元
- (2023-06-14)《株洲市渌水协同保护若干规定·草案》召开听证会
- (2023-06-14)2023款奇瑞艾瑞泽5 PLUS上市 售7.49-8.99万 观察
- (2023-06-14)金昌:推动项目建设提质增效
- (2023-06-14)宁波余姚22.7亿挂牌3宗商住地 总出让面积17.62万㎡
- (2023-06-14)【世界新要闻】元代书法家俞和,临摹王羲之草书《十七帖》,网友:这是高手
- (2023-06-14)20家创业板公司预告上半年业绩(附股) 每日头条
- (2023-06-14)2023年6月13日24时起国内成品油价格按机制下调
- (2023-06-14)昨日总决赛G5平均收视人数为1308.4万 高于去年勇士绿军G5|全球热点评
- (2023-06-14)【环球时快讯】一加Ace 2 Pro参数曝光 骁龙8 Gen 2旗舰
- (2023-06-14)天天最资讯丨江永:瑶家“泉水粽”飘香 托起瑶民增收希望
- (2023-06-14)尼日利亚中部发生沉船事故至少103人死亡
- (2023-06-14)老公和情人我该选择谁_丈夫和情人一起上我
- (2023-06-14)央行如期“降息” 增强经济复苏动能
- (2023-06-14)突然脚水肿是什么原因_脚水肿是什么原因
- (2023-06-14)环球新消息丨兰州市安宁区2023年小学新生计划招生5470人
- (2023-06-14)大人不记小人过的下一句是什么_大人不记小人过
- (2023-06-14)厄尔尼诺警报!全球将迎高温“烤”验 每日简讯
- (2023-06-14)中金:逆回购利率下调吹响稳增长政策号角-要闻速递
- (2023-06-14)股民圈炸了!AI大牛鸿博股份竟在华创证券公众号“被退市”? 每日热点
- (2023-06-14)每日讯息!搭载M2 Ultra 的 Mac Pro 跑分公开:单核2794、多核21453