An AP-Based Shilling Attack Detector for Collaborative Filtering Recommendation Systems
文件大小: 1232k
源码售价: 10 个金币 积分规则     积分充值
资源说明:这篇论文主要研究了基于亲和传播(Affinity Propagation, AP)的推荐系统中恶意攻击(shilling attack)检测算法。在这个研究领域,推荐系统被广泛用于在线推荐服务中,尤其是协同过滤(collaborative filtering)技术。然而,这类推荐系统容易受到恶意用户的操纵,他们常常通过创建假账户或欺骗性个人资料(shilling profiles)来影响推荐系统的结果。针对此类问题,已有算法往往利用shilling profiles的某些特征,但存在精度低和需要大量训练集的缺点。 本文提出了一种基于聚类的方法来识别恶意攻击者,该方法融合了用户评分信息和用户个人资料属性。基于用户评分特征和用户资料属性的综合信息,用户自发地被分组成若干群组。接着,通过用户群组的群组平均评分偏差值(Group Rating Deviation from Mean Agreement, GRDMA)来识别恶意用户群。与逐个识别攻击者不同,本文提出的算法从集体层面寻找恶意用户,这为分析和检测恶意攻击提供了一种新的方式。在MovieLens数据集上的实验结果表明,提出的算法在三种典型的恶意攻击模型中是有效且稳健的,尤其是在攻击规模和填充规模足够大时。 关键词包括协同过滤、恶意攻击检测、亲和传播聚类和集体层面。 在研究的背景部分提到,电子商务的迅速发展为人们的生活提供了丰富选择的同时,也带来了信息过载的问题。面对海量的产品信息,用户可能会感到无助。推荐系统作为一种强大的工具,在用户面临海量信息时,能够帮助用户做出选择,但其自身也面临着被恶意攻击者操纵的风险。 在这项研究中,攻击者通常会创建虚假账户,并利用这些账户生成大量的评分数据,以此来欺骗推荐系统,使得推荐系统推荐他们想要推荐的项目,或者降低推荐系统推荐其它项目的可能性。这种攻击称为“shilling attack”。检测这种攻击对于维护推荐系统的可靠性以及保护用户利益至关重要。 文章中提到的亲和传播聚类是一种较为新颖的聚类算法,不同于传统的基于划分或基于层次的聚类方法,它不需要指定聚类数量,而是通过迭代消息传递过程,每个数据点会向其它数据点发送信息,通过这些信息的传递,最终能够确定出代表性的样本点,称为“exemplars”,其余样本点则通过“exemplars”归类到不同的簇中。利用这种聚类方法,能够更好地捕捉数据的内在结构,这也是作者选择使用该方法作为检测恶意攻击的工具的原因之一。 论文提出的方法在检测恶意用户时,不是单一的逐一检测,而是从整体上识别出恶意用户群体。这种方法的提出是基于这样的观察:恶意攻击者在进行攻击时往往有特定的行为模式,这些模式在统计意义上会与普通用户的模式有所不同。通过计算GRDMA值,可以定量地衡量一个用户群体与整体平均评分模式的偏差程度,从而识别出恶意用户群体。 文章在MovieLens数据集上进行的实验验证了所提出算法的有效性。MovieLens是一个广泛使用的电影推荐数据集,它包含了众多用户的电影评分数据,非常适合用于测试推荐系统的算法。实验结果表明,在模拟的恶意攻击场景中,本文算法能够有效地识别出恶意攻击者,并且具有很好的鲁棒性,尤其是当攻击规模较大时效果更加显著。这为推荐系统在面对恶意攻击时提供了一个有效的防御手段。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。