技术:交互数据可能会随着时间的推移识别匿名个人
论文表明,个人互动记录可用于从匿名数据集中识别特定个人。自然通讯 将发表于。我们的调查结果表明,目前处理此类数据的做法可能无法满足欧盟通用数据保护条例中规定的匿名标准。
有关个人交互的详细数据由消息传递应用程序、移动运营商、社交媒体提供商和其他应用程序收集,并用于这些服务的运营和研究目的。这些数据已被用于研究个体互动模式、预测流行病的空间传播以及研究友谊对政治动员的影响。当前的数据保护法规允许在未经用户同意的情况下共享和出售有关个人交互的数据,前提是数据是匿名的。
现在,Yves-Alexandre de Montjoye、Ana-Maria Cretu 及其同事表明,人际互动数据随着时间的推移是稳定的,可用于从匿名数据集中识别特定个体。作者使用深度学习技术开发了一个模型,并对其进行了训练,以根据个人交互网络识别个人,在不同时间段内共收集了超过 4 个数据集。该模型能够基于两跳 AC 网络(个人和受试者相距两跳的 AC 网络)识别 2% 的个体。该模型还使用个人直接联系人(2 跳)以 52% 的机会识别人。由于个人互动的长期稳定性,这些书籍能够在使用两跳交换网络 1 周后识别出 15% 的人。此外,当将该模型应用于由 2 人组成的蓝牙邻近数据集时,个人识别的概率为 20% 或更高。然而,作者表示他们不相信这种模型可以应用于联系人跟踪协议(例如 Google 和 Apple 的联系人通知)。
这项研究的结果表明,从长期来看,作者可能能够从有关交互的匿名和非关联数据中识别出特定的个人,这对于遵守隐私立法很重要。他声称拥有它并指出安全措施(访问控制系统、隐私增强系统等)可用于防止重新识别。
[英文原文 »]
“Highlights of Nature Magazines”是对 Nature 公共关系部门为新闻界发布的新闻稿的翻译。如果您需要更准确和详细的信息,请务必阅读原始论文。
*本文转载自“Nature Japan Featured Highlights”。
转载自:》技术:个人之间互动的数据可能允许从匿名数据中长期识别特定个人」