基于《个人信息保护法》的APP隐私政策合规性检测
作者机构:南京邮电大学计算机学院
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2024年
学科分类:0301[法学-法学] 03[法学] 08[工学] 0839[工学-网络空间安全] 030103[法学-宪法学与行政法学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:隐私政策 个人信息保护法 合规分析 语料库 自然语言处理
摘 要:数据隐私保护已成为社会关注的焦点,各国和地区正在陆续制定相关的法律法规,但是由于APP产品发布的隐私政策存在篇幅长、专业性强等问题,利用自动化手段检测隐私政策的合规性就成了亟待解决的技术难题。作为主流解决方法的机器学习模型需要标签注释的数据集进行支撑,而国内目前缺少这样的APP隐私政策数据集。在分析欧盟GDPR合规分析相关工作的基础上,设计了适合我国个人信息保护法的标签方案,具体包括15个要求标签,然后使用网络爬虫获取了10个类别363个APP的中文隐私政策,并对这些隐私政策进行了语句级划分和标注,构建了包括104134个隐私政策语句及标签组成的中文隐私政策语料库。采用百度最新开源的预训练语言模型—ERNIE对语料库进行了训练与测试,检测准确率达到85.75%。