openDLP是一款开源敏感数据识别工具,其支持对结构化数据表进行敏感数据识别,从而帮助企业进行数据资产分级分类,保护数据安全。
该工具目前支持身份证号、人名等17种常见敏感数据类型识别。
我们可以通过下面命令进行安装:
pip install opendlp
在开始之前我们需要下载资源文件并解压到指定目录。之后运行如下代码:
from opendlp.sensitive_analyze import table_analyzer
csv_table_path = 'test-data.csv'
result = table_analyzer.analyze(csv_table_path)
print(result)
其输出类似如下:
{'PERSON': {'success': True, 'type': 'PERSON', 'fraction': '969/1000'},
'ID_CARD': {'success': True, 'type': 'ID_CARD', 'fraction': '1000/1000'},
'TELEPHONE': {'success': True, 'type': 'TELEPHONE', 'fraction': '1000/1000'}
}
可以看到其成功识别出人名、身份证号及电话号码等敏感信息。
参考文章:
https://opendlp.readthedocs.io/en/latest/README.html https://www.cnblogs.com/ffx1/p/19218299
如果喜欢这篇文章或对您有帮助,可以:[☕] 请我喝杯咖啡 | [💓] 小额赞助

