码力全开 / 使用openDLP进行敏感数据识别

Created Sun, 08 Mar 2026 11:20:30 +0800 Modified Sun, 08 Mar 2026 11:41:14 +0800
220 Words 1 min

openDLP是一款开源敏感数据识别工具,其支持对结构化数据表进行敏感数据识别,从而帮助企业进行数据资产分级分类,保护数据安全。

该工具目前支持身份证号、人名等17种常见敏感数据类型识别。

我们可以通过下面命令进行安装:

pip install opendlp

在开始之前我们需要下载资源文件并解压到指定目录。之后运行如下代码:

from opendlp.sensitive_analyze import table_analyzer
csv_table_path = 'test-data.csv'   
result = table_analyzer.analyze(csv_table_path)
print(result)

其输出类似如下:

{'PERSON': {'success': True, 'type': 'PERSON', 'fraction': '969/1000'},
 'ID_CARD': {'success': True, 'type': 'ID_CARD', 'fraction': '1000/1000'},
 'TELEPHONE': {'success': True, 'type': 'TELEPHONE', 'fraction': '1000/1000'}
}

可以看到其成功识别出人名、身份证号及电话号码等敏感信息。

参考文章:

https://opendlp.readthedocs.io/en/latest/README.html https://www.cnblogs.com/ffx1/p/19218299

如果喜欢这篇文章或对您有帮助,可以:[☕] 请我喝杯咖啡 | [💓] 小额赞助