PostgreSQL 安全管理 数据脱敏 Anonymizer 术语
1 背景知识
本节主要介绍在项目实施和管理过程中经常用到的术语和概念,用于项目交流和管理。
2 脱敏的分类
- 动态脱敏: 可以在不修改真实数据的情况下,提供一个视图。一些用户只能读取脱敏后的数据,其他用户则可以访问真实数据。
- 永久脱敏:使用不相关的数据替换敏感数据。一旦进行脱敏处理就再也无法找回真实数据。
3 脱敏技术术语
- 删除或为NULL: 将真实数据直接删除或者置为
NULL
。 - 静态脱敏函数(Static Substitution):将真实值替换为一个通用值。例如:用 "CONFIDENTIAL" 替换所有真实值。
- 方差脱敏函数(Variance):是“移动”日期和数值的操作。例如,对工资应用
+/-10%
的方差,数据集仍然有意义。 - 泛化脱敏函数(Generalization):将数据用数据范围来替换,从而降低数据的准确性。例如,“鲍勃 28岁” 脱敏为“鲍勃在20 岁到30 岁之间”,这种脱敏方法很有用,因为数据仍然是真实的。
- 随机脱敏混合(Shuffling):将同一列中的值打乱顺序。这种方法可能被破解。
- 随机化(Randomization): 用数据随机但可信的值替换敏感数据。同时仍然适合测试、数据分析和数据处理。
- 部分脱敏(Partial scrambling):与静态替换类似,但只会替换部分数据:如信用卡可以替换为: '40XX XXXX XXXX XX96'。
- 自定义规则(Custom rules):根据需求定制脱敏数据。例如,同时随机化一个邮政编码和一个城市名称,并保持他们一致。
- 假名化(Pseudonymization ) :是一种通过附加信息来隐藏敏感数据的方法。加密和哈希是假名化的两个例子。不过假名后的数据仍然和原始数据相关联。