敏感识别
自动识别
使用场景:用户需对大数据场景下的敏感数据进行快速识别。
使用角色:数据开发人员。
功能描述:平台支持自定义敏感数据识别规则,可通过名称、数据自动识别,手动识别等方式在海量数据中快速定位敏感数据,提升识别效率。
自动识别
识别规则
平台支持在数据安全 > 数据脱敏 > 脱敏规则界面自定义识别规则,可定义名称、数据识别规则用于后续自动识别。
识别触发
- 根据字段信息识别:建表、修改表时根据表结构字段名称信息自动识别,数据表里没有数据也会触发识别规则,识别为敏感的字段会立即进入“脱敏处理”列表,等待确认;
- 根据数据识别:数据安全 > 数据脱敏 > 脱敏处理页面,点击“敏感识别”按钮,对识别对象中数据表的数据随机采样1000条并进行敏感信息识别,识别为敏感的字段会立即进入“脱敏处理”列表,等待确认。
识别逻辑
敏感数据识别分为以下两种逻辑场景:
- 当数据表中没有数据时,会根据字段信息识别规则进行脱敏处理。若字段名或描述符合敏感识别要求,且字段类型也包含在字段信息识别规则所列举出来的类型中,那么认为该字段敏感;若字段名称符合敏感识别要求,但字段类型不符合,则认为该字段不敏感。
- 当数据表中有数据时,系统在用户建表或修改表时首先会根据字段信息进行敏感识别。对于建表或修改表时根据字段信息识别不出来的字段,系统会根据在立即识别时随机采样1000条数据进行敏感数据识别,若有80%以上数据符合识别规则,即可认为该字段为敏感字段。
注意
- 已识别至“脱敏处理”列表的但尚未确认敏感的字段,依然会参与立即识别扫描,以避免识别规则或数据变化导致识别结果不准确
手动识别
手动识别
使用场景:用户在数据表管理中创建字段时,发现敏感字段可手动匹配合适规则,防止敏感数据暴露。
使用角色:数据开发人员。
功能描述:平台提供字段级脱敏规则配置,可自行标记绑定至所需敏感字段,实现脱敏保护。
操作流程:
进入资源盘点 > 数据表管理页面,在新建数据表或修改表时,可手动配置每个字段的脱敏规则;不配置则视为不敏感,选择脱敏规则,则视为手动标记敏感,会立即进入“脱敏处理”列表,等待确认。
注意
手动标记的敏感字段,无论是否已确认,均不参与自动识别扫描。
注意
以上识别逻辑同样适用于主数据字段。