跳到主要内容

脱敏规则

脱敏规则

使用场景:数据开发人员根据需求针对特定敏感数据建立脱敏规则,防止敏感数据暴露。

使用角色:数据开发人员。

功能描述:平台提供数据脱敏能力,可通过内置的脱敏算法快速创建脱敏规则,并关联字段,实现安全脱敏。

规则配置

进入数据安全 > 数据脱敏 > 脱敏规则界面,点击页面上方的 “新建脱敏规则” 按钮,根据实际需要填写相关信息后“保存”即可。

脱敏规则

平台目前支持三种类型脱敏规则:无效化、随机值、平均值,供用户选择,并可预览脱敏后效果。脱敏规则将对“敏感处理”页面已确认敏感的字段自动完成动态脱敏,以防止数据预览、消费时暴露敏感数据。
脱敏规则配置

脱敏规则类型
平台提供多种规则类型可选择使用,具体如下表:

规则类型
适用场景
脱敏效果
无效化-字符掩盖可设置掩盖模式(字符掩盖从何处开始与结束),掩盖模式内的数据都会被掩盖字符代替。
- 适用于需显示部分信息的场景
以语句“今天天气真好”为例,设置掩盖模式为自3至5,掩盖字符为星号,则从第3个字“天”开始到第五个字“真”结束,最终脱敏显示效果为“今天***好”
无效化-关键字替换数据中含有该关键字的部分都会被替换字符串代替。
- 适用于统一存在关键信息的场景
以数字“12304202444444”为例,设置关键字为“2024”,替换字符串为“----”,则脱敏后的数据为“12304----44444”
无效化-字符删除数据中所用信息将会全部删除。
- 适用于所有信息均敏感的场景
数据在前端展示、查询时,对应字段记录显示为空
无效化-Hash处理系统通过不可逆加密算法对数据进行hash处理。
- 适用于所有信息均敏感的场景
平台自动使用SHA256算法对字段所有信息进行加密,如“15077777888”,脱敏后数据为“ab06aa027246c193cd2dc60b7b551cea51a15483cada82ed9bea57d2e90d792f”
随机值对所选姓名、手机号、固话号、电子邮箱、身份证号、地址,用对应的随机值进行替换,尽量保留原有数据格式。
- 适用于仍需使用相似信息的敏感场景
如通过系统内置的姓氏字典,对姓名进行随机值脱敏,原“张三”,脱敏后数据为“黄财”(随机值为动态替换,每次查看的脱敏后值可能不一样)
平均值默认每10条数据取一个平均值。
- 常用于统计场景,针对数值型数据,先计算均值,然后使脱敏后的所有数值在均值附近随机分布,并保持数据的总和不变
如“985,115.2,100.343”,脱敏后数据为“720.691,218,261.852”

识别规则

新建脱敏规则时,支持添加自定义识别规则,用以自动识别敏感字段,后续则可在脱敏处理页面对识别出的敏感字段绑定脱敏规则。

  • 自定义识别规则支持名称、数据两类规则,可分别配置对应名称、正则表达式,支持配置多个表达式

脱敏规则配置

注意
  • 识别规则名称在空间内所有脱敏规则中均不可重复,表达式可重复
  • 识别规则提供基础正则格式校验,主要针对格式不合法的规则,如:[a-z
  • 识别规则若配置错误,不会中断识别扫描任务,仅该规则忽略且无识别结果
  • 数据识别采用随机抽样,将数据值命中80%以上的字段视为符合规则的敏感字段,抽样逻辑如下:
    ①数据量小于等于1000,全量采样识别
    ②数据量大于1000,小于等于10000,随机采样1000条识别
    ③数据量大于10000,随机采样10%识别,最多采集10000条

表-常用识别规则示例

根据字段信息识别根据数据识别
座机号/手机号字段名包含: mobile、phone、telno、tel_no、shouji、sjh 或中文名、描述包含:手机、座机;且数据类型为int4、int8、float4、float8、decimal、char、varchar、text
表达式示例:.*(phone).* 或.*(mobile|telno|tel_no|shouji|sjh).*
国际区号(86)加11位手机号,国际区号可选3到4位区号-6到8位座机号,区号可选
表达式示例: (010|02\d|0[3-9]\d{2})?-?(\d{6,8})或(?:0|86|+86)?1[3-9]\d{9}
身份证号、驾驶证号、护照号码、港澳台通行证号码字段名包含:idcard、id_card、sfzh 或中文名、描述包含:身份证号、驾驶证号、护照号、通行证号、证件号;且字段类型为:char,varchar,text
表达式示例:.*(id_card|idcard|sfzh).*
18位身份证号1位大写字母加6位数字1位大写字母加8位数字
表达式示例[1-9]\d{5}[1-2]\d{3}((0\d)|(1[0-2]))(([012]\d)|3[0-1])\d{3}(\d|X|x)###^[A-Z]\d{6}(?:\d{2})?$
金额中文名或描述包含:金额、工资、薪酬;且字段类型为:int4、int8、float4、float8d、ecimal、char、varchar、text
邮箱字段名包含:email、e_mail或中文名、描述包含:邮箱;且字段类型为:char、varchar、text
表达式示例:.*(email|e_mail).*
邮箱数据格式
表达式示例:ext.email
地址字段名包含:address或中文名、描述包含:地址、住址;且字段类型为:char、varchar、text
表达式示例:.*(address).*
(省|自治区|直辖市|特别行政区)(市|地区||盟)(县|||自治县|自治旗|林区)(街道|||农场)(路||||||||组)***号6段中匹配4段及以上
表达式示例:ext.address

修改

脱敏规则所有配置内容均可修改,修改影响说明如下:

  • 脱敏规则修改后,在数据预览、数据消费时使用新的脱敏规则;
  • 名称识别规则在新建/修改数据表时使用新的脱敏规则,历史已名称识别的字段不受影响;
  • 数据识别规则在立即识别时使用新的识别规则扫描,历史已数据识别但未确认敏感字段将同样参与新规则识别扫描。

解除关联

点击查看脱敏规则,进入规则详情,可查看规则关联的对象,再点击操作列“解除关联”,即可解除关联关系,支持批量取消关联。

  • 说明:只有解除关联后方可删除脱敏规则。 脱敏规则维护

删除

若当前脱敏规则并未关联任何字段时,点击目标脱敏规则操作列中的“删除”按钮并二次确认后即可删除脱敏规则。若关联字段,可使用“解除关联”功能快速处理
脱敏规则维护