指标开发
业务场景
用户将数据表中的销售类数值字段构建为原子指标,并通过指标加工生成派生指标和复合指标,用以分析销售数据。
前提条件
- 平台部署完毕,数据开发服务正常;
- 用户拥有数据指标模块权限。
使用限制
- 数据指标需选择当前空间中 DWD 及以上层级的数据表
- 派生指标加工维度值一次加工最多只可选择100个
- 若已开启业务权限管控,需提前获取对应数据表的相关权限
操作流程
第一步:准备数据表
在资源管理 > 数据表管理 > 全仓数据表管理界面,点击列表上方的“新建数据表”按钮,选择下拉框中的单独建表。这里我们假设要上传一张含某数据服务器销售信息的表格,命名为“数据服务器退订单量”,表格信息及数据表字段如下图,为方便演示,已删除无关字段,其中业务类型分为服务器订单和退单,退订单额为对应订单或退单的销售额,统计日期以天为粒度,涵盖了近三个月的退订单统计数据。最后导入已提前在Excel中处理好的数据,完成后点击右下角的“保存”按钮即可新建数据表。
注意
因为数据指标需选择当前空间中 DWD 及以上层级的数据表,故假设该表已完成数据加工和质检,并将其置于 DWD 层以供数据消费者直接消费使用。
第二步:新建原子指标
- 在数据开发 > 数据指标 > 指标加工中点击“新建原子指标”,假设我们要计算上一个月该数据服务器的订单总额和退单总额,下拉找到数据表“数据服务器退订单量”,我们将指标命名为“退订单量”,其余信息项如图。
- 对于原子指标计算规则,原子指标不会独立存在,一定是结合业务范围——维度,进行组合才有意义。原子指标加维度可以理解为一个度量在不同视角下的变化,“性别”作为维度的话,男性数量就是度量,所以此处的维度我们选择“业务类型”,度量选择“退订单额”,业务时间选择“统计日期”,计算逻辑我们选择“求和”,计量单位则是“万元”。
注意
- 原子指标是基于业务过程的度量值,顾名思义是不可以再进行拆分的指标,通常是某个经济或金融领域中的基础数据,如gdp、cpi、收益率等,所以命名时建议以最简单不加修饰的词语命名;
- 维度可以根据需要无限扩展,如数据服务器销量,可以增加城市维度、品牌维度等,变成某城市某品牌数据服务器的销量;
- 原子指标中仅含有唯一度量,通常是表中聚合字段,订单量,用户量,pv,uv等。
第三步:新建加工作业
- 原子指标新建完成后,点击原子指标后方的“新建加工作业”图标即可配置派生指标加工规则,如图,派生指标加工作业名称我们命名为我们希望得到的派生指标,即“上一个月数据服务器退订单总额”,时间周期选择“上一月”,指标维度则分为两个维度,分别是“数据服务器订单”和“数据服务器退单”。点击“预览”右侧画布按所选内容排列组合展示派生指标,点击保存即可生对应派生指标。
- 点击“立即运行”,待运行成功后生成的派生指标才不会是空值,调度配置完毕后点击上线,即可按调度实现指标加工。
- 在数据开发 > 数据指标 > 派生指标中可以看到刚才生成的两个派生指标,关联已发布的目录并将派生指标发布后,可在数据开放 > 本空间资产 > 数据指标资产中申请访问。
第四步:新建复合指标
- 派生指标加工作业运行成功后,在数据开发 > 数据指标 > 复合指标中点击“新建复合指标”,假设我们要计算上个月销售该数据服务器获得的利润,计算逻辑为订单额减去退单额。我们将该复合指标命名为“上一月数据服务器销售利润”,在“复合指标计算规则”中,将计算模式设为支持四则运算的“表达式”,选择需要计算的派生指标,以点击“订单量”——“减号”——点击“退单量”的步骤输入表达式,底部“计量单位”输入“万元”,点击“保存”即可生成需要的复合指标。
- 复合指标无需进行调度配置,关联数据指标目录并发布后即可在数据开放 > 本空间资产 > 数据指标资产申请访问。
第五步:运维监控
1)调度管理:在运维监控_调度管理找到对应作业,点击【查看作业任务】可查看运行详情,主要信息包含作业任务调度明细、各调度的运行结果、日志下载等。
2)告警通知:若需监控作业状态,特别是运行失败,可在个人中心 > 消息通知中配置告警,支持邮件、钉钉群通知。对象类型选择“指标加工”、对象名称填写需监控的作业名称,通知类型选择“作业运行”,作业运行失败时,可发送消息通知。