跳到主要内容

表详情

表详情

使用场景:用户需查看数据表详情,可快速了解数据表的多维度内容,便捷找到所需关联资源。

使用角色:数据集成人员、数据开发人员。

功能描述:平台支持通过表详情查看表本身的相关信息、数据预览、关联作业、关联资产等内容,从而形成以数据表为中心的数据地图,并可快捷跳转至相关联资源进行下一步操作,无需在分散的模块到处查找。

  • 前置条件:拥有数据表“查看”的系统权限 进入资源管理 > 数据表管理 > 全仓数据表管理界面,点击数据表名称即进入表详情,平台提供多种搜索条件快速查询所需数据表。
搜索条件说明
  • 是否为数据元件:过滤出是否为数据元件的数据表,数据元件为满足数据元件评估特定判定规则的数据表。
  • 授权状态:若业务权限管控开启,则可按授权状态过滤数据表。

基础信息

显示当前数据表的基础信息内容,大部分信息为新建、修改时用户所填写。

注意
  • “数据库模式”为系统自动生成,默认空间直接显示“数仓层级”,非默认空间为“当前空间编码_数仓层级”,后续在SQL加工、数据探查时引用数据表需输入“数据库模式.表名”

表详情

元数据

展示当前数据表的所有字段信息;若业务权限管控已开启,无论是否拥有所选数据表业务权限,均可查看全部字段。 表详情

数据预览

最多显示20条数据,单个值最多显示255个字符长度;若业务权限管控已开启,只可预览有业务权限的字段列的数据记录,无业务权限预览为空。 表详情

高级配置

显示当前数据表的高级配置项内容。 表详情

数据导入

数据表新建完成后,可通过列表操作栏、表详情页的“数据导入”按钮,快速导入CSV、Excel数据,支持两种导入方式,由系统自行判断执行。 表详情

解析导入
解析导入主要适用于数据量较小的导入场景,可自动解析表头,乃至每一行数据错误,效率一般但支持导入策略灵活,主要流程配置如下:
单独建表

  1. 上传文件:用户导入本地 CSV、Excel(小于2G) 文件实现表数据写入,配置任意字段后可下载模板,模板会将已配置字段英文名作为表头,在模板中补充数据记录后即可上传。(也可直接使用含表头的CSV、Excel文件)
  2. 数据起始行:用于判断执行数据导入时的起始行最小值为2 (默认第1行为表头),最大值100
  3. 导入策略:导入策略有“遇到错误回滚”和“遇到错误继续”两种
    • 遇到错误回滚:即要么全部导入成功,要么全部导入失败,遇到的第一个错误行失败原因会记录供查看,此策略导入效率较高
    • 遇到错误继续:即遇到错误不会停止导入,会继续下一行直至最终行,并同步记录每个错误行的失败原因供下载,但此策略导入效率较低
  4. 是否覆盖: 默认“否”,即不会覆盖已有数据,直接追加数据;选择“是”,则导入时会清空已有数据后再导入。

表详情
复制导入
复制导入主要适用于数据量较大的导入场景,采用整体复制的模式,效率高但支持导入策略较少,主要流程配置如下:

  1. 上传文件:用户导入本地 CSV(大于2G) 文件实现表数据写入
  2. 数据起始行:用于判断执行数据导入时的起始行,默认2(即第1行为表头),最小值为1(即不包含表头),最大值100
  3. 表头配置:由于超大文件不会解析表头,因此需用户手动配置表头顺序,以保证数据列实际顺序可以和目标表字段列建立正确的映射关系,可手动拖拽排序
  4. 导入策略:仅支持“遇到错误回滚”
    • 遇到错误回滚:即要么全部导入成功,要么全部导入失败,遇到的第一个错误行失败原因会记录供查看,此策略导入效率较高
  5. 是否覆盖: 默认“否”,即不会覆盖已有数据,直接追加数据;选择“是”,则导入时会清空已有数据后再导入。

断点续传
以上两种导入方式均支持断点续传,具体说明如下:

  1. 触发逻辑:点击“导入”按钮后,系统将在后台执行文件上传操作,此时会记录文件上传进度;此时若主动取消、网络问题、刷新或离开当前页面等操作造成上传中断,在未对原文件进行任何修改的情况下重新上传,将触发断点续传,从中断进度处继续上传文件
  2. 触发限制:上传进度将保留24小时,超过该时长则无法触发断点续传,将从头开始
    表详情

全域链路

展示直接使用当前数据表的作业,及这些关联作业的全部上游依赖作业,作业类型包括批量数据加工、实时同步等,且这些作业需真实运行(含立即运行、调度运行)才会在全域链路中展示,以体现当前数据表的真实来龙去脉。 表详情

血缘关系

展示当前数据表的动态血缘关系,可查看从数据源到数仓再到目标库的完整血缘,并可查看表级、字段级血缘

注意
  • 血缘关系不进行业务权限校验,均可查看完整血缘
  • 此处为静态血缘,即根据当前表相关加工作业的配置解析而来,作业不一定已实际运行
  • 若血缘关系中包含“跨空间数据表”(仅展示直接关联的跨空间表),不支持跨空间表的跳转查看

表详情

关联作业

展示直接使用当前数据表的作业,作业类型包括批量数据加工、数据质检、实时同步、数据信道作业、流式数据加工等,以便数据表变更时迅速定位作业影响域。 表详情

关联指标

展示基于当前数据表加工的原子指标,并可跳转查看原子指标对应的派生加工作业。 表详情

关联标签

展示基于当前数据表加工的数据标签,并可跳转查看标签加工作业。 表详情

关联服务

展示以当前数据表作为来源表的数据服务。 表详情

DDL脚本

展示当前数据表的“海纳”语法DDL建表语句,可直接复制。 表详情

相关术语

血缘