跳到主要内容

版本动态

本文介绍了产品各版本的功能特性、发布时间以及对应文档链接,方便了解产品更新动态。

V4.1

序号
功能模块
功能描述
相关文档
1资源管理
  • API数据源:新增连接、响应超时时间配置;
  • 测试连通性:交互优化;
  • 数据表新建:新增“元数据采集建表”方式;
  • 建表优化:数据表字段英文名支持下划线开头;“timestamp、timestamptz”字段类型支持设置精度;“decimal”字段类型取消默认值及长度精度必填校验;提供方普通用户可修改;
  • 查看数据表:“数据导入”标签页新增导入时间变更为“导入开始时间、导入结束时间”;“加工作业”标签页中新增“流式数据加工”作业展示;
  • 数据导入:新增“快速导入”超大csv文件;
  • 数据源管理
    数据表管理
    2数据规范
  • 主数据导入:新增“快速导入”超大csv文件;
  • 规范诊断:诊断任务调整为手动触发,诊断对象不再提供默认全仓对象;
  • 主数据
    规范诊断
    3数据开发
  • 作业分组:规范所有作业类型的分组名称、层级、排序、操作;
  • 数据加工作业画布:优化标签页显示长度、画布切换状态;
  • 作业调度:所有周期调度作业新增支持多个具体时间指定;新增支持“等待中间态”配置;调整“作业运行人”配置入口;
  • 作业终止:新增作业级试运行终止,并优化作业终止提示;
  • 数据加工节点终止:规范各节点执行信息、执行结果;所有节点新增“取消试运行”功能;
  • SQL语法:新增扩展支持with、merge等语法;
  • 数据信道:新建topic时,新增“批量解析字段”功能,且topic字段英文名限制放开;
  • 流式数据加工:新增流式数据加工作业,支持jar包、SQL两种加工类型;
  • 数据加工
    数据指标
    数据标签
    数据信道管理
    流式数据加工
    4数据质量
  • 质量概览/质量详情:质检作业结果统计算法优化,质量等级判定算法优化;
  • 质量详情:页面布局、交互优化;
  • 作业调度:新增支持多个具体时间指定;调整“作业运行人”配置入口;
  • 质量规则:优化质检规则适配“timestamptz”质检;
  • 质检作业
    质量详情
    5数据安全
  • 脱敏规则:新增支持配置自定义识别规则;
  • 脱敏处理:新增“敏感识别对象”配置及手动触发识别扫描,并支持任务查看及手动终止任务;
  • 敏感确认:新增识别规则检索及展示,并可自动推荐识别规则对应脱敏规则;
  • 安全诊断:新增“配置诊断对象”及手动触发诊断,并支持任务查看及手动终止;
  • 脱敏规则
    脱敏处理
    安全诊断
    6数据分析
  • 探查终止:新增数据/AI探查手动终止,并提供后台查询超时时间自动终止
  • 数据探查
    7运维监控
  • 调度管理:页面调整为直接展示任务实例,并新增相关搜索条件;
  • 任务详情:优化任务详情信息展示,去除重复展示信息,统一日志查看、下载;
  • 后台任务:新增后台异步任务展示,并支持任务的取消、删除;
  • 任务中心:更名为“下载中心”,并支持生成中任务取消;
  • 调度管理
    下载中心
    8个人中心
  • 消息通知:新增“流式作业、质检结果、后台任务”对应的站内、站外消息通知;
  • 消息通知
    9系统管理
  • 新建用户:新增“激活中”状态,授权操作后台异步处理,优化体验;
  • 权限分配:业务与资源权限支持批量选择表、资源;
  • 权限管控:业务、资源权限开关异步处理,优化体验;
  • 用户与权限
    个性化配置
    10超管配置
  • 空间管理:新增空间级资源配额配置,支持CPU、内存、I/O租户级资源管控;
  • 空间管理
    11其它优化
  • 全局列表“数仓层级、状态”等可枚举值的展示效果优化;
  • 数据加工作业画布按钮icon重构;
  • 全局页面字体主次分明;
  • V4.0

    序号
    功能模块
    功能描述
    相关文档
    1资源管理
  • 资源权限:数据源纳入“资源权限”管控;
  • 新增ES数据源类型,可支持ES数据导出
  • 新增“授权状态”检索条件;
  • 将原有“运维监控”部分统计迁移至数据源管理,包括“已接入数据总量(条)、占用存储空间”列表展示,“接入流量监控”查看操作
  • 数据表新建:新增“timestamptz”字段类型,以支持带时区数据的正确显示;数据表查看:新增“血缘关系”标签页、“数据导入”标签页新增“导入者”展示具体导入人信息、“数据预览标签”优化无业务权限查看数据的提示效果
  • 资源文件管理:支持资源文件的上传、修改、删除等管理,并作为后续“脚本开发”的主程序包或依赖资源
  • 数据源管理
    数据表管理
    资源文件
    2数据开发
  • 数据加工调度配置:增强时钟配置、新增运行策略配置、新增自依赖和跨周期依赖、优化调度配置布局;
  • 业务权限:更名为“关联资源”,无论是否开启权限管控均可查看该作业关联数据表,数据源、主机;
  • 补数据:支持批量补数据;
  • 节点重试:所有节点新增节点级重试配置;
  • 资源权限过滤:库表导入、API导入、库表导出过滤无资源权限数据源;
  • 新增“脚本开发”节点分组,支持多种脚本类型节点,包括shell、python、java;
  • 去掉“数据质检节点”;
  • 实时数据同步、数据信道作业过滤无资源权限数据源;
  • 数据指标、数据标签加工,支持配置数据加工作业依赖,支持运行策略配置。
  • 数据加工
    数据指标
    数据标签
    3数据质量
  • “数据质检”独立为作业进行管理;
  • 新增质检数据比例配置,可选择抽样比例实现随机抽样检测,提升效率;
  • 支持时钟调度配置,含运行策略;
  • 质量详情:去掉“节点名称”信息项。
  • 数据质检
    4数据分析
  • 资产透视:新增“数据集成、数据开发治理、数据消费”全流程统计概览
  • 资产透视
    5运维监控
  • 新增作业监控:作业状态概览,作业历史运行记录和未来排期监控,队列监控;
  • 作业依赖:支持以全局视角查看数据加工、指标加工、标签加工等各类调度作业依赖关系
  • 作业类型搜索条件新增“数据质检”作业,下方列表同步显示数据质检作业调度情况;
  • 新增“作业任务状态”检索条件;
  • 所有任务详情同步新增“运行队列、作业优先级、等待时长”信息展示;
  • 新增的“脚本开发”节点详情,展示节点运行详情及运行日志
  • 运维概览
    调度管理
    6个人中心
  • 站内消息:去掉“数据质检”、新增“脚本开发”节点类型、“作业运行”新增“数据质检作业” ,作业运行标题统一规范;
  • 新增消息删除,可单条、批量删除;
  • 新增空间管理员可查看全局所有用户的消息通知,并可删除普通用户消息;
  • 资产类型改为非必填搜索条件即展示全部类型资产
  • 消息通知
    我的订阅
    7系统管理
  • 资源权限:新增对数据源(数据库、API、kafka)、主机、队列的资源权限管控;
  • 重置密码:新增新密码二次确认;
  • 主机管理:新增主机管理能力,用户可使用本空间配置的主机在数据开发模块远程执行脚本;
  • 队列管理:新增队列管理能力,用户可使用本空间配置的队列在作业调度配置选择有权限的运行队列;
  • 个性化配置新增“资源权限管控”开关。
  • 用户与权限
    主机管理
    队列管理
    个性化配置
    8超管配置
  • 健康概览:新增各服务当前的版本号;
  • 主机管理:新增主机管理能力,用户可监控全平台主机的资源消耗情况;
  • 新增“timestamptz”字段类型内置映射;
  • 新增“ES数据库”字段类型内置映射。
  • 健康概览
    主机管理
    字段映射配置
    9其它优化
  • 禁止使用嵌套表格,扁平话表格处理;
  • 鼠标移出绿点之后,搜索框消失的时间适当延长,避免鼠标误操作;
  • 核心列应锁定;
  • 关联资产和查看关联资产合并(两个按钮合并);
  • 表头设置:表头显示与隐藏/列表数据排序/表头排序
  • V3.3

    序号
    功能模块
    功能描述
    相关文档
    1资源管理
  • 原“数据集成”模块更名为“资源管理”;
  • 新增数据表跨空间共享发布、下架能力
  • 数据表管理
    2数据开发
  • 新增作业运行人,以运行人用户校验并执行作业,避免越权开发
  • 新增“业务权限”查询,可快速查询当前用户各作业的业务授权情况
  • 跨空间数据表获得授权后可直接参与SQL开发
  • 数据加工
    3数据质量
  • 优化内置规则计算逻辑
  • 数据质检
    4数据分析
  • 数据探查:保存、运行时新增业务权限校验
  • 数据探查、AI探查支持选择跨空间数据表,并可配置为业务卡片
  • 业务卡片&业务面板:预览、分享图表时自动根据当前用户进行业务权限过滤数据
  • 业务卡片
    业务面板
    5数据开放
  • 新增跨空间资产,可快速检索、申请消费其他空间共享的数据表
  • 共享数据表
    6个人中心
  • 审批人:所有空间内的消费申请和跨空间的申请均调整为由各空间管理员审批
  • 新增消息通知批量标记为已读/未读,优化消息通知数量显示
  • 审批管理
    消息通知
    7系统管理
  • 系统权限:提供全局功能按钮级的操作权限控制,权限管控更精准
  • 业务权限:提供数据表的业务权限控制,通过读写、只读、列级读三种粒度控制
  • 用户与权限
    8其它优化
  • 列表记录提供超链跳转查看详情
  • 列表表头支持自定义拖动各列的排列顺序
  • 提供更多列表表头可进行手动记录级升降排序
  • 部分列表新增“创建时间”、“更新时间”信息展示
  • 全局功能按钮图标优化
  • 搜索条件隐藏,并支持快捷键展开
  • 右侧抽屉支持ESC快捷关闭,未保存内容提醒
  • V3.2

    序号
    功能模块
    功能描述
    相关文档
    1数据集成
  • Hexadb、Mysql、Oracle、SQLServer、PostgreSQL、DM、KingBaseES、HighGo、Kafka、MongoDB类型数据源,支持集群模式下的连接配置自动解析;
  • 自定义驱动文件中的驱动版本信息;“数据源驱动”菜单合并至“数据源管理”页面内;
  • 数据表管理新增“责任人”“数据元件”检索条件;
  • 表详情页新增已关联的“数据服务”信息展示;
  • 表详情页支持数据导入字段配置中取消“是否敏感”配置,直接选择脱敏规则即可
  • 数据源管理
    数据表管理
    2数据规范
  • 标准诊断新增标准字段&主数据被引用次数、风险等级、支持统计数据下钻
  • 规范诊断
    3数据开发
  • 原“拆分主键”更名为“并发数”,由手动配置改为自动识别主键字段,并支持配置并发数;
  • 新增“读写失败上限”,超过上限将终止对应导入或导出任务;
  • 解析MongoDB来源表字段时,支持自定义字段,弥补字段解析缺失;
  • 目标数据源为mysql时,导出方式支持insert或upsert;
  • 脚本中返回的接口字段忽略大小写,保证可以与数据表进行自动映射;
  • 新增“质量评分”,关联质检规则与质量特性,用于计算表的质量合规得;
  • “自定义函数”合并至“数据加工”页面内;
  • 支持数据表、主数据的API服务配置,并支持单位时间内的调用频次限流
  • 数据加工
    数据服务
    4数据质检
  • 质量详情与质量报告中新增合规得分
  • 质量详情
    质检报告
    5数据安全
  • 可批量解除任意脱敏规则与多字段之间的关联关系;
  • 水印溯源结果新增统计所在表英文名、表分级、共享方式、责任人隶属组织机构
  • 数据脱敏
    数据水印
    6数据开放
  • 新增数据服务资产;
  • 新增数据元件资产
  • 数据服务资产
    数据表资产
    7个人中心
  • 新增数据服务资产相关审批、消息通知展示已订阅资产的上下架状态
  • 消息通知
    我的订阅
    8系统管理
  • 新增数据服务相关目录管理、审计管理;
  • 质量特性:内置质量特性,同时支持用户自定义特性,用于质量评分配置;
  • 元件评估:自定义数据元件判定规则,通过关联质量合规得分阈值、主数据引用得分阈值、标准字段引用得分阈值判定数据表是否为元件;
  • 新增业务面板链接有效期与访问次数限制;
  • 新增平台主题色配置,支持矿石白与宝石蓝两种主题色切换;
  • 自定义AI支持接入“通义千问”大模型
  • 目录管理
    评估体系
    个性化配置
    9其它优化
  • 新增“蜂鸟”规格,提供轻量化的一站式报表分析能力;
  • 表配置页新增“提供方”“资源标签”“来源库”“目标表”等对象的快捷跳转;
  • 配置全局搜索条件收起后默认展示一行;
  • 调整列表操作栏部分按钮排序;调整描述信息默认行高;
  • 支持更多跳转至帮助中心的快捷入口;数据表、主数据、文件夹、数据标签、数据指标等资产详情页信息以tab页形式展示
  • V3.1

    序号
    功能模块
    功能描述
    相关文档
    1数据集成
  • 新增kafka、mongodb数据源接入;建表时支持选择行存、列存
  • 数据源管理
    数据表管理
    2数据规范
  • 新增标准字段,供数据表、主数据、数据模型引用;
  • 新增标准诊断,统计数据表引用主数据与标准字段的情况
  • 标准字段
    规范诊断
    3数据开发
  • 新增基于日志的数据全量与增量导入;
  • 新增批量配置多张表的数据导入节点;
  • 新增jmeter脚本导入节点、上下文分支判断节点;
  • 新增SQL加工节点执行成本评估;
  • 新增批量数据加工作业的导入导出;
  • 新增数据信道管理,并支持数据从kafka进入信道,再由信道进入目标表的导入过程
  • 数据加工
    数据信道管理
    4数据安全
  • 新增脱敏规则:无效化规则(hash处理)、随机值规则(姓名、电话、邮箱、地址、身份证号等)、平均值规则;
  • 脱敏规则自动推荐:自动扫描出的敏感字段,系统将自动推荐脱敏规则;
  • 新增安全诊断:统计待脱敏字段与数据表情况
  • 数据脱敏
    安全诊断
    5数据分析
  • 新增AI探查,通过自然语言即可从数据表中取数;
  • 新增报表管理:支持可视化的业务卡片、业务面板配置
  • 数据探查
    业务卡片
    业务面板
    6数据开放
  • 升级智能消费,通过自然语言即可从数据表中取数
  • 数据表资产
    7运维监控
  • 接入数据源监控:各数据源接入数据总量、占用存储空间、每次接入的流量监控;
  • 作业运行时间分布:48小时内,任意时间段的作业并发数量
  • 运维概览
    8系统管理
  • 空间管理员可独立配置本空间的标题、logo等个性化配置
  • 个性化配置

    V3.0

    序号
    功能模块
    功能描述
    相关文档
    1数据集成
  • 数据源驱动:支持手动上传数据源驱动,适配不同的数据源版本,保证JDBC连通性;
  • 新增数据分布配置(适配海纳分布式版本,提升查询性能)、联合主键、索引;
  • 数据表分区配置调整:在适配海纳分布式版本时,新增预设分区;
  • 数据导入:新增xls、xlsx类型的本地文件上传;
  • 文件夹管理:支持通过文件夹管理从本地上传的非结构化文件,存储在minio中
  • 数据源管理
    数据表管理
    文件夹管理
    2数据规范
  • 标准文件:上传数据开发治理规范文件,并关联至资产,作为数据实施服务的依据;
  • 数据模型:可维护逻辑模型并支持物化为仓内数据表,支撑业务模型开发与管理
  • 标准文件
    数据模型
    3数据开发
  • 新增节点:库表导入、API导入节点;
  • 复制与运行跳过;SQL版本自动保存;字段拼接:(批量)选择字段后,可自动生成对应的select、insert、update、delete脚本;
  • sql语法支持TRUNCATE;
  • 作业重试:从当前作业第一个失败节点开始重试,可配置重试次数,降低作业失败时人工维护成本;
  • 作业依赖链路:通过可视化链路图展示作业的依赖关系;
  • 作业调度频率:从最快5分钟调度频率提升到1分钟;
  • 数据探查:通过select探查数据时,支持最多导出50万条数据,降低数据获取成本,方便后续报表分析;
  • 自定义函数:优化自定义函数上传、解析等操作逻辑;
  • 指标开发:支持原子指标、派生指标、复合指标的开发;
  • 标签开发:通过加工逻辑对实体对象的特征进行描述,形成数据标签
  • 数据加工
    数据探查
    数据指标
    数据标签
    4数据质检
  • 质量等级配置优化:不同数据对质量的要求不同,支持配置多套质量等级判断规则,通过将规则关联至对应的数据集合,可以灵活呈现平台仓内各类数据的质量等级情况;
  • 质量规则:支持维护正则表达式资源池,供工作空间内的开发者在配置质检规则时复用;
  • 质量报告:可导出任意已质检数据表的质量报告,展示质检概览与明细数据
  • 数据质检
    质检报告
    5数据安全
  • 数据水印:支持对数据表嵌入水印以及水印溯源
  • 数据水印
    6运维监控
  • 作业任务终止:支持手动终止作业任务,避免无效运行;
  • 下载中心:集中管理异步下载任务,如数据探查中的数据导出
  • 调度管理
    7数据开放
  • 新增资产类型:提供数据指标资产、数据标签资产、文件资产供消费;
  • 数据分级与共享方式:根据数据不同分级,对应无条件共享、有条件共享、不予共享三种方式;
  • 行列混合授权:支持行列混合授权方式的消费申请;
  • 资产订阅:可订阅所需资产,且订阅资产变更时可推送通知;
  • 资产血缘:资产详情页可展示当前数据表的全链路血缘
  • 数据指标资产
    数据标签资产
    8个人中心
  • 新增站外通知推送,支持电子邮箱与企业钉钉,增强消息触达;
  • 定制推送:可配置将特定对象的消息推送至特定用户,实现精准推送;
  • 我的订阅:管理订阅的所有资产
  • 我的订阅
    9系统管理
  • 数据分级:响应数据分类分级要求,可自定义数据分级并关联至共享方式,实现数据开放精细化管理;
  • 登录安全:响应等保要求,支持登录验证码、登录失败次数限制、并发登录、退出登录、初始密码修改配置
  • 登录安全

    V2.0

    序号
    功能模块
    功能描述
    相关文档
    1数据集成
  • excel建表(含数据):通过上传excel文件直接创建含数据的结构化表
  • DDL建表:支持hive、mysql、pg、oracle、sqlserver多种类型的sql脚本进行批量建表
  • 主数据检测&引用:建表时可自动检测是否要引用主数据,并支持用户手动引用
  • 数据表主键配置:支持唯一主键配置
  • 数据表全域链路:可查看与任意数据表关联的所有加工作业任务
  • DDL脚本快捷复制:可快捷复制任意数据表的DDL脚本批量设置常用字段
  • 数据表管理
    2数据质检
  • 内置质检规则:新增唯一值、身份证、邮箱、手机号、固话号、日期、IP地址、邮编、长度、空白字段等内置校验规则
  • 质检阻断:质检不通过时,可选择是否阻断当前作业运行
  • 质量概览:可快速查看质检红色等级数据表的质量详情
  • 数据质检
    3数据开发
  • 主数据管理:新增主数据管理,支持主数据版本管理与版本对比
  • 作业任务立即运行:支持数据加工作业与节点的立即运行
  • 作业运行结果:新增展示任意作业的7日内运行结果
  • 自定义函数:通过上传jar包实现自定义函数配置,sql加工与数据探查时可引用
  • 作业依赖:可配置作业级的前置依赖作业,前置作业完成后可触发调度
  • 数据量依赖:可配置平台仓内表的数据量变化阈值,达到阈值时可触发调度
  • 主数据管理
    数据加工
    4数据安全
  • 主数据脱敏处理:支持对主数据的脱敏处理
  • 脱敏即时预览:在脱敏规则配置页,可即时该规则的脱敏效果
  • 脱敏配置记录:管理近7天的脱敏配置记录,可随时撤销相关脱敏配置
  • 数据脱敏
    5数据开放
  • 主数据资产:新增主数据资产,支持用户申请消费
  • 行级授权:新增行级数据消费申请
  • 智能消费:支持跨表申请,通过手动sql脚本将跨表的多列融合成一张私有表后申请消费
  • 批量申请:可批量申请多张数据表进行消费
  • 主数据资产
    数据表资产
    6运维监控
  • 运维概览:新增运维概览,可监控数据集成、数据开发治理、数据消费、失败作业及该作业的单次运行时间分布、作业任务的执行速度变化趋势等信息
  • 运维概览
    7个人中心
  • 消息通知:针对数据质检、SQL加工、数据导出、作业运行、数据表下架、数据表删除、数据表访问申请、审批、授权回收提供消息通知
  • 消息通知
    8系统管理
  • 主数据目录管理:对主数据目录独立管理
  • 数据消费审计:提供数据表、主数据的消费审计信息
  • 字段映射配置:系统内置的字段映射关系,并支持自定义,作用于“数据导出”节点的字段映射
  • 健康概览:展示平台的基础服务、使用的中间件、海纳集群等信息
  • 系统信息:展示产品版本号与授权信息
  • 目录管理

    V1.0

    序号
    功能模块
    功能描述
    相关文档
    1数据集成
  • 资源盘点:维护数据集成所需的数据源清单,明确数据集成范围
  • 数据表管理:可创建并管理数据表结构。支持单独建表、excel建表(空表)、复制建表、csv数据导入
  • 全仓字段检索:标记常用字段、便于后续数据开发时快速检索
  • 资源盘点
    数据表管理
    2数据质检
  • 质检节点:通过内置规则与自定义规则进行质检。
  • 质量概览:通过自定义质量等级,查看全仓以及各数仓层级的数据质量分布情况
  • 质量详情:展示已质检数据表的详细质检信息,包括数据表关联的质检规则、命中的字段以及数据血缘,并展示已质检数据表的质量等级
  • 质检概览
    质检作业
    质量详情
    3数据开发
  • SQL加工:SQL加工支持INSERT、SELECT、UPDATE、DELETE语法,数据开发者主要通过该能力进行数据分层治理。
  • 数据导出:通过“数据导出”将平台仓内的表数据导出至第三方数据库中的目标表。
  • 血缘检测:支持字段级与表级血缘检测,通过解析sql脚本,可在作业运行之前提前识别血缘关系
  • 版本管理:支持对sql脚本进行版本管理
  • 表信息:可通过表名、字段名检索,或通过常用字段检索,快速定位所需字段
  • 数据加工
    4数据安全
  • 敏感识别:系统内置敏感识别规则,同时支持建表时手动标记敏感字段
  • 脱敏规则:支持字符掩盖、关键字替换、字符删除不同类型的脱敏规则
  • 脱敏处理:展示所有识别出的敏感数据,此页面进行最终确认并关联脱敏规则后,系统将立即执行脱敏
  • 数据脱敏
    5数据开放
  • 数据表资产:展示已治理开发完成的数据表,供用户消费
  • 消费权限:提供表级、字段级授权
  • 消费方式:提供API访问、海纳直连的消费方式
  • 数据表资产
    6运维监控
  • 调度管理:通过作业、作业任务、节点任务三个维度展示作业任务的运行情况
  • 调度管理
    7系统管理
  • 目录管理:支持数据表目录管理
  • 资源标签管理:作用于数据表,扩展数据表的业务属性
  • 海纳连接管理:管理数据开放中的海纳连接信息
  • 组织管理:管理用户所在组织机构
  • 角色管理:平台支持内置角色与自定义角色,后者可配置个性化菜单权限
  • 用户管理:管理每个空间内的所有用户信息,包含增删改查、重置密码、冻结用户
  • 审计管理:系统操作审计,展示每个用户在什么时间、对什么对象进行的操作详情
  • 目录管理
    资源标签管理
    连接管理
    组织管理
    用户与权限
    审计管理