跳到主要内容

StarRocks 对端结构迁移设置分区

简述

StarRocks 表数据分区是常态,当作为 CloudCanal 数据迁移同步任务对端时,创建任务可设置分区以便结构迁移自动带上分区表达式。

CloudCanal 会自动验证分区表达式是否合法,根据 StarRocks 要求自动调整 PRIMARY KEY,DISTRIBUTED BY 字段,并调整建表语句中分区键排列顺序。

前置条件

  • CloudCanal 版本 >= 3.3.0.0 并 < 4.2.0.0 (不推荐)
    • 支持简单的 RANGE 分区
  • CloudCanal 版本 >= 4.2.0.0 (推荐
    • 全面支持 RANGE 分区、表达式分区、LIST 分区

步骤

  • 同步任务 > 创建任务

  • 源&目标设置 > 功能配置 > 表&action过滤

  • 数据处理,可选择表级别或批量设置

    • 选中具体表的 操作 > 数据分区 ,设置具体分区表达式
    • 批量操作 > 数据分区 ,设置具体分区表达式
    #e.g.,one
    PARTITION BY date_trunc('day', event_day)

    #e.g.,two
    PARTITION BY time_slice(event_day, INTERVAL 7 day)

    #e.g.,three
    PARTITION BY RANGE(event_day)(
    PARTITION p20200321 VALUES LESS THAN ("2020-03-22"),
    PARTITION p20200322 VALUES LESS THAN ("2020-03-23"),
    PARTITION p20200323 VALUES LESS THAN ("2020-03-24"),
    PARTITION p20200324 VALUES LESS THAN ("2020-03-25")
    )

    #...

    填入表达式点击确认时,系统将自动验证语法的合法性,并提取分区字段,校验在表中是否存在

  • 创建确认