Hive 示例

    准备修改配置文件

    • conf/SortClusterConfig.conf,所有Sort任务的sink配置。, sink configuration of all sort tasks.
    • conf/sid_hive_inlong6th_v3.conf,一个Sort任务的数据源配置,文件名和配置文件SortClusterConfig.conf中的Sort任务名一致,如果SortClusterConfig.conf中配置了多个Sort任务,那么会有多个Sort任务的数据源配置。

    conf/SortClusterConfig.conf配置样例

    conf/sid_hive_inlong6th_v3.conf配置样例

    SortClusterConfig.conf配置参数

    • 可以从ClassPath的SortClusterConfig.conf源文件读取,但不支持实时更新
    • 可以从Inlong Manager的HTTP接口获取配置,支持实时更新
    参数名是否必须类型默认值描述
    clusterNameYStringNA用来唯一标识一个inlong-sort-standalone集群
    sortTasksYJsonArray<SortTaskConfig>NASort任务列表

    Sort-Hive任务的idParams配置参数

    参数名是否必须默认值描述
    inlongGroupIdYNAinlongGroupId
    inlongStreamIdYNAinlongStreamId
    separatorYNA分隔符
    partitionIntervalMsN3600000分区间隔时间,单位毫秒
    idRootPathYNAInlong数据流的Hdfs根目录
    partitionSubPathYNAInlong数据流的分区子目录
    hiveTableNameYNAInlong数据流的Hive表名
    partitionFieldNameNdtInlong数据流的分区字段名
    partitionFieldPatternYNAInlong数据流的分区字段值格式,如{yyyyMMdd}、{yyyyMMddHH}、{yyyyMMddHHmm}
    msgTimeFieldPatternYNA消息生成时间的字段值格式,Java时间格式
    maxPartitionOpenDelayHourN8分区最大打开延迟时间,单位小时

    Sort-Hive任务的sinkParams配置参数

    • 文件名格式:Sort任务名+”.conf”。
    • 可以从ClassPath的SortClusterConfig.conf源文件读取,但不支持实时更新。
    • 可以从Inlong Manager的HTTP接口获取配置,支持实时更新。
    参数名是否必须类型默认值描述
    sortClusterNameYStringNA用来唯一标识一个inlong-sort-standalone集群
    sortTaskIdYStringNASort任务名
    cacheZonesYJsonObject<String, JsonObject>NA缓存层集群列表,格式:Map<cacheClusterName, CacheCluster>

    CacheCluster配置参数

    Topic配置参数

    参数名是否必须类型默认值描述
    topicYStringNATopic完整名,Pulsar:tenant/namespace/topic
    partitionCntYIntegerNATopic分区数
    topicPropertiesNMap<String,String>NA缓存层Topic的Consumer参数

    启动inlong-sort-standalone应用