DataWorks生命周期是什么?
以下为热心网友提供的参考意见
DataWorks的生命周期主要分为两部分:数据同步时间和表的生命周期。
在数据同步方面,DataWorks会以数据同步的时间作为分区的依据。例如,如果业务系统产生数据的时间被标记为Bizdate,那么就会按照(T+1)加工,一般是每天计算前一天的业务数据。这样,表就会按照这个业务时间来分区,不同的分区就存不同业务系统时间的数据。
对于表的生命周期,这是指从最后一次更新的时间算起,在经过指定的时间后没有变动,则此表(分区)将被MaxCompute自动回收。这个指定的时间就是生命周期。对于非分区表,当LastModifiedTime超过设定的生命周期时长时,MaxCompute会回收这些数据并删除对应的表。而对于分区表,则根据各分区的LastModifiedTime判断该分区数据是否该被回收,当最后一个分区被回收后,该表不会被删除。
您还可以在DataWorks中修改MaxCompute表的生命周期,具体步骤是进入DataWorks的数据源配置页面,找到对应的MaxCompute数据源,然后在数据源配置页面中找到MaxCompute表的配置选项,并点击“编辑”按钮。此外,DataWorks还默认为您创建了天、周、月等9个基础周期粒度,您可以根据实际业务需求,在该周期粒度的基础上,创建更细粒度的时间周期。
以下为热心网友提供的参考意见
表的生命周期(Lifecycle),指表(分区)数据从最后一次更新的时间算起,在经过指定的时间后没有变动,则此表(分区)将被MaxCompute自动回收,这个指定的时间就是生命周期。生命周期回收为每天定时启动,扫描全量分区。
设置生命周期
--创建新表。
CREATE [external] TABLE [if not exists]
[( [default ] [comment ], ...)]
[comment ]
[partitioned BY ( [comment ], ...)]
--用于创建聚簇表时设置表的Shuffle和Sort属性。
[clustered BY | range clustered BY ( [, , ...]) [sorted BY ( [ASC | DESC] [, [ASC | DESC] ...])] INTO buckets]
--仅限外部表。
[stored by StorageHandler]
--仅限外部表。
[with serdeproperties (options)]
--仅限外部表。
[location ]
--生命周期
lifecycle ;
--基于已存在的表创建具备相同结构的新表但不复制数据,支持外部表和湖仓一体外部项目中的表。
create table [if not exists] like [lifecycle ];
——参考来源于阿里云官方文档。
本文来自投稿,不代表新手站长_郑州云淘科技有限公司立场,如若转载,请注明出处:https://www.cnzhanzhang.com/13528.html
赞 (0)
dataworks打开一直是这样咋回事?-[阿里云_云淘科技]
上一篇
2023年12月10日 下午6:53
dataworks控制台报错?-[阿里云_云淘科技]
下一篇
2023年12月10日 下午6:54
新手站长从“心”出发,感谢16年您始终不离不弃。