• 1.orc 存储格式
  • 2.每张表基本都要建分区,ods就要分区
  • 3.维度表中能不能出现指标 ,可以当做属性看待
  • 4.工作流调度信息
  • 5.标识符 和 实际业务枚举值 之间的 存储 关系需要 新建一个维表来 维护
  • 6.每个表新增 两个字段 1.数据来源标识字段 data_source 2.最近更新时间 last_modified
  • 7.加一个数据状态字段 true,false data_status
  • 8.7天前的分区删掉false状态的值(避免数据冗余)

作者 admin

张宴银,大数据开发工程师

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注