• 1:对于ads层分钟刷新一次的频次,使用kylin是否能及时得到最新结果? 即Kylin是否支持对上一个版本的数据进行更新和新增而非重新全部计算,且这个更新和新增的计算时常是否可以控制在秒级
  • 2:空间换时间,当前有多少个维度?这个2^n – 1的存储量,是否hold住?
  • 3:有哪些业务线适合使用kylin?
  • 4:延迟有多高?是否能达到秒级? 100w级数据量的表,使用kylin查询要多久?
  • 5:是否需要掌握Hbase?
  • 6:需要单台还是多台服务器分配24core,64G的资源?能否减配?分配出来的话,集群本身资源率是否足够用?spark任务量应当会陡增,任务量暴增,当前架构是否hold住?
    • 单台,则无需减配
    • 单台资源分配,尚且能hold住
  • 7:部署前提

作者 admin

张宴银,大数据开发工程师

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注