张某人的学习积累
通常的 SQL 执行先会经过 SQL Parser 解析 S…
编码的优化 1)列裁剪 2)分区裁剪 3)分而治之 比如需要…
DataFrame & Dataset 的创建 不要…
SparkSQL的优势: Spark SQL 数据抽象 Da…
累加器 实现原理 累加器用来把Executor 端变量信息聚…
Spark RDD创建☆ 1 从集合(内存)中创建RDD 从…
1.Mysql 的 SQL 执行的流程 Mysql SQL …
Hive 企业调优实战架构与必备 Hive 的调优要具有全局…
拉链表的设计是将更新的数 据进行状态记录,没有发生更新的数据…
reduce 阶段卡在 99.99%不动;各 种 conta…