example: 1개의 글
[Spark] Optimizing Transformations and Actions
Optimizing Transformations and Actions 아래 내용을 중심으로 학습을 진행했습니다. Use advanced RDD operations Identify what operations cause shuffling Understand how to avoid shuffling when possible Group, combine, reduce key-value pairs Advanced RDD Operations advanced RDD의 연산에 대해서 알아보도록 하겠습니다. Numeric RDDs는 statistical 연산을 할 수 있습니다. 해당 연산을 통해 standard deviation, sum, mean, max, min, 등의 통계적이 연산이 가능합니다. mapPartiti..
Big Data/Apache Spark
2021. 5. 6. 01:41