without haste but without rest
Spark 자료구조 본문
RDD, DF, DataSet
내부 로직의 어떤 차이로 인해 속도 차이가 발생하는지 찾아보기
https://github.com/apache/spark
코드를 뜯어보고 이해하는 게 더빠를듯
df는 어떤 언어쓰던 Catalyst Optimizer를 사용한다.
'Scrap' 카테고리의 다른 글
Airflow architecture & Celery executor (0) | 2022.03.04 |
---|---|
iterm 단어 단위로 이동 단축키 설정 (0) | 2021.12.30 |
Kudu를 이용한 빅데이터 다차원 분석 시스템 개발 - NAVER D2 (0) | 2021.12.13 |
읽어볼 자료 - Airbnb Minerva (0) | 2021.12.08 |
[SK Planet T Academy] GCP pub/sub을 활용한 데이터 파이프라인 강의 (0) | 2020.10.15 |
Comments