반응형
🎁 본 글은 실무로 '배우는 빅데이터기술' 책을 따라해보고 실행하여보는 과정을 기록한 글이다.
🎁 빅데이터 처리의 전체적인 흐름과 과정을 학습하기 쉬우며 빅데이터에 관심있는 사람들에게 추천한다.
❓ 임팔라 란?
🥚 아파치 하둡 위에서 실행되는 SQL 쿼리 엔진.
🥚 하이브에 비하여 임팔라는 속도가 빠르다.
◼ 아래 데이터를 임팔라와 하이브에 서 각각 실행 시켜 보자.
select *
from managed_smartcar_symptom_info
where biz_date = '20240615';
◼ 운행 지역을 살펴보자
select T2.area_number,
T2.car_number, T2.speed_avg
from ( select T1.area_number,
T1.car_number,
T1.speed_avg,
rank() over(partition by T1.area_number order by T1.speed_avg desc) as ranking
from ( select area_number,
car_number,
avg(cast(speed as int)) as speed_avg
from managed_smartcar_drive_info
group by area_number, car_number
) T1
) T2
where ranking = 1
해당 쿼리는 지역별 평균 속도가 높은 차량을 출력한다.
'빅데이터' 카테고리의 다른 글
[빅데이터] 머하웃 사용해 보기. (0) | 2024.06.18 |
---|---|
[빅데이터] 제플린 사용해 보기. (0) | 2024.06.18 |
[빅데이터] 임팔라, 스쿱, 머하웃 설치 With Cloudera, 제플린 설치 With Linux (0) | 2024.06.18 |
[빅데이터] Oozie Workflow (0) | 2024.06.17 |
[빅데이터] Oozie 사용 해 보기. (2) | 2024.06.14 |