임팔라 2

[빅데이터] Impala 사용해 보기.

🎁 본 글은 실무로 '배우는 빅데이터기술' 책을 따라해보고 실행하여보는 과정을 기록한 글이다.🎁 빅데이터 처리의 전체적인 흐름과 과정을 학습하기 쉬우며 빅데이터에 관심있는 사람들에게 추천한다. ❓ 임팔라 란?🥚 아파치 하둡 위에서 실행되는 SQL 쿼리 엔진.🥚 하이브에 비하여 임팔라는 속도가 빠르다.  ◼ 아래 데이터를 임팔라와 하이브에 서 각각 실행 시켜 보자.select * from managed_smartcar_symptom_info where biz_date = '20240615';  ◼ 운행 지역을 살펴보자select T2.area_number, T2.car_number, T2.speed_avgfrom ( select T1.area_number, T..

빅데이터 2024.06.18

[빅데이터] 임팔라, 스쿱, 머하웃 설치 With Cloudera, 제플린 설치 With Linux

🎁 본 글은 실무로 '배우는 빅데이터기술' 책을 따라해보고 실행하여보는 과정을 기록한 글이다.🎁 빅데이터 처리의 전체적인 흐름과 과정을 학습하기 쉬우며 빅데이터에 관심있는 사람들에게 추천한다. 데이터 분석을 위한 임팔라, 제플린, 머하웃을 사용해 보고, 스쿱을 이용하여 분석 데이터를 저장 해 볼 것이다. ⭕ 임팔라 추가◼ 클러스터 - 서비스 추가 - 임팔라를 선택 설치될 서버(server02)를 선택한다.  ❓ Impala Daemon 스크래치 디렉토리란쿼리 실행 시 생성되는 임시파일을 저장하는 위치이다. 임팔라는 휴와 연동이 되어있으니◼ Hue - 구성 - Impala 검색 후 설정 해주고 저장.◼ 임팔라 재시작.◼ Hue 재시작. ⭕ 스쿱 추가. ◼ 클러스터 - 서비스 추가 - 스쿱  ◼ 서버 선..

빅데이터 2024.06.18