하둡(Hadoop) 하둡은 대용량 데이터 처리를 위한 오픈 소스 분산 처리 프레임워크입니다. Apache 하둡 프로젝트에서 개발되었으며, 대규모 데이터를 안정적으로 처리하고 저장할 수 있는 플랫폼으로 널리 사용됩니다. 하둡의 주요 구성 요소는 다음과 같습니다 Hadoop Distributed File System (HDFS)대용량 파일을 저장하기 위한 분산 파일 시스템으로, 여러 대의 컴퓨터에 데이터를 분산하여 저장합니다. MapReduce분산 데이터 처리를 위한 프로그래밍 모델로, 대규모 데이터를 여러 단계로 나누어 처리하고 결과를 병합합니다. YARN (Yet Another Resource Negotiator)클러스터 자원 관리 시스템으로, 하둡 클러스터의 자원을 효율적으로 관..