분산 컴퓨팅과 하둡 (1) 썸네일형 리스트형 빅데이터 처리 기술 및 분석도구 이해하기 빅데이터 처리 기술 및 분석도구 이해하기 ▣ 분산 컴퓨팅과 하둡 분산 컴퓨팅은 대규모 컴퓨팅 시스템에서 그 작업을 분산하고 병렬 처리함으로써 더 빠르게 처리하는 기술입니다. 분산 컴퓨팅을 이용하면 데이터 처리 속도를 향상할 수 있습니다. 하둡은 대규모 데이터 처리를 위한 분산 처리 시스템으로, Apache 기반의 오픈 소스 프레임워크입니다. 하둡은 다른 분산 처리 시스템과 달리 데이터를 분산 파일 시스템에 저장하고 이를 맵리듀스(MapReduce) 프로그래밍 모델을 통해 처리합니다. 하둡의 기술적인 구조는 크게 두 가지로 나눌 수 있습니다. ◈ HDFS HDFS(Hadoop Distributed File System)는 대규모 분산 데이터 저장 및 처리를 위한 분산 파일 시스템입니다. Hadoop 클러스.. 이전 1 다음