스파크 완벽 가이드 (1) 썸네일형 리스트형 [Spark] chapter 1 아파치 스파크란? Chapter 1. 아파치 스파크(Apache Spark)란? 가장 활발하게 개발되고 있는 병렬 처리 오픈소스 엔진, 통합 컴퓨팅 엔진이며 클러스터 환경에서 데이터를 병렬로 처리하는 라이브러리 집합 단일 노트북 환경에서부터 수 천대의 서버로 구성된 클러스터까지 다양한 환경에서 실행 가능 1.1 스파크 등장 배경 새로운 처리 엔진과 프로그래밍 모델이 필요한 이유? 컴퓨터 어플리케이션과 하드웨어의 바탕을 이루는 경제적 요인의 변화 프로세서의 성능 향상이 해마다 빨리지고 있으며, 어플리케이션은 코드를 수정하지 않아도 자연스럽게 빨라지고 있음. 대규모 어플리케이션은 이런 경향에 맞춰 만들어져, 대부분 단일 프로세서에서만 실행 되도록 설계 대규모 데이터 처리를 프로세서의 성능 향상에 맡겼던 것 하드웨어 성능의 성.. 이전 1 다음