Apache Hadoop (아파치 하둡)
- 오픈 소스 기반 분산 컴퓨터 플랫폼
- 자바 소프트웨어 프레임워크
- 일반 컴퓨터들로 가상 대형 스토리지를 형성 -> 데이터세트를 병렬 처리
MapReduce (맵리듀스)
- 대용량 데이터 분산 처리용 프로그래밍 모델
- Map - 흩어져 있는 데이터를 관련 데이터 분류로 묶기
- Reduce - 중복 데이터 제거하고 원하는 것 추출
Tajo (타조)
- Hadoop 기반 분산 데이터 웨어하우스 프로젝트
- 한국 주도 개발
Data Mining (데이터 마이닝)
- 데이터 웨어하우스에 저장된 데이터 집합에서 사용하고 싶은 정보를 찾기 위한 기법
- 대량 데이터를 분석해 내재된 변수 사이 상호관계를 패턴화, 효율적 데이터 추출
OLAP (Online Analytical Processing)
- 다차원 데이터의 통계를 분석하여 의사결정에 활용하는 방식
- OLAP연산 : Roll-up, Drill-down, Drill-through, Drill-across, Pivoting, Slicing, Dicing
'TIL : 컴퓨터 지식' 카테고리의 다른 글
모듈 간 결합도 (0) | 2024.03.01 |
---|---|
다이어그램 간략 (0) | 2024.02.29 |
데이터베이스 : 키 (DATABASE : KEY) (1) | 2024.02.28 |
이진 검색 (정의, 특징, 간단예시) (1) | 2024.02.24 |
데이터 명령어 분류 (DDL, DML, DCL) (0) | 2024.02.21 |