본문 바로가기
TIL : 컴퓨터 지식

데이터베이스 관련 신기술 간략정리

by 이페코장인 2024. 2. 29.

Apache Hadoop (아파치 하둡)

  • 오픈 소스 기반 분산 컴퓨터 플랫폼
  • 자바 소프트웨어 프레임워크
  • 일반 컴퓨터들로 가상 대형 스토리지를 형성 -> 데이터세트를 병렬 처리

 

MapReduce (맵리듀스)

  • 대용량 데이터 분산 처리용 프로그래밍 모델
  • Map - 흩어져 있는 데이터를 관련 데이터 분류로 묶기
  • Reduce - 중복 데이터 제거하고 원하는 것 추출

 

Tajo (타조)

  • Hadoop 기반 분산 데이터 웨어하우스 프로젝트
  • 한국 주도 개발

 

Data Mining (데이터 마이닝)

  • 데이터 웨어하우스에 저장된 데이터 집합에서 사용하고 싶은 정보를 찾기 위한 기법
  • 대량 데이터를 분석해 내재된 변수 사이 상호관계를 패턴화, 효율적 데이터 추출

 

OLAP (Online Analytical Processing)

  • 다차원 데이터의 통계를 분석하여 의사결정에 활용하는 방식
  • OLAP연산 : Roll-up, Drill-down, Drill-through, Drill-across, Pivoting, Slicing, Dicing