DB신기술1 데이터베이스 관련 신기술 간략정리 Apache Hadoop (아파치 하둡) 오픈 소스 기반 분산 컴퓨터 플랫폼 자바 소프트웨어 프레임워크 일반 컴퓨터들로 가상 대형 스토리지를 형성 -> 데이터세트를 병렬 처리 MapReduce (맵리듀스) 대용량 데이터 분산 처리용 프로그래밍 모델 Map - 흩어져 있는 데이터를 관련 데이터 분류로 묶기 Reduce - 중복 데이터 제거하고 원하는 것 추출 Tajo (타조) Hadoop 기반 분산 데이터 웨어하우스 프로젝트 한국 주도 개발 Data Mining (데이터 마이닝) 데이터 웨어하우스에 저장된 데이터 집합에서 사용하고 싶은 정보를 찾기 위한 기법 대량 데이터를 분석해 내재된 변수 사이 상호관계를 패턴화, 효율적 데이터 추출 OLAP (Online Analytical Processing) 다차원.. 2024. 2. 29. 이전 1 다음