본문 바로가기
BE 공부/검색엔진

[ElasticSearch] 개요 및 주요 기능 요약

by 꼬질꼬질두부 2024. 7. 12.
반응형

Elasticsearch 개요 및 주요 기능 요약

데이터 저장 및 인덱싱

  • 분산 문서 저장소: Elasticsearch는 복잡한 데이터 구조를 JSON 문서로 직렬화하여 저장합니다.
  • 실시간 인덱싱: 문서 저장 시 인덱싱되어 1초 이내에 검색 가능.
  • 역인덱스: 고속 풀 텍스트 검색을 지원하며, 문서 내 모든 고유 단어와 해당 단어가 포함된 문서를 식별.

인덱스와 필드

  • 인덱스: 최적화된 문서 컬렉션으로, 각 문서는 키-값 쌍으로 이루어진 필드의 모음.
  • 전용 데이터 구조: 텍스트 필드는 역인덱스에, 숫자 및 지리 필드는 BKD 트리에 저장.
  • 스키마리스: 동적 매핑을 통해 문서 필드를 자동으로 감지 및 추가.
  • 수동 매핑: 사용자가 매핑을 정의하여 필드 저장 및 인덱싱 방식 제어 가능.

검색 및 분석 기능

  • REST API: 클러스터 관리, 데이터 인덱싱 및 검색을 위한 간단한 REST API 제공.
  • 구조화 쿼리와 풀 텍스트 쿼리: SQL과 유사한 쿼리 및 풀 텍스트 검색 지원.
  • 다양한 검색 유형: 구문 검색, 유사 검색, 접두사 검색, 자동 완성 제안 등.
  • 지리 및 수치 데이터 검색: 고성능 지리 및 수치 쿼리를 위한 최적화된 데이터 구조 지원.
  • 집계: 데이터 요약, 패턴 및 트렌드 분석을 위한 집계 기능 제공.

확장성과 내구성

  • 클러스터와 노드: 다중 노드를 추가하여 용량 증가 가능, 데이터 및 쿼리 로드를 자동 분산.
  • 샤드: 인덱스는 하나 이상의 물리적 샤드로 구성, 샤드를 다중 노드에 분산하여 중복성 및 쿼리 용량 증가.
  • 기본 샤드와 복제 샤드: 데이터 보호 및 읽기 요청 처리 용량 증가.
  • 샤드 크기: 최적의 샤드 크기를 유지하기 위한 가이드라인 제시.

재해 복구 및 관리 도구

  • 교차 클러스터 복제(CCR): 주요 클러스터와 원격 클러스터 간의 인덱스 동기화, 장애 발생 시 백업 클러스터가 대체.
  • 보안, 모니터링, 관리 도구: Kibana를 사용한 클러스터 관리, 보안 및 모니터링 기능 제공.

Elasticsearch는 빠른 검색과 실시간 데이터 분석을 지원하는 강력한 도구로, 다양한 데이터 유형을 효과적으로 처리할 수 있습니다.

반응형

댓글