BE 공부49 [ElasticSearch] 메모리, 디스크, 캐시 접근 과정 1. 메모리(Memory)JVM 힙 메모리엘라스틱서치가 자바 가상 머신(JVM) 위에서 실행되기 때문에 JVM 힙 메모리를 사용주로 필드 데이터(Field Data), 집계(Aggregations), 필터 캐시(Filter Cache), 리퀘스트 캐시(Request Cache) 등을 저장각 용어 설명필드 데이터(Field Data):데이터를 메모리에 로드해 문자열 필드를 기준으로 하는 검색 및 집계 작업에서 주로 사용집계(Aggregations):엘라스틱서치가 복잡한 집계 쿼리를 처리할 때 데이터가 메모리에 로드됨필터 캐시(Filter Cache):반복적으로 사용되는 검색 필터의 결과를 캐싱하여 검색 성능을 향상리퀘스트 캐시(Request Cache):동일한 요청에 대해 반복적으로 발생하는 검색 결과를 .. 2024. 8. 29. [ElasticSearch] 인덱싱과 세그먼트 문서 인덱싱과 세그먼트 생성[문서 1 인덱싱]역 인덱스에 "정말", "멋진", "날씨", "입니다"라는 단어가 추가"정말"이라는 단어는 문서 1의 위치(예: 1번째 단어)로 저장문서 1의 역 인덱스를 포함하는 세그먼트가 생성[문서 2 인덱싱]역 인덱스에 "오늘", "날씨", "정말", "좋습니다"라는 단어가 추가"정말"이라는 단어는 문서 2의 위치(예: 3번째 단어)로 저장문서 2의 역 인덱스를 포함하는 또 다른 세그먼트가 생성[문서 3 인덱싱]역 인덱스에 "정말", "날씨", "좋다"라는 단어가 추가"정말"이라는 단어는 문서 3의 위치(예: 1번째 단어)로 저장문서 3의 역 인덱스를 포함하는 또 다른 세그먼트가 생성세그먼트 내의 데이터 구조세그먼트 A:단어 목록: "정말", "멋진", "날씨", "입니.. 2024. 8. 29. [ElasticSearch] 문자열 정렬 ElasticSearch에서 employee 1부터 employee 20000까지 총 2만개의 데이터를 업데이트 했습니다.그리고 id를1. 'employee'라는 키워드로2. id.keyword로 정렬하도록3. 상위 5개만{ size: 3, query: { bool: { filter: { term: { name: 'jordan', }, }, }, }, aggs: { employees_with_name_Jordan_per_company: .. 2024. 8. 28. [ElasticSearch] 내부 구조와 동작 원리 역인덱스와 인덱스 용어역인덱스(Inverted Index): 용어를 문서와 그 위치에 매핑합니다. 이는 용어를 빠르게 찾고 그 용어가 포함된 문서를 식별하는 데 유용합니다. 예를 들어, "Winter is coming"이라는 문서가 있을 때, 'winter', 'is', 'coming' 각각의 단어를 문서와 연결하여 인덱스를 생성합니다.예시: "Winter is coming." -> {'winter': [1], 'is': [1, 2], 'coming': [1]}간단한 검색: 여러 용어로 검색할 때 각 용어의 발생 위치를 찾아 AND 검색의 경우 교집합을, OR 검색의 경우 합집합을 계산합니다.예시: 'Winter' AND 'coming' -> {'winter': [1], 'coming': [1]}의 교집.. 2024. 7. 12. 이전 1 ··· 6 7 8 9 10 11 12 13 다음 반응형