정보검색 #4 검색모델 (Retrieval Models)
JiwonDev
앞에서 문서의 색인과 대략적인 정보검색 방법을 알아봤다면, 이번에는 실제 정보검색에서는 어떠한 방법(검색모델)으로 질의와 문서의 유사도를 구하는지 알아보자. 대표적인 방법으로는 4가지가 있다. 1. 불린 모델(Boolean model) 집합에 기반하여 논리적으로 있다(True) 없다(False)를 질의문으로 검색한다. 모든 색인어들에 0과 1을 할당하고 각 Term들을 논리 연산(and, or, not)으로 연결한다. 2. 벡터 공간 모델(Vector space model) 앞의 불린모델으로는 존재 여부(0 또는 1)만 알 수 있고 가중치를 계산하여 순위(Ranking)를 매길 수 없다. 그래서 가중치를 0~1 사이의 값으로 측정하는 것이 벡터 공간 모델. 각각의 n개 용어들을 n-차원의 그래프 축(벡터..