Then,

(1)

이 식은 그대로 검색에 적용하기 쉽지 않다. t가 전체 token이라고 하면 검색에 너무 많은 시간이 요구되기 때문이다.

위 식 (1)을 색인과 검색 시점에 맞게 수정하자.  

이때, 각 document에 따른 상수를 다음과 같이 정의하면,

식 (1)은 다음과 같이 재정의 할 수 있다.

(2)

계산을 위해 양변 log를 취하면, 다음과 같이 정리된다.

(3)

+ Recent posts