Then,
(1)
이 식은 그대로 검색에 적용하기 쉽지 않다. t가 전체 token이라고 하면 검색에 너무 많은 시간이 요구되기 때문이다.
위 식 (1)을 색인과 검색 시점에 맞게 수정하자.
이때, 각 document에 따른 상수를 다음과 같이 정의하면,
식 (1)은 다음과 같이 재정의 할 수 있다.
(2)
계산을 위해 양변 log를 취하면, 다음과 같이 정리된다.
(3)
Then,
(1)
이 식은 그대로 검색에 적용하기 쉽지 않다. t가 전체 token이라고 하면 검색에 너무 많은 시간이 요구되기 때문이다.
위 식 (1)을 색인과 검색 시점에 맞게 수정하자.
이때, 각 document에 따른 상수를 다음과 같이 정의하면,
식 (1)은 다음과 같이 재정의 할 수 있다.
(2)
계산을 위해 양변 log를 취하면, 다음과 같이 정리된다.
(3)