item-to-item 방식이 '일반적으로' user-to-user 방식보다 더 좋은 이유
- 아이템 간 비교가 더 정확함: 아이템들은 많은 사용자들이 평가하기 때문에, 특정 아이템 간의 유사성을 더 정확하게 파악할 수 있다. 예를 들어, 여러 사용자가 비슷한 영화를 좋아했다면 그 영화들은 유사하다고 판단할 수 있다. 반면에, 사용자들은 취향이 다 다르기 때문에, 사용자 간의 유사성은 계산하기 더 어렵다.
- 데이터가 부족할 때도 문제 없음: user-to-user 방식에서는 많은 사용자가 소수의 아이템만 평가할 경우, 데이터를 구하기 어렵다. 반면, item-to-item 방식에서는 많은 사용자가 다양한 아이템을 평가했기 때문에, 데이터가 부족한 상황에서도 잘 작동한다.
- 더 개인화된 추천: item-to-item 방식은 사용자가 좋아하는 아이템과 비슷한 다른 아이템을 추천하기 때문에, 사용자가 좋아할 만한 아이템을 더욱 잘 찾아낼 수 있다. 반면 user-to-user 방식은 다른 사용자가 좋아한 아이템을 추천하는 방식이기 때문에, 개인의 취향에 덜 맞을 수 있다.
- 확장성: 사용자가 많아질수록 user-to-user 방식은 계산해야 할 양이 많아져 비효율적이다. 하지만 item-to-item 방식은 아이템의 수가 상대적으로 적어, 미리 계산해두면 더 빠르고 효율적으로 작동한다.
이러한 이유로 item-to-item 방식이 대규모 추천 시스템에서 더 좋은 성능을 보이는 경우가 많다.
만약 사용자 수가 적고 아이템 수가 많은 경우라면, user-to-user (u2u) 방식이 더 효과적일 수 있다. 그 이유는 다음과 같다:
- 아이템 수가 너무 많을 때: 아이템이 너무 많으면 item-to-item (i2i) 방식에서 모든 아이템 간의 유사도를 계산하는 것이 오히려 비효율적일 수 있다. 사용자가 적기 때문에, 각 사용자가 평가한 아이템의 수가 상대적으로 적어질 가능성이 높으며, 그로 인해 아이템 간의 유사도를 정확히 계산하기 어렵다.
- 사용자가 적을 때의 유사성 계산: 사용자 수가 적으면, user-to-user 방식에서 개별 사용자 간의 유사성을 계산하기가 더 쉽고, 유사성이 비교적 명확하게 드러날 수 있다. 비슷한 취향을 가진 소수의 사용자들을 더 쉽게 식별할 수 있고, 이 사용자들이 좋아한 아이템을 추천하는 방식으로 작동한다.
- 아이템 평가의 다양성: 사용자가 적으면, 같은 아이템을 여러 사용자가 평가하지 않아서 item-to-item 방식이 유사도를 계산하는 데 어려움을 겪을 수 있다. 하지만 사용자 간 유사도를 기반으로 추천하는 user-to-user 방식은 이 문제를 회피할 수 있다.
따라서, 아이템 수가 많고 사용자 수가 적을 때는 user-to-user 방식이 더 나은 성능을 발휘할 가능성이 크다.
'AI' 카테고리의 다른 글
Matrix Factorizaion의 여러 기법들 (1) | 2024.10.18 |
---|---|
추천시스템 - 협업필터링(모델기반) (1) | 2024.10.18 |
인덱싱의 의미 - 한줄 요약 (0) | 2024.10.15 |
Fusion과 Reranking (1) | 2024.10.08 |
Faiss와 Elasticsearch 비교 (0) | 2024.10.08 |