머신러닝 기반 분석 모형 선정
이전 내용
추천 시스템
추천 시스템은 기업 애플리케이션에서 매우 중요한 위치를 차지하고 있으며, 특히 온라인 스토어의 경우 뛰어난 추천 시스템은 매출 향상으로 이어지는 많은 사례로 인하여 많은 기업들이 추천 시스템의 예측 성능을 향상시키기 위해 알고리즘과 데이터 수집에 노력을 기울이고 있다.
아마존 등과 같은 전사상거래 업체부터 유튜브, 애플 뮤직 등 콘텐츠 포털까지 추천 시스템을 통해 사용자의 취향을 이해하고 맞춤 상품과 콘텐츠를 제공해 조금이라도 오래 자기 사이트에 고객을 머무르게 하기 위해 전력을 기울이고 있다.
하나의 콘텐츠를 선택했을 때 선택된 콘텐츠와 연관된 추천 콘텐츠가 얼마나 사용자의 관심을 끌고 개인에게 맞춘 콘텐츠를 추천했는지는 그 사이트의 평판을 좌우하는 매우 중요한 요소이다.
[추천 시스템의 유형]
추천 시스템의 초창기에는 콘텐츠 기반 필터링이나 최근접 이웃 기반 협업 필터링이 주로 사용됐지만, 넷플릭스 추천 시스템 경연 대회에서 행렬 분해(Matrix Factorization) 기법을 이용한 잠재 요인 협업 필터링 방식이 우승하면서 대부분의 온라인 스토어에서 잠재 요인 협업 필터링 기반의 추천 시스템을 적용하고 있다.
- 콘텐츠 기반 필터링(Content based filtering)
- 협업 필터링(Collaborative filtering) - 협업 필터링은 다시 최근접 이웃(Nearest Neighbor) 협업 필터링과 잠재 요인(Latent Factor) 협업 필터링으로 나뉜다.
- 최근접 이웃 필터링
- 잠재 요인 협업 필터링
요즘에는 개인화 특성을 좀 더 강화하기 위해서 하이브리드 형식으로 콘텐츠 기반과 협업 기반을 적절히 결합해 사용하는 경우도 늘고 있다.
콘텐츠 기반 필터링
콘텐츠 기반 필터링은 아이템(상품, 영화, 서비스 등)을 구성하는 여러 가지 콘텐츠 중 사용자가 좋아하는 콘텐츠를 필터링하여 이에 맞는 아이템을 추천하는 방식이다.
협업 필터링 - 최근접 이웃 협업 필터링
최근접 이웃 협업 필터링은 두 가지로 나뉘는데, 이 중 아이템 기반이 더 많이 사용된다.
- 사용자 기반: 사용자와 사용자 간의 유사도를 기준으로 추천하는 방식.
- 아이템 기반: 특정 아이템과 가장 근접하게 유사한 다른 아이템들을 추천하는 방식.
협업 필터링 - 잠재 요인 협업 필터링
잠재 요인 협업 필터링은 많은 추천 시스템에서 활용하는 방식으로, 사용자-아이템 평점 행렬 데이터에 숨어 있는 잠재 요인을 추출하여 사용자가 아직 평점을 매기지 않은 아이템에 대한 평점을 예측하여 이를 추천에 반영하는 방식이다.
파이썬 추천 패키지 - Suprise
Surprise는 사이킷런과 유사한 API를 지향하며, 간단한 API만을 이용해 파이썬 기반에서 추천 시스템을 구현해 준다.
다음 내용
[출처]
파이썬 머신러닝 완벽 가이드
'[파이썬 Projects] > <파이썬 머신러닝>' 카테고리의 다른 글
[머신러닝] 추천 시스템: 협업 필터링 (0) | 2024.11.03 |
---|---|
[머신러닝] 추천 시스템: 콘텐츠 기반 필터링 (1) | 2024.11.01 |
[머신러닝] 텍스트 분석 실습 - 캐글 Mercari (1) | 2024.11.01 |
[머신러닝] 텍스트 분석: 한글 텍스트 처리 (6) | 2024.10.31 |
[머신러닝] 텍스트 분석: 문서 유사도 (6) | 2024.10.31 |