본문 바로가기

추천시스템 프로젝트(DACOS)

1주차 - 인프런 강의 수강(~섹션3)

 

 

 

1. 추천 시스템(Recommender System)

: 사용자의 과거 행동 데이터를 바탕으로 사용자에게 필요한 정보나 제품을 제시하는 시스템

 

 

추천 시스템의 여러 기술
• 협업 필터링(Collaborative Filtering)
• 내용 기반 필터링(Content-Based Filtering)
• 지식 기반 필터링(Knowledge-Based Filtering)
• 딥러닝(Deep Learning)
• 하이브리드 필터링(협업필터링 & 딥러닝)


- 협업 필터링(Collaborative Filtering : CF)
구매 및 소비한 제품에 대한 소비자의 평가 패턴이 비슷한 집단 속에서 서로 접하지 않은 제품을 추천하는 기술

- 내용 기반 필터링(Content-Based Filtering : CB)
제품의 내용을 분석해서 추천하는 기술

- 지식 기반 필터링(Knowledge-Based Filtering : KB)
특정 분야 전문가의 도움을 받아서 그 분야에 대한 “전체적인 지식 구조”를 만들어서 활용하는 방법

 

- 딥러닝(Deep Learning : DL) 추천 기술
AI 알고리즘 중에 현재 가장 많이 사용되는 딥러닝 방법 사용

- 하이브리드(Hybrid) 기술
두 가지 이상의 알고리즘 혼합을 통한 하이브리드 형태


실제 적용 사례

아마존, 유튜브, 넷플릭스 등

- 주로 협업 필터링에 여러 다른 기술들을 접목시킨 하이브리드 기법 사용


고려 사항

1) 고객 평가

2) 상품 페이지 방문 기록

3) 체류시간 

4) 쇼핑 카트 (장바구니 데이터)

 

- 시스템이 처리해야 하는 데이터의 양, 평가 항목의 수로 데이터 분석의 복잡도가 결정됨

 

 

 

 

사용자 데이터: u. data

 

영화에 대한 데이터 : u.item


영화 평가 데이터 : u.data

 

 

 

 

 

 

* 인기제품 방식 

 

- 개별 사용자에 대한 정보가 없거나, 데이터가 부족한 상황에 사용

- 모든 사용자에게 인기 있는 제품을 각 사용자에게 동일하게, 인기 순서대로 추천하는 방식

 

 

성능 측정 지표: 정확성

(예측 값 - 실제 값)^2 의 평균을 낸 RMSE를 사용

 

 

RMSE로 인기제품 방식의 해당 데이터셋에서의 성능 측정

 

 

* 사용자 집단별 추천

 

- 인기제품 방식: 전체 사용자의 경향 평균 판단 > 집단 특성을 반영하지 못함

- ex) 남자, 여자 : 집단별로 선호 영화 다를 수 있음

- 집단별 추천이 따라서 필요함

 

 

# 집단별 실제 선호도 - 예측 선호도로 RMSE 구함. 성별에 따라 나눔

 

 

 

 

* 협업 필터링 추천

 

- 사용자 집단별 추천은 큰 개선 x

- 어떤 아이템에 대해 비슷한 취향을 가진 사람들은 다른 아이템 또한 비슷한 취향을 가질 것이라 가정함

 

 

ex) user 1에게 추천을 해 주기 위해서는 각 사용자와의 유사성을 계산하고 해당 사용자가 좋아한 컨텐츠 추천 

- user 4, user3 참고해 추천