본문 바로가기
AI 및 데이터 분석

지식 기반, 인구 통계학적, 하이브리드 - 추천시스템의 기본 모델 (2)

by riML 2023. 11. 30.

1. 지식 기반 추천 시스템

지식 기반 추천 시스템은 주로 자주 구매되지 않는 아이템에 대해 특히 유용합니다. 예를 들면 부동산, 자동차, 관광 서비스, 금융 상품 등이 해당합니다. 이러한 아이템은 구매 빈도가 낮고 다양한 상세 옵션이 존재하기 때문에 충분한 평점 데이터가 부족할 수 있습니다. 이로 인해 콜드 스타트 문제에 직면할 수 있습니다. 또한, 이러한 아이템의 소비자 선호도는 시간이 지남에 따라 변할 수 있습니다. 예를 들어 자동차 모델이 몇 년 동안 급격히 발전하면 소비자의 선호도도 변할 것입니다.

지식 기반 추천 시스템은 이러한 문제를 해결하기 위해 평점을 사용하지 않고 추천을 제공할 수 있습니다. 사용자의 요구 사항과 아이템의 상세 정보 간의 유사성, 또는 사용자 요구 사항을 기반으로 한 제약 조건을 활용하여 추천 프로세스를 수행합니다. 이는 지식 기반이라는 검색 과정에서 규칙과 유사도 함수를 사용하며 데이터를 활용합니다.

1) 제약 기반 추천 시스템: 이 시스템에서는 사용자가 아이템에 대한 요구 사항과 제한 사항을 기입합니다. 검색 결과가 부족한 경우 사용자는 제약 조건 중 일부를 완화하거나 더 많이 추가할 수 있습니다. 검색 프로세스는 사용자가 원하는 결과에 도달할 때까지 상호 작용하며 반복됩니다.

2) 사례 기반 추천 시스템: 이 시스템에서는 사용자가 선택한 특정 사례가 대상 또는 앵커 포인트로 지정됩니다. 유사성 측정은 이 사례와 유사한 아이템을 검색하기 위해 아이템 속성에 정의됩니다. 검색된 결과는 사용자가 상호 작용하고 일부 수정을 반영해 새로운 대상으로 사용될 수 있습니다.

지식 기반 시스템과 콘텐츠 기반 시스템은 아이템의 속성에 크게 의존한다는 공통점이 있습니다. 그러나 콘텐츠 기반 시스템은 사용자의 과거 행동에서 학습하는 반면, 지식 기반 추천 시스템은 사용자의 능동적인 요구 사항을 기반으로 추천합니다.

2. 인구 통계학적 추천 시스템

인구 통계학적 추천 시스템은 사용자에 대한 인구 통계학적 정보를 분류 모델을 활용하여 특정 인구 통계학적 평점이나 구매 성향과 연결하는데 사용됩니다. 초기 추천 시스템 중 하나인 그룬디는 수동으로 작성한 정형화된 생각을 기반으로 책을 추천했습니다. 이 시스템은 양방향 대화를 통해 사용자의 특성을 수집하여 개인화된 추천을 제공했습니다.

일부 연구에서는 시장 조사를 통해 얻은 인구 통계학적 그룹을 활용하여 아이템을 추천하는 방법을 탐구했습니다. 또 다른 연구에서는 사용자가 특정 페이지를 높게 평가한 경우 해당 사용자의 인구 통계학적 특성을 기반으로 웹 페이지를 추천하는 방식을 제안했습니다. 이러한 인구 통계학적 정보는 추천 프로세스에 추가적인 컨텍스트를 제공하여 개인화된 추천을 더욱 향상시킬 수 있습니다.

최근의 기술은 분류 모델을 활용하여 추천을 생성하는 방향으로 진화했습니다. 특정 홈페이지를 좋아할 가능성을 예측하기 위해 사용자 홈페이지에서 피처를 추출하는 기술은 이러한 발전의 한 예입니다. 규칙 기반 분류 모델은 종종 인구 통계학적 프로파일을 대화형 방식으로 구매 행위와 관련시키는 데에 사용됩니다.

인구 통계학적 추천 시스템은 독립 실행형으로만 사용되지 않고, 주로 하이브리드 또는 앙상블 모델의 구성 요소로 다른 추천 시스템과 통합되어 사용됩니다. 이러한 방식으로 인구 통계학적 기법은 지식 기반 추천 시스템과 결합하여 추천 시스템의 강건성을 높이는 데 기여합니다.

 

3. 하이브리드와 앙상블 기반 추천 시스템

각 추천 시스템은 서로 다른 입력 소스와 시나리오에서 작동할 수 있는 특성을 가지고 있습니다. 

예를 들면, 
- 협업 필터링 시스템은 커뮤니티 평점에 의존합니다.
- 콘텐츠 기반 방식은 텍스트 설명과 대상 사용자 자신의 평점에 의존합니다.
- 지식 기반 시스템은 사용자와의 상호작용 및 지식 기반 환경에서의 정보에 의존합니다.
- 인구 통계학적 시스템은 사용자의 인구 통계학적 프로파일을 사용해 추천합니다.

 

시스템들은 각각 다른 강점과 약점을 가지며, 특정 상황 또는 데이터 환경에서 효과적일 수 있습니다. 예를 들어, 지식 기반 시스템은 데이터가 제한적인 콜드 스타트 환경에서 효과적일 수 있습니다. 반면에 협업 필터링과 같은 다른 시스템은 데이터 양이 많을 때 더욱 강력해질 수 있습니다.

이러한 다양한 특성과 강점을 고려하여, 서로 다른 유형의 추천 시스템을 조합하는 하이브리드 추천 시스템이 나타납니다. 하이브리드 추천 시스템은 여러 유형의 시스템으로부터 다양한 측면을 결합하여 최적의 성능을 발휘합니다. 이는 앙상블 분석과 관련이 있으며, 여러 다른 기술을 조합하여 더 강력하고 견고한 모델을 형성하는 것을 목표로 합니다.

하이브리드 추천 시스템은 데이터 분류 분야의 앙상블 분석과 유사한 개념을 적용하며, 다양한 데이터 소스 및 모델을 결합하여 효율성을 극대화할 수 있습니다. 이는 데이터 분석 분야에서 효과적으로 활용되는 유연하고 강력한 접근 방식 중 하나입니다.