KR101442122B1 - 콘텐츠 추천 장치 및 방법 - Google Patents

콘텐츠 추천 장치 및 방법 Download PDF

Info

Publication number
KR101442122B1
KR101442122B1 KR1020120142841A KR20120142841A KR101442122B1 KR 101442122 B1 KR101442122 B1 KR 101442122B1 KR 1020120142841 A KR1020120142841 A KR 1020120142841A KR 20120142841 A KR20120142841 A KR 20120142841A KR 101442122 B1 KR101442122 B1 KR 101442122B1
Authority
KR
South Korea
Prior art keywords
content
rating
rating data
ratings
data
Prior art date
Application number
KR1020120142841A
Other languages
English (en)
Other versions
KR20140084365A (ko
Inventor
장해
김종권
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to KR1020120142841A priority Critical patent/KR101442122B1/ko
Publication of KR20140084365A publication Critical patent/KR20140084365A/ko
Application granted granted Critical
Publication of KR101442122B1 publication Critical patent/KR101442122B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

본 발명은 콘텐츠 추천 장치 및 방법에 대하여 개시한다. 본 발명의 일면에 따른 콘텐츠 추천 장치는, 멱함수(Power law) 분포를 갖는 온라인상의 콘텐츠 평점 데이터에서 사용자가 추천받고자 하는 제1 종류의 콘텐츠에 대응하는 평점 데이터를 수집하는 수집부, 수집된 평점 데이터 중에서 평가 횟수가 임계개수 이상이고 제1 종류의 콘텐츠에 평점을 매긴 사용자들의 평점 데이터를 선별하는 전처리부, 선별된 평점 데이터를 이용하여 사전에 매겨지지 않은 평점을 예측하고, 제1 종류의 콘텐츠에 대응되는 모든 추천대상 콘텐츠에 대해 모든 선별 대상 사용자의 평점 및 예측된 평점이 반영된 종합 평점 데이터를 산출하는 예측부, 그리고 산출된 종합 평점 데이터에서 추천대상 콘텐츠별 평점을 평균하고, 상기 모든 추천대상 콘텐츠 중 평균한 평점이 가장 높은 콘텐츠부터 기설정된 개수만큼 사용자에게 제공하는 추천부를 포함하는 것을 특징으로 한다.

Description

콘텐츠 추천 장치 및 방법{Apparatus and Method for Content Recommendation}
본 발명은 콘텐츠 추천에 관한 것으로서, 더 구체적으로는 사용자의 평점 데이터를 이용하여 콘텐츠를 추천할 수 있는 콘텐츠 추천 장치 및 방법에 관한 것이다.
최근, Epinons, 페이스북(Facebook), IMDB 등 온라인 소셜 네트워크(Online social network) 내 온라인 구전(Word of Mouth)이 사람들의 구매, 영화관람 등에 많은 영향을 주고 있다.
또한, 영화사의 마케팅 전략의 일환인 온라인 영화평점은 만족도가 높은 영화를 관람하려는 사람들의 주목을 받고 있다.
예를 들어, 외국의 Movielens, Rotten Tomato, 한국의 Daum, Naver 등의 영화 평점사이트의 평점정보 등이 관람자의 영화 선택에 영향을 주고 있다.
본 발명은 전술한 바와 같은 기술적 배경에서 안출된 것으로서, 멱함수(Power law)에 따른 분포를 갖는 평점 데이터를 이용하여 콘텐츠의 평점을 예측하는 콘텐츠 추천 장치 및 방법을 제공하는 것을 그 목적으로 한다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
본 발명의 일면에 따른 콘텐츠 추천 장치는, 멱함수(Power law) 분포를 갖는 온라인상의 콘텐츠 평점 데이터에서 사용자가 추천받고자 하는 제1 종류의 콘텐츠에 대응하는 평점 데이터를 수집하는 수집부; 수집된 평점 데이터 중에서 평가 횟수가 임계개수 이상이고 상기 제1 종류의 콘텐츠에 평점을 매긴 사용자들의 평점 데이터를 선별하는 전처리부; 선별된 평점 데이터를 이용하여 사전에 매겨지지 않은 평점을 예측하고, 상기 제1 종류의 콘텐츠에 대응되는 모든 추천대상 콘텐츠에 대해 모든 선별 대상 사용자의 평점 및 예측된 평점이 반영된 종합 평점 데이터를 산출하는 예측부; 및 산출된 종합 평점 데이터에서 추천대상 콘텐츠별 평점을 평균하고, 상기 모든 추천대상 콘텐츠 중 평균한 평점이 가장 높은 콘텐츠부터 기설정된 개수만큼 사용자에게 제공하는 추천부를 포함하는 것을 특징으로 한다.
본 발명의 다른 면에 따른 장치에 의한 콘텐츠 추천 방법은, 멱함수(Power law) 분포를 갖는 온라인상의 콘텐츠 평점 데이터에서 사용자가 추천받고자 하는 제1 종류의 콘텐츠에 대응하는 평점 데이터를 수집하는 단계; 수집된 평점 데이터 중에서 평가횟수가 임계개수 이상이고 상기 제1 종류의 콘텐츠에 평점을 매긴 사용자들의 평점 데이터를 선별하는 단계; 선별된 평점 데이터를 이용하여 사전에 매겨지지 않은 평점을 예측하고, 상기 제1 종류의 콘텐츠에 대응되는 모든 추천대상 콘텐츠에 대해 모든 선별 대상 사용자의 평점 및 예측된 평점이 반영된 종합 평점 데이터를 산출하는 단계; 및 산출된 종합 평점 데이터에서 추천대상 콘텐츠별 평점을 평균하고, 상기 모든 추천대상 콘텐츠 중 평균한 평점이 가장 높은 콘텐츠부터 기설정된 개수만큼 사용자에게 제공하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따르면, 평점 데이터를 이용한 평점을 예측의 정확도를 향상시킬 수 있다.
도 1 및 도 2는 Daum 영화 평점 네트워크의 인 등급(In-degree) 분포와 아웃 등급(Out-degree) 분포를 도시한 그래프.
도 3은 행렬 인수분해 방법을 설명한 도면.
도 4는 본 발명의 실시예에 따른 콘텐츠 추천 장치를 도시한 구성도.
도 5는 임계개수를 5로 설정했을 때, 도 6은 임계개수를 10으로 설정했을 때 본 발명의 실시예에 따른 평점 예측의 정확도를 다른 평점 예측 방법과 비교하여 도시한 그래프.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성소자, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성소자, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
이하, 본 발명의 구체 구성에 대해서 설명하기에 앞서, 영화 평점 네트워크에 대해서 분석해본다.
이를 위하여, 2009년 2월 25일부터 2012년 5월 14일까지의 Daum 영화 평점 네트워크의 평점 데이터를 크롤링(Crawling)하였다. 여기서, 크롤링은 무수히 많은 컴퓨터에 분산 저장되어 있는 문서를 수집하여 검색대상의 색인으로 포함시키는 기술이다.
해당 기간(20009-02-25~2012-05-14)의 Daum 영화 평점 데이터에서, 전체 영화의 수는 11682이며, 사용자의 수는 140271이고, 사용자가 영화에 단 평점의 수는 425537이다.
도 1 및 도 2는 Daum 영화 평점 네트워크의 인 등급(In-degree) 분포와 아웃 등급(Out-degree) 분포를 도시한 그래프이다. 여기서, 인 등급은 하나의 영화를 평가한 사용자의 수이고, 아웃 등급은 한 명의 사용자가 평가한 영화의 수이다.
도 1 및 도 2에서, Y축은 상보누적함수(Complementary Cumulative density function, CCDF)이며, 이것은 1에서 x값의 누적분포(Cumulative density function, CDF) 값을 뺀 값과 동일하다.
예를 들어, 도 1에서 x=1000일 때, y=0.01인데, 이는 1000개 이상의 평가를 받은 영화의 비율이 전체에서 0.01을 차지한다는 의미이다.
도 1 및 도 2에서, Fitting 선(점선 참조)은 멱함수(Power law)에 따른 그래프이며, 그 분포는 Pr(X=x)=ax를 따르고, b값은 기울기의 절대값이다.
도 1 및 도 2에서, Daum 영화 평점 네트워크는 온라인 소셜 네트워크에서 사용자와 관계를 갖는 이웃(Neighbor) 수의 분포(degree distribution)와 같이 멱함수 분포를 따르는 것을 알 수 있다.
이를 통해서, 온라인 영화 평점 네트워크는 온라인 소셜 네트워크 특성을 지닌다는 것을 알 수 있다.
이하, 온라인 콘텐츠 평점 네트워크를 기반으로 콘텐츠를 추천하는 방법에 대해서 설명한다. 이때, 콘텐츠는 영화, 드라마, 동영상, 소설이나, 사진첩 등을 포함한다. 이하의 명세서에서는 설명의 편의성을 위해서 영화 평점 네트워크를 기반으로 영화를 추천하는 방법에 대해서 설명한다.
<< 행렬 인수분해 방법 >>
온라인 영화의 평점 데이터에 SVD(Singular Value Decomposition) 방법을 적용하는 행렬 인수분해 방법(Matric Factorization)에 의해 영화를 추천해줄 수 있다.
행렬 인수분해 방법에서는 하기의 수학식 1과 같이 사용자 u의 영화 i의 예측 평점 데이터는 산출될 수 있다.
Figure 112012102428240-pat00001
수학식 1에서, pu는 전체 사용자의 특징이며, qi는 전체 영화의 특징이며, 각기 도 3과 같은 관계에 있다. 여기서, 도 3과 같이, Rm ×n은 전체 평점 데이터이며, 각 사용자 u는 벡터 pu∈Rf의 관계에 있고, 각 항목(영화) i는 벡터 qi∈Rf의 관계에 있다. 여기서, di는 잠재요인(Latent factor)이다. 이 같이, 행렬 인수분해 방법을 이용하면, 사용자 u와 항목 i의 관계로부터 매겨지지 않은 평점(도 3의 ?참조)을 예측할 수 있다.
더 세부적인 행렬 인수분해 방법에 대해서는 인용문헌 1(S. Deerwester, S. Dumais, G. W. Fumas, T. K Landauer and R. Harshman, "Indexing by Latent Semantic Analysis", Journal of the Society for Information Science 41(1990), 391-407페이지 참조) 등의 배경기술에 개시된 바 있으므로, 그에 대한 설명은 생략하기로 한다.
행렬 인수분해 방법은 비교적 우수한 성능을 제공하지만, 다른 방법과 혼용되면, 성능을 더욱 향상시킬 수 있다.
<< Average bias 방법 >>
평균 바이어스 방법은 하기의 수학식 2와 같이, 사용자와 아이템의 특성을 반영하는 bias bui를 고려한다.
Figure 112012102428240-pat00002
수학식 2에서, u는 전체 영화의 평균평점이며, bi는 영화 i가 받은 평균평점과 u의 차이, bu는 사용자 u가 매긴 평균평점과 u의 차이이다.
예를 들어, 전체 영화의 평균평점이 5점, 영화 "타이타닉"의 평균 평점이 8점, 철수의 평균 평점이 4점이라면, bi는 3점, bu는 -1점이 된다. 따라서, bui는 7(5+3-1)점이 된다.
행렬 인수분해 방법과 평균 바이어스 방법을 함께 사용하면 콘텐츠 추천의 성능을 보다 향상시킬 수 있는데, 이에 대해서는 인용문헌 2(Y. Koren, R. Bell, C. Bolinsky, "Matrix Factorization Techniques for Recommender systems" in Computer 2009) 등의 배경기술에 개시된 바 있다.
<< Random bias >>
본 발명에 따른 랜덤 바이어스 방법은 수학식 3과 같이, 사용자 및 영화의 평점 분포 특성을 함께 반영하는 방법이다.
Figure 112012102428240-pat00003
수학식 3에서, u는 전체 영화의 평균평점, ri는 영화 i가 받은 평점의 분포를 갖는 확률변수와 u의 차이, ru는 사용자 u가 매긴 평점의 분포를 갖는 확률변수와 u의 차이이다.
예를 들어, 전체 영화의 평균평점이 5점이고, 타이타닉이 받은 평점은 5점이 50%, 10점이 50%라면, 50%의 확률로 5와 10이 나오는 확률변수를 생성하고, 그로부터 u를 빼서 ri를 얻는다. ru도 마찬가지의 방식으로 얻을 수 있다.
전술한 방식을 통해 같은 평균점수를 갖는 사용자나, 영화라도 그 분포에 따라 각기 다른 결과가 도출될 수 있다. 대개, 사용자의 평점은 양극단으로 갈리는 경향을 띄는데, 그러한 경우에 랜덤 바이어스에 따른 형태의 보정이 효과적일 수 있다.
본 발명에 따르면, 행렬 인수분해 방법과 랜덤 바이어스 방법을 혼용하여 콘텐츠 추천의 성능이 향상시킬 수 있다.
전술한 바와 같이, 도 1 및 도 2의 온라인 영화 평점 네트워크에서 특정 기간의 전체 데이터는 평가자 140271명, 영화 11682, 영화에 대한 평점 140271개이다. 그런데, 전체 데이터의 사용자 중에서 1개 또는 2개 평가한 사용자가 대부분을 차지하는 경우에는 드문(Sparse) 데이터 셋을 가질 수 있다. 평점이 적은 사용자가 많을 때 행렬 인수분해 방법을 사용하면, 첫 시작(Cold Start) 문제가 발생할 수 있다.
이러한 문제를 방지하고자, 본 발명의 실시예에서는 임계개수(Threshold) 이상의 영화에 평점을 준 사용자의 평점 데이터를 기반으로 영화를 추천한다.
또한, 사용자가 평점을 0점으로 매긴 경우, 해당 영화를 강력하게 비추천한 것인데, 0점이 사용자가 평점을 매기지 않은 것으로 여겨져, 사용자 아이템 행렬에 반영되지 않는다. 이 경우, 평점 예측 결과에 많은 오차가 발생할 수 있다.
이러한 문제를 방지하고자, 본 발명의 실시예에는 각 사용자가 매긴 모든 평점에 1점을 더하여 평점이 1~11점 내에 있도록 만들고, 이후 예측된 평점에서 1을 뺀 값을 영화 추천에 이용한다.
전술한 예에서는 콘텐츠가 영화인 경우를 예로 들어 설명하였으나, 드라마, 소설 등의 다른 콘텐츠에 대해서도 전술한 과정을 통해서 평점을 예측한 후 콘텐츠를 추천할 수 있다.
이하, 도 4를 참조하여 본 발명의 실시예에 따른 콘텐츠 추천 장치에 대해서 설명한다. 도 4는 본 발명의 실시예에 따른 콘텐츠 추천 장치를 도시한 구성도이다.
도 4에 도시된 바와 같이, 본 발명의 실시예에 따른 콘텐츠 추천 장치(10)는 입력부(110), 수집부(120), 전처리부(130), 예측부(140) 및 추천부(150)를 포함한다. 이때, 입력부(110)는 콘텐츠 추천 장치(10) 내 구비되지 않고, 그 외부에 구비될 수도 있음을 물론이다.
입력부(110)는 사용자 인터페이스로서, 사용자가 추천받고자 하는 콘텐츠의 종류를 선택받는다. 예를 들어, 콘텐츠의 종류는 영화, 드라마, 소설이나, 만화 등이다. 이때, 사용자는 입력부(110)를 통해 그중 영화를 추천받고자함을 선택할 수 있다.
수집부(120)는 멱함수 분포를 갖는 온라인 네트워크상의 콘텐츠 평점 데이터로부터 사용자에 의해 선택된 종류의 콘텐츠 평점 데이터를 수집한다.
여기서, 멱함수 분포를 갖는 온라인 네트워크의 콘텐츠 평점 데이터는 Daum나, Naver, 영화정보 제공 사이트와 같이 영화 평점을 제공하는 사이트의 콘텐츠 평점 데이터일 수 있다.
전처리부(130)는 수집된 콘텐츠 평점 데이터 중에서 임계개수 이상의 동종 콘텐츠에 평점을 매긴 사용자의 콘텐츠 평점 데이터를 선별한다. 여기서, 임계개수는 6 이상인 것이 좋다.
예를 들어, 전처리부(130)는 영화 평점 데이터 중에서 임계개수 이상의 영화에 평점을 매긴 선별대상 사용자의 콘텐츠 평점 데이터를 선별한다.
전처리부(130)는 선별된 콘텐츠 평점 데이터에 1을 더하여 평점 스케일을 0~10에서 1~11 사이로 만든다. 본 발명의 실시예에서는 이러한 방식으로 사용자에 의해 매겨진 평점 0점과 평점이 매겨지지 않은 콘텐츠를 구분할 수 있다.
예측부(140)는 하기의 수학식 4와 같이 행렬 인수분해와 랜덤 바이어스 방법에 의해, 스케일 조정된 콘텐츠 평점 데이터 중에서 평점이 매겨지지 않은 콘텐츠 평점 데이터를 예측하고, 예측된 평점에서 1을 뺀 최종 예측 평점을 산출한다.
Figure 112012102428240-pat00004
여기서, a는 행렬 인수분해와 랜덤 바이어스 방법의 가중치이며(0≤a≤1), RMF는 콘텐츠 평점 데이터에 행렬 인수분해를 적용한 결과로서 수학식 1에 의해 산출될 수 있고, Rbias는 콘텐츠 평점 데이터에 랜덤 바이어스 방법을 적용한 결과로서 수학식 3에 의해 산출될 수 있다. 이때, 가중치는 행렬 인수분해와 평균 바이어스 방법과의 비교를 통해서 설정되는 것이 좋다. 이에 해서는 도 5 및 6을 참조하여 후술한다.
예를 들어, 콘텐츠 평점 데이터에 사용자 1이 영화 A, B, C에 매긴 평점과 사용자 2가 영화 A, C에 매긴 평점이 포함되어 있는 경우라면, 예측부(140)는 콘텐츠 평점 데이터를 이용하여 사용자 2가 B에 매길 것으로 예상되는 평점을 예측하고, 여기서 1을 뺀다. 따라서, 예측부(140)는 선택된 종류에 대응하는 모든 추천대상(예컨대, 상영중 또는 판매중) 콘텐츠에 대해 모든 선별대상 사용자의 평점 또는 예측 평점이 매겨진 종합 평점 데이터를 산출할 수 있다.
추천부(150)는 종합 평점 데이터를 이용하여 선택된 종류의 콘텐츠 추천을 의뢰한 사용자에게 콘텐츠를 추천할 수 있다.
예를 들어, 추천부(150)는 복수의 영화에 대한 종합 평점 데이터에서 영화별 평점을 평균하여 그 중에서 평점이 높은 순으로 3개의 영화를 사용자에게 추천해줄 수 있다.
이하, 도 5 및 도 6을 참조하여 본 발명의 실시예에 따른 가중치에 따른 평점 예측의 정확도를 RMSE(Root Mean Square Error)를 성능 평가 지표로 하여 살펴본다.
도 5는 임계개수를 5로 설정했을 때 본 발명의 실시예에 따른 평점 예측 방법(MF Random)의 정확도를 다른 평점 예측 방법과 비교하여 도시한 그래프이며, 도 6은 임계개수를 10으로 설정했을 때 본 발명의 실시예에 따른 평점 예측의 정확도를 다른 평점 예측 방법과 비교하여 도시한 그래프이다. 여기서, 다른 평점 예측 방법은 행렬 인수분해 방법(MF) 및 행렬 인수분해와 평균 바이어스를 결합한 방법(MF Average)이다.
도 5 및 도 6에서는 전체 평점 데이터의 90%를 훈련 셋(즉, 입력 데이터)으로 설정하고, 훈련 셋에 의해 훈련 셋으로 설정되지 않은 10%에 대해 평점을 예측한다. 그리고, 예측된 평점과 훈련 셋으로 설정되지 않은 10%의 평점 데이터 간의 RMSE 값을 산출하여 평점 예측의 정확도를 확인하였다.
여기서, 평가의 편의성을 위해서 전체 평점 데이터는 모든 대상 사용자가 모든 추천대상 콘텐츠에 평점을 매긴 데이터를 사용하였다. 이때, RMSE 값은 작을수록 추천 정확도가 높을 것임은 물론이다.
도 5에서, 가중치 a가 0.5일 때, MF Average 방법의 RMSE 값이 2.385로 최소치(Min)로, 행렬 인수분해 방법의 RMSE 값인 2.5보다 10.2%정도 낮음을 알 수 있다.
또한, 본 발명의 MF Average 방법의 RMSE 값은 a값이 0.1인 경우 2.385로 최소치인데, 이 또한 종래의 행렬 인수분해 방법보다 4.8%정도 정확도가 높음을 알 수 있다.
그러나, RMSE의 최소값을 비교하면, 임계개수가 5인 경우에는 본 발명의 실시예에 따른 MF Random 방법이 평균 바이어스 결합 방법(MF Average)보다 정확도가 낮음을 알 수 있다. 그러나, 도 6과 같이 임계개수가 어느 정도 이상이 되면 본 발명의 평점 예측의 정확도가 높아진다.
즉, 도 6에서, 최소 RMSE 값은 가중치 a가 0.1일 때 MF Random 방법의 RMSE 값은 2.276으로서, 이는 MF Average 방법의 최소 RMSE 값인 2.287, 행렬 인수분해 방법의 최소 RMSE 값 2.372보다 각기 0.4%, 4.1% 정확도가 높아진 것을 알 수 있다.
이로부터, 본 발명의 실시예에 따른 MF Random 방법은 사용자 평점의 수가 많은 경우에 더욱 성능이 향상됨을 알 수 있다. 따라서, 본 발명에서는 임계개수를 6 이상 적용하는 것이 좋다.
이와 같이, 본 발명의 실시예는 멱함수 분포를 따르는 평점 데이터를 이용하여 평점을 예측할 때 그 예측의 정확도를 향상시킬 수 있다.
이상, 본 발명의 구성에 대하여 첨부 도면을 참조하여 상세히 설명하였으나, 이는 예시에 불과한 것으로서, 본 발명이 속하는 기술분야에 통상의 지식을 가진자라면 본 발명의 기술적 사상의 범위 내에서 다양한 변형과 변경이 가능함은 물론이다. 따라서 본 발명의 보호 범위는 전술한 실시예에 국한되어서는 아니되며 이하의 특허청구범위의 기재에 의하여 정해져야 할 것이다.

Claims (7)

  1. 멱함수(Power law) 분포를 갖는 온라인상의 콘텐츠 평점 데이터에서 사용자가 추천받고자 하는 제1 종류의 콘텐츠에 대응하는 평점 데이터를 수집하는 수집부;
    수집된 평점 데이터 중에서 평가 횟수가 임계개수 이상이고 상기 제1 종류의 콘텐츠에 평점을 매긴 사용자들의 평점 데이터를 선별하는 전처리부;
    선별된 평점 데이터를 이용하여 사전에 매겨지지 않은 평점을 예측하고, 상기 제1 종류의 콘텐츠에 대응되는 모든 추천대상 콘텐츠에 대해 모든 선별 대상 사용자의 평점 및 예측된 평점이 반영된 종합 평점 데이터를 산출하는 예측부; 및
    산출된 종합 평점 데이터에서 추천대상 콘텐츠별 평점을 평균하고, 상기 모든 추천대상 콘텐츠 중 평균한 평점이 가장 높은 콘텐츠부터 기설정된 개수만큼 사용자에게 제공하는 추천부
    를 포함하는 콘텐츠 추천 장치.
  2. 제1항에 있어서,
    상기 전처리부는, 수집된 평점 데이터의 모두에 1을 더하여 수집된 평점 데이터의 스케일을 조절하고,
    상기 예측부는, 예측된 평점에서 1을 감산연산하여 최종 예측 평점을 산출하며, 산출된 최종 예측 평점을 반영하여 상기 종합 평점 데이터를 산출하는 것
    인 콘텐츠 추천 장치.
  3. 삭제
  4. 제1항에 있어서, 상기 임계개수는,
    6 이상의 상수인 콘텐츠 추천 장치.
  5. 멱함수(Power law) 분포를 갖는 온라인상의 콘텐츠 평점 데이터에서 사용자가 추천받고자 하는 제1 종류의 콘텐츠에 대응하는 평점 데이터를 수집하는 단계;
    수집된 평점 데이터 중에서 평가횟수가 임계개수 이상이고 상기 제1 종류의 콘텐츠에 평점을 매긴 사용자들의 평점 데이터를 선별하는 단계;
    선별된 평점 데이터를 이용하여 사전에 매겨지지 않은 평점을 예측하고, 상기 제1 종류의 콘텐츠에 대응되는 모든 추천대상 콘텐츠에 대해 모든 선별 대상 사용자의 평점 및 예측된 평점이 반영된 종합 평점 데이터를 산출하는 단계; 및
    산출된 종합 평점 데이터에서 추천대상 콘텐츠별 평점을 평균하고, 상기 모든 추천대상 콘텐츠 중 평균한 평점이 가장 높은 콘텐츠부터 기설정된 개수만큼 사용자에게 제공하는 단계
    를 포함하는 콘텐츠 추천 방법.
  6. 제5항에 있어서,
    상기 평점 데이터를 선별하는 단계는,
    수집된 평점 데이터의 모두에 1을 더하여 수집된 평점 데이터의 스케일을 조절하는 단계를 포함하고,
    상기 산출하는 단계는,
    예측된 평점에서 1을 감산연산하여 최종 예측 평점을 산출하며, 산출된 최종 예측 평점을 반영하여 상기 종합 평점 데이터를 산출하는 단계를 포함하는 것
    인 콘텐츠 추천 방법.
  7. 삭제
KR1020120142841A 2012-12-10 2012-12-10 콘텐츠 추천 장치 및 방법 KR101442122B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120142841A KR101442122B1 (ko) 2012-12-10 2012-12-10 콘텐츠 추천 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120142841A KR101442122B1 (ko) 2012-12-10 2012-12-10 콘텐츠 추천 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20140084365A KR20140084365A (ko) 2014-07-07
KR101442122B1 true KR101442122B1 (ko) 2014-10-07

Family

ID=51734248

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120142841A KR101442122B1 (ko) 2012-12-10 2012-12-10 콘텐츠 추천 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101442122B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016129871A1 (ko) * 2015-02-11 2016-08-18 삼성전자 주식회사 영상처리장치, 영상처리장치의 제어방법 및 시스템

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102203253B1 (ko) * 2019-03-07 2021-01-14 네이버 주식회사 생성적 적대 신경망에 기반한 평점 증강 및 아이템 추천 방법 및 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011257953A (ja) * 2010-06-08 2011-12-22 Nippon Telegr & Teleph Corp <Ntt> 日時別推薦アイテムフィルタリング方法及び日時別推薦アイテムフィルタリングプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011257953A (ja) * 2010-06-08 2011-12-22 Nippon Telegr & Teleph Corp <Ntt> 日時別推薦アイテムフィルタリング方法及び日時別推薦アイテムフィルタリングプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016129871A1 (ko) * 2015-02-11 2016-08-18 삼성전자 주식회사 영상처리장치, 영상처리장치의 제어방법 및 시스템

Also Published As

Publication number Publication date
KR20140084365A (ko) 2014-07-07

Similar Documents

Publication Publication Date Title
Huang Designing utility-based recommender systems for e-commerce: Evaluation of preference-elicitation methods
Formoso et al. Using profile expansion techniques to alleviate the new user problem
US20070219994A1 (en) Methods and systems for displaying media utilizing user-generated data
US20130132851A1 (en) Sentiment estimation of web browsing user
US20150186947A1 (en) Digital content recommendations based on user comments
CN107810497A (zh) 呈现搜索结果的方法、***、和介质
CA2646748A1 (en) A method and system for measuring an impact of various categories of media owners on a corporate brand
Hwang et al. An algorithm for movie classification and recommendation using genre correlation
Embarak A method for solving the cold start problem in recommendation systems
Dhawan et al. High rating recent preferences based recommendation system
KR101708254B1 (ko) 협업적 필터링과 캐릭터 넷을 이용한 스토리 기반의 영화 추전 시스템 및 방법.
Neve et al. Hybrid reciprocal recommender systems: Integrating item-to-user principles in reciprocal recommendation
KR101459537B1 (ko) 링크 예측을 이용한 소셜 추천 방법
US10877982B1 (en) Detection of popular content with narrow appeal
KR101442122B1 (ko) 콘텐츠 추천 장치 및 방법
Ho et al. A Hybrid GA-based Collaborative Filtering Model for Online Recommenders.
US20160094887A1 (en) Tv program-based shopping guide system and tv program-based shopping guide method
Li et al. Affinity-driven prediction and ranking of products in online product review sites
CN112218114B (zh) 视频缓存控制方法、装置和计算机可读存储介质
Jain et al. CRLRM: category based recommendation using linear regression model
Sharma et al. Suggestive approaches to create a recommender system for GitHub
Bedi et al. Handling cold start problem in Recommender Systems by using Interaction Based Social Proximity factor
Pourgholamali Mining information for the cold-item problem
Zhang et al. Estimating online review helpfulness with probabilistic distribution and confidence
CN114168791A (zh) 视频推荐方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170824

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180820

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190917

Year of fee payment: 6