KR20230148995A - 개인화된 리뷰를 제공하는 방법 및 시스템 - Google Patents

개인화된 리뷰를 제공하는 방법 및 시스템 Download PDF

Info

Publication number
KR20230148995A
KR20230148995A KR1020220048092A KR20220048092A KR20230148995A KR 20230148995 A KR20230148995 A KR 20230148995A KR 1020220048092 A KR1020220048092 A KR 1020220048092A KR 20220048092 A KR20220048092 A KR 20220048092A KR 20230148995 A KR20230148995 A KR 20230148995A
Authority
KR
South Korea
Prior art keywords
user
review
reviews
personalized
data distribution
Prior art date
Application number
KR1020220048092A
Other languages
English (en)
Inventor
이보원
윤수연
Original Assignee
인하대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인하대학교 산학협력단 filed Critical 인하대학교 산학협력단
Priority to KR1020220048092A priority Critical patent/KR20230148995A/ko
Publication of KR20230148995A publication Critical patent/KR20230148995A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

개인화된 리뷰를 제공하는 방법 및 시스템이 제시된다. 본 발명에서 제안하는 개인화된 리뷰를 제공하는 방법은 정보 추출부를 통해 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 단계, 학습부를 통해 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계 및 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계를 포함한다.

Description

개인화된 리뷰를 제공하는 방법 및 시스템{Methods and System for Providing Personalized Reviews}
본 발명은 개인화된 리뷰를 제공하는 방법 및 시스템에 관한 것이다.
인터넷 및 스마트폰 앱 등 다수의 사람이 대상을 평가할 수 있는 플랫폼에서 제공되는 리뷰에 있어서, 동일한 대상이라고 하더라도 개인에 따라서 평가가 달라질 수 있다. 하지만 개인이 경험해보지 못한 영역에 대해 직접 시도하기 전까지는 타인의 리뷰에 의존할 수밖에 없는데, 이는 개인에 따라서 정확한 정보가 될 수도 있고 부정확한 정보가 될 수도 있다.
예를 들어, 음식을 선택할 때는 이미 그 음식을 시도해 본 사람들의 평가에 의존할 수밖에 없다. 따라서 다수 평가자의 평가들을 종합적으로 열람이 가능한 리뷰 앱들이 다양하게 시장에 등장했다. 하지만 그 평가는 사용자마다 척도가 달라 상대적이다. 즉, 리뷰가 주관적인 평가이기 때문에 경우에 따라서 특정 사용자에게는 적용되지 않을 수 있다는 치명적인 단점이 존재한다. 개별 사용자가 부여하는 평점은 사용자에 따라 편향성이나 패턴이 있을 수 밖에 없고, 따라서 보다 정확한 정보를 제공하기 위해서는 이를 고려하는 것이 바람직하다.
이와 관련하여, 종래기술 한국등록특허 제10-2227552호는 상황인지 알고리즘 기반 리뷰 카테고리를 이용한 음식점 노출 개인화 서비스 제공 시스템에 대해 개시하고 있다. 이를 위하여 해당 아이디어는 웹트래픽 및 키스트로크 로깅(Keystroke logging)을 포함하는 개인화 데이터를 실시간으로 업로드하고 개인화 데이터에 의해 정렬순서가 변경된 메인 페이지를 노출하며 개인화 서비스 제공 서버를 포함한다.
또 다른 종래기술 한국등록특허 제10-2017-0016913호는 콘텐츠의 우선순위를 개인화하는 시스템, 방법 및 프로그램에 대해 개시하고 있다. 이를 위하여 대표액션이 전체 사용자의 액션 대비 어느 정도 수준인지를 평가하여 속성별로 대표액션 스코어를 계산하는 가중치인 속성 가중치를 생성하는 속성 가중치 모듈이나 속성 가중치와 온라인 콘텐츠의 속성정보를 이용하여 온라인 콘텐츠의 우선순위를 계산하는 우선순위 모듈 등 여러가지 모듈을 제시한다.
또 다른 종래기술 한국등록특허 제10-1532715호는 문서와 서치 질의에 대해 관련성 점수를 계산하고, 그 서치 질의에 응답하여 결과 리스트에 반환된 문서를 등급화하여 변수와 파라미터를 갖는 공식으로 공식화하며, 최종적으로 서치 엔진에 의해 반환되는 결과를 등급화하기 위한 방법과 시스템에 대해 개시하고 있다. 그 과정에서 통계 분류의 형태를 포함하는 기술과 같은 머신 학습 기술을 사용해서 상기 파라미터를 결정한다.
다만, 상술된 종래기술의 구성을 이용한다고 할지라도 그 목적이 다르고, 문서를 등급화할 뿐 개인에 적합하도록 재구성의 단계를 포함하지 않기 때문에 리뷰 개인화라고 할 수 없다. 따라서, 개인별 취향 및 상황을 고려하여 리뷰를 개인화하는 방법의 연구 및 개발이 요구된다.
한국등록특허 제10-2227552호(2021.03.08) 한국등록특허 제10-1871827호(2018.06.21) 한국등록특허 제10-1532715호(2015.06.24)
본 발명이 이루고자 하는 기술적 과제는 리뷰를 제공받는 개개인에게 최적화된 리뷰 정보를 제공하는 서비스인 리뷰 개인화를 통하여 인터넷 및 스마트폰 앱 등의 플랫폼에서 보다 정확한 정보를 제공하기 위한 방법 및 시스템을 제공하는데 있다. 본 발명에 따른 개인화된 리뷰로 재가공하기 위해 주어진 리뷰 정보를 웹크롤링(Web Crawling)이나 웹스크래핑(Web Scraping) 및 구조화 단계를 통해 정보를 추출한 다음, 기계학습(Machine Learning; ML) 혹은 자연어 처리(Natural Language Processing; NLP)를 사용해서 수치화하고자 한다. 이후 수치화된 리뷰를 분포로 나타내고 최종적으로 개인에게 맞춤화된 결과를 반환하며, 개인화된 리뷰에 사용자의 만족도를 증가시키기 위해 사용자의 리뷰로부터 파라미터를 지속적으로 갱신한다.
일 측면에 있어서, 본 발명에서 제안하는 개인화된 리뷰를 제공하는 방법은 정보 추출부를 통해 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 단계, 학습부를 통해 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계 및 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계를 포함한다.
본 발명의 실시예에 따른 사용자별 개인화된 리뷰 제공부를 통해 사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신한다.
상기 학습부를 통해 기계학습 또는 자연어 처리를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계는 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 개인 사용자 평가 외에 또 다른 복수의 사용자들의 평가를 포함하는 리뷰들에 대하여 수치화된 리뷰 관련 정보를 다차원 특징공간 내 점들로 나타내고, 상기 다차원 특징공간 내 점들에 대하여 클러스터링(Clustering) 또는 기계학습을 수행한다.
상기 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계는 상기 데이터 분포를 파악하기 위해 다차원 가우시안 분포로 나타내고, 상기 사용자별 가중치 파라미터는 평가 대상에 대한 개인 사용자 외에 또 다른 복수의 사용자들의 수치에 따른 개인 사용자만의 경향성을 반영하고, 모든 리뷰를 반영한 데이터 분포와 비교하여 개인 사용자의 리뷰의 상대적인 위치를 나타내는 수치이고, 상기 개인 사용자 및 상기 복수의 사용자들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타낸다.
또 다른 일 측면에 있어서, 본 발명에서 제안하는 개인화된 리뷰를 제공하는 시스템은 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 정보 추출부, 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 학습부 및 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 사용자별 개인화된 리뷰 제공부를 포함한다.
본 발명의 실시예들에 따르면 리뷰를 제공받는 개개인에게 최적화된 리뷰 정보를 제공하는 서비스인 리뷰 개인화를 통하여 인터넷 및 스마트폰 앱 등의 플랫폼에서 보다 정확한 정보를 제공할 수 있다. 사용자에게 적절한 리뷰 정보를 이용하여 보다 신뢰도가 높은 개인화된 리뷰를 제공할 수 있고, 나아가 수집된 다양한 리뷰의 수치화된 변인들을 사용하여 다른 사용자와 함께 최적화된 추천 서비스를 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 시스템의 구성을 나타내는 도면이다.
도 3은 본 발명의 일 실시예에 따른 사용자별 가중치 파라미터의 예시를 나타내는 도면이다.
도 4는 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 다양한 예시를 설명하기 위한 도면이다.
본 발명은 인터넷 및 스마트폰 앱 등에서 제공되는 리뷰를 개인화하기 위한 방법 및 시스템에 대한 것이다. 본 발명에 따른 방법은 개인별 특성을 고려하여 사용자 전체에 공통으로 제공되는 리뷰를 개인화된 리뷰로 표시하는 것을 목적으로, 주어진 텍스트 정보를 이용하여 웹크롤링(Web Crawling)이나 웹스크래핑(Web Scraping) 및 구조화 단계를 거쳐 정보를 추출하는 단계, 그리고 추출된 정보를 기반으로 개인화된 리뷰를 생성하는 단계를 포함한다. 예를 들어, 상기 정보는 통계 분류의 형태를 포함하는 기술과 같은, 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 사용하여 결정할 수 있다. 보다 유의미한 정보를 전달하는 것을 목표로 사용자에게 보다 최적화된 정보를 제공하고, 특히 재가공된 리뷰에 대한 만족도를 향상시키기 위해 관련 파라미터를 지속적으로 갱신한다. 이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 방법을 설명하기 위한 흐름도이다.
제안하는 사용자별 개인화된 리뷰를 제공하는 방법은 정보 추출부를 통해 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 단계(110), 학습부를 통해 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계(120), 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계(130) 및 상기 사용자별 개인화된 리뷰 제공부를 통해 사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신하는 단계(140)를 포함한다.
단계(110)에서, 정보 추출부를 통해 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출한다.
본 발명의 실시예에 따른 웹크롤링이란 조직적이고 자동화된 방법으로 전 세계적인 정보공간인 월드 와이드 웹(World Wide Web; WWW)을 탐색하여 유용한 데이터를 추출해내는 작업이다. 구글과 같은 검색엔진 등에서 주로 사용하며 특정 형태의 정보를 수집하는 데도 사용한다.
본 발명의 실시예에 따른 웹스크래핑은 웹페이지(Webpage)로부터 유용한 데이터를 추출해오는 작업이다. 웹크롤링과 달리 여러 페이지가 아니라 하나의 웹페이지가 대상이라는 점에서 차이가 있다.
단계(120)에서, 학습부를 통해 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화한다.
이때, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 개인 사용자 평가 외에 또 다른 복수의 사용자들의 평가를 포함하는 리뷰들에 대하여 수치화된 리뷰 관련 정보를 다차원 특징공간 내 점들로 이해할 수 있다. 상기 다차원 특징공간 내 점들에 대하여 클러스터링(Clustering) 또는 기계학습을 통한 회귀분석(regression analysis)등 여러 연산을 적용할 수 있다.
본 발명의 실시예에 따른 기계학습이란 인공지능의 한 분야로, 명시적인 프로그래밍 없이 학습하여 성능을 개선하는 컴퓨터 알고리즘과 기술을 개발하는 연구분야다. 크게 분류(Classification)와 회귀(Regression)로 그 목적을 나눌 수 있는데, 결국 주목적은 예측(Prediction)이다. 본 발명의 실시예에 따른 기계학습을 통하여 리뷰에 대한 올바른 가중치를 예측할 수 있다.
본 발명의 실시예에 따른 자연어 처리는 컴퓨터와 인간이 의사소통을 위해 사용하는 자연어 사이의 상호작용을 연구하는 인공지능의 한 분야다. 음성인식, 번역 등을 포함하여 매우 넓은 범위를 포괄한다. 본 발명의 실시예에 따른 자연어 처리는 텍스트 데이터를 수치화하는 단계에 적용할 수 있다.
단계(130)에서, 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공한다.
먼저, 수치화된 리뷰 관련 정보가 개인 사용자 본인의 것인지 여부를 판단한다(131). 개인 사용자 본인의 것이 아닌 경우, 데이터 분포를 파악하기 위해 대표 값과 분포를 파악하기 쉬운 다차원 가우시안 분포로 나타낸다(132).
반면에, 개인 사용자 본인의 것인 경우, 사용자별 가중치 파라미터로 나타낸다(133). 이후, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공한다(134).
본 발명의 실시예에 따른 사용자별 가중치 파라미터는 평가 대상에 대한 개인 사용자 외에 또 다른 복수의 사용자들의 수치에 따른 개인 사용자만의 경향성을 반영한다. 이러한 사용자별 가중치 파라미터는 모든 리뷰를 반영한 글로벌 데이터 분포와 비교하여 개인 사용자의 리뷰의 상대적인 위치를 나타내는 수치이다.
이러한 사용자별 가중치 파라미터에 대해 기계학습(Machine Learning; ML)으로 학습의 과정을 거치고 자연어 처리(Natural Language Processing; NLP)를 통해 텍스트로 구성된 리뷰를 수치화한다.
본 발명의 실시예에 따르면, 개인 사용자 및 상기 복수의 사용자들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타낼 수 있다. 또한, 평가 대상들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타낼 수도 있다.
단계(140)에서, 사용자별 개인화된 리뷰 제공부를 통해 사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신한다.
기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 학습의 과정은 본 발명의 실시예에 따른 특정 평가대상에 대하여 예측한 사용자의 만족도와 실제 사용자가 남긴 리뷰로 계산한 만족도를 비교하여, 사용자의 만족도를 정확하게 예측하는 것을 목표로 반복하여 학습할 수 있다.
다양한 내부 및 외부 변인들에 의해 결정되는 파라미터에 대해 외부 변인에 따라 추천하는 기능을 수행할 수도 있다.
리뷰를 제공받는 사용자에게 보다 신뢰성 있는 리뷰를 제공하기 위해 본 발명에서는 텍스트로 이루어진 리뷰를 기계학습 또는 자연어 처리를 이용해서 수치화 하고 수치화된 데이터의 분포를 통해 타인과 사용자의 리뷰와 비교하여 최종적으로 사용자에게 최적화된 리뷰 정보를 제공하는 방식을 제안한다. 바람직하게, 기계학습을 사용할 경우 개인화된 리뷰에 대하여 사용자의 만족도를 증가시키기 위해 사용자의 새로운 리뷰를 반영하여 파라미터를 갱신하는 과정을 반복한다. 본 아이디어는 또한 기존의 리뷰 데이터를 웹크롤링(Web crawling)이나 웹스크래핑(Web scraping)하는 방법을 포함하기 때문에 추가적인 데이터를 필요로 하지 않고도 최적화된 리뷰를 제공할 수 있다.
도 2는 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 시스템의 구성을 나타내는 도면이다.
제안하는 사용자별 개인화된 리뷰를 제공하는 시스템은 정보 추출부(210), 학습부(220) 및 사용자별 개인화된 리뷰 제공부(230)를 포함한다.
본 발명의 실시예에 따른 정보 추출부(210)는 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출한다.
본 발명의 실시예에 따른 학습부(220)는 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화한다.
본 발명의 실시예에 따른 학습부(220)는 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 개인 사용자 평가 외에 또 다른 복수의 사용자들의 평가를 포함하는 리뷰들에 대하여 수치화된 리뷰 관련 정보를 다차원 특징공간 내 점들로 이해할 수 있다. 상기 다차원 특징공간 내 점들에 대하여 클러스터링(Clustering) 또는 기계학습을 통한 회귀분석(regression analysis)등 여러 연산을 적용할 수 있다.
본 발명의 실시예에 따른 제공부(230)는 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공한다.
본 발명의 실시예에 따른 제공부(230)는 데이터 분포를 파악하기 위해 대표 값과 분포를 파악하기 쉬운 다차원 가우시안 분포로 나타낸다.
본 발명의 실시예에 따른 사용자별 가중치 파라미터는 평가 대상에 대한 개인 사용자 외에 또 다른 복수의 사용자들의 수치에 따른 개인 사용자만의 경향성을 반영한다. 이러한 사용자별 가중치 파라미터는 모든 리뷰를 반영한 글로벌 데이터 분포와 비교하여 개인 사용자의 리뷰의 상대적인 위치를 나타내는 수치이다.
이러한 사용자별 가중치 파라미터에 대해 기계학습(Machine Learning; ML)으로 학습의 과정을 거치고 자연어 처리(Natural Language Processing; NLP)를 통해 텍스트로 구성된 리뷰를 수치화한다.
본 발명의 실시예에 따르면, 개인 사용자 및 상기 복수의 사용자들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타낼 수 있다. 또한, 평가 대상들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타낼 수도 있다.
본 발명의 실시예에 따른 제공부(230)는 사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신한다.
기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 학습의 과정은 본 발명의 실시예에 따른 특정 평가대상에 대하여 예측한 사용자의 만족도와 실제 사용자가 남긴 리뷰로 계산한 만족도를 비교하여, 사용자의 만족도를 정확하게 예측하는 것을 목표로 반복하여 학습할 수 있다.
다양한 내부 및 외부 변인들에 의해 결정되는 파라미터에 대해 외부 변인에 따라 추천하는 기능을 수행할 수도 있다.
도 3은 본 발명의 일 실시예에 따른 사용자별 가중치 파라미터의 예시를 나타내는 도면이다.
리뷰는 평가자의 주관적인 생각이기에 평가자들의 리뷰는 모두에게 정확한 정보라고 할 수 없다. 하지만 아직까지 인터넷 및 스마트폰 앱 등에서 제공되는 리뷰는 그러한 고려가 반영되지 않으며, 그에 따라 여러 리뷰가 존재함에도 사용자는 적합한 정보를 얻지 못하는 경우도 존재한다.
따라서, 본 발명에서는 리뷰를 제공받는 개개인에게 최적화된 리뷰 정보를 제공하는 서비스인 리뷰 개인화를 통하여 인터넷 및 스마트폰 앱 등의 플랫폼에서 보다 정확한 정보를 제공하고자 한다.
본 발명의 실시예에 따른 개인화된 리뷰로 재가공하기 위해 주어진 리뷰 정보를 웹크롤링(Web Crawling)이나 웹스크래핑(Web Scraping)및 구조화 단계를 통해 정보를 추출한 다음, 기계학습 또는 자연어 처리를 이용해서 수치화할 수 있다. 이후, 수치화된 리뷰를 분포로 나타내고, 최종적으로 개인에게 맞춤화된 결과를 반환한다.
도 3은 하나의 평가 대상에 대한 그래프를 나타낸다. 리뷰의 수치화는 다차원 공간에서의 분포로 표시 가능하며 해당 그래프는 그 중 한 축에 대한 사용자별 가중치를 나타낸 것이다. 축이 N개라면 수치화된 리뷰는 N차원 공간의 분포로 표현할 수 있으며 이러한 경우 N개의 가중치 집합을 사용할 수 있다.
도 4는 본 발명의 일 실시예에 따른 사용자별 개인화된 리뷰를 제공하는 다양한 예시를 설명하기 위한 도면이다.
본 발명의 실시예에 따르면, 사용자에게 적절한 리뷰 정보를 이용하여 보다 신뢰도가 높은 개인화된 리뷰를 제공할 수 있다. 나아가 수집된 다양한 리뷰의 수치화된 변인들을 사용하여 다른 사용자와 함께 최적화된 추천 서비스를 제공받을 수 있다.
도 4에 도시된 실시예는 특히 음식 리뷰의 개인화에 대한 것이며 본 발명은 이 외 다양한 경우에 적용 가능하고, 여러 가지 상이한 형태로 구현될 수 있으며 여기서 설명하는 실시예에 한정되지 않는다.
도 4(a)를 참조하면, 개인 사용자에 대한 미식 프로필을 표시한다. 사용자에 대하여 미식 정보를 분석한 결과를 맛의 종류에 따라 표시한다. 이때, 정보는 함축적으로 표현할 수 있다.
도 4(b)는 특정 매장의 특정 음식에 대해 분석된 리뷰 프로필을 표시한다.
특정 매장의 특정 음식에 대한 맛의 종류에 따라 개인 사용자에게 최적화된 맛을 추천할 수 있다.
도 4(c)는 음식 리뷰의 개인화에 있어서 환경정보(예를 들어, 날씨)를 반영한 추천 메뉴를 표시한다.
이와 같이 리뷰를 제공받는 개개인에게 최적화된 리뷰 정보를 제공하는 서비스인 리뷰 개인화를 통하여 인터넷 및 스마트폰 앱 등의 플랫폼에서 보다 정확한 정보를 제공할 수 있다. 사용자에게 적절한 리뷰 정보를 이용하여 보다 신뢰도가 높은 개인화된 리뷰를 제공할 수 있고, 나아가 수집된 다양한 리뷰의 수치화된 변인들을 사용하여 다른 사용자와 함께 최적화된 추천 서비스를 제공할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다.  또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.  이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다.  예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다.  또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.  소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다.  소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.  상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.  상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.  컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.  프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (8)

  1. 정보 추출부를 통해 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 단계;
    학습부를 통해 기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계; 및
    사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계
    를 포함하는 리뷰 제공 방법.
  2. 제1항에 있어서,
    상기 사용자별 개인화된 리뷰 제공부를 통해 사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신하는 단계
    를 더 포함하는 리뷰 제공 방법.
  3. 제1항에 있어서,
    상기 학습부를 통해 기계학습 또는 자연어 처리를 이용하여 추출된 리뷰 관련 정보를 수치화하는 단계는,
    사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 개인 사용자 평가 외에 또 다른 복수의 사용자들의 평가를 포함하는 리뷰들에 대하여 수치화된 리뷰 관련 정보를 다차원 특징공간 내 점들로 나타내고, 상기 다차원 특징공간 내 점들에 대하여 클러스터링(Clustering) 또는 기계학습을 수행하는
    리뷰 제공 방법.
  4. 제1항에 있어서,
    상기 사용자별 개인화된 리뷰 제공부를 통해 상기 수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 단계는,
    상기 데이터 분포를 파악하기 위해 다차원 가우시안 분포로 나타내고,
    상기 사용자별 가중치 파라미터는 평가 대상에 대한 개인 사용자 외에 또 다른 복수의 사용자들의 수치에 따른 개인 사용자만의 경향성을 반영하고, 모든 리뷰를 반영한 데이터 분포와 비교하여 개인 사용자의 리뷰의 상대적인 위치를 나타내는 수치이고,
    상기 개인 사용자 및 상기 복수의 사용자들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타내는
    리뷰 제공 방법.
  5. 사용자가 평가하는 하나 이상의 평가 대상에 대해 복수의 평가 정보를 반영한 리뷰를 수집하고, 사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 에 대해 웹크롤링(Web Crawling) 또는 웹스크래핑(Web Scraping)을 이용하여 리뷰 관련 정보를 추출하는 정보 추출부;
    기계학습(Machine Learning; ML) 또는 자연어 처리(Natural Language Processing; NLP)를 이용하여 추출된 리뷰 관련 정보를 수치화하는 학습부; 및
    수치화된 리뷰 관련 정보를 사용자별 가중치 파라미터와 데이터 분포로서 나타내고, 사용자별 가중치 파라미터 및 데이터 분포를 이용하여 사용자별 개인화된 리뷰를 제공하는 사용자별 개인화된 리뷰 제공부
    를 포함하는 리뷰 제공 시스템.
  6. 제5항에 있어서,
    상기 사용자별 개인화된 리뷰 제공부는
    사용자별 개인화된 리뷰에 대한 사용자의 만족도를 증가시키기 위해 사용자별 가중치 파라미터 및 데이터 분포를 반복적으로 갱신하는
    리뷰 제공 시스템.
  7. 제5항에 있어서,
    상기 학습부는,
    사용자별 개인화된 리뷰로 재가공하기 위해 수집된 리뷰의 개인 사용자 평가 외에 또 다른 복수의 사용자들의 평가를 포함하는 리뷰들에 대하여 수치화된 리뷰 관련 정보를 다차원 특징공간 내 점들로 나타내고, 상기 다차원 특징공간 내 점들에 대하여 클러스터링(Clustering) 또는 기계학습을 수행하는
    리뷰 제공 시스템.
  8. 제5항에 있어서,
    상기 사용자별 개인화된 리뷰 제공부는,
    상기 데이터 분포를 파악하기 위해 다차원 가우시안 분포로 나타내고,
    상기 사용자별 가중치 파라미터는 평가 대상에 대한 개인 사용자 외에 또 다른 복수의 사용자들의 수치에 따른 개인 사용자만의 경향성을 반영하고, 모든 리뷰를 반영한 데이터 분포와 비교하여 개인 사용자의 리뷰의 상대적인 위치를 나타내는 수치이고,
    상기 개인 사용자 및 상기 복수의 사용자들을 미리 정해진 특정 부류로 군집화하여 군집별 경향성을 나타내는
    리뷰 제공 시스템.
KR1020220048092A 2022-04-19 2022-04-19 개인화된 리뷰를 제공하는 방법 및 시스템 KR20230148995A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220048092A KR20230148995A (ko) 2022-04-19 2022-04-19 개인화된 리뷰를 제공하는 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220048092A KR20230148995A (ko) 2022-04-19 2022-04-19 개인화된 리뷰를 제공하는 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR20230148995A true KR20230148995A (ko) 2023-10-26

Family

ID=88509125

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220048092A KR20230148995A (ko) 2022-04-19 2022-04-19 개인화된 리뷰를 제공하는 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR20230148995A (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101532715B1 (ko) 2005-03-18 2015-07-02 써치 엔진 테크놀로지스, 엘엘씨 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진
KR101871827B1 (ko) 2017-02-07 2018-06-28 (주)망고플레이트 콘텐츠 우선순위 개인화 장치, 방법 및 프로그램
KR102227552B1 (ko) 2020-06-08 2021-03-15 주식회사 그로우키친 상황인지 알고리즘 기반 리뷰 카테고리를 이용한 음식점 노출 개인화 서비스 제공 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101532715B1 (ko) 2005-03-18 2015-07-02 써치 엔진 테크놀로지스, 엘엘씨 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진
KR101871827B1 (ko) 2017-02-07 2018-06-28 (주)망고플레이트 콘텐츠 우선순위 개인화 장치, 방법 및 프로그램
KR102227552B1 (ko) 2020-06-08 2021-03-15 주식회사 그로우키친 상황인지 알고리즘 기반 리뷰 카테고리를 이용한 음식점 노출 개인화 서비스 제공 시스템

Similar Documents

Publication Publication Date Title
KR101778679B1 (ko) 딥러닝을 이용하여 텍스트 단어 및 기호 시퀀스를 값으로 하는 복수 개의 인자들로 표현된 데이터를 자동으로 분류하는 방법 및 시스템
CN110659742B (zh) 获取用户行为序列的序列表示向量的方法和装置
CN107992531A (zh) 基于深度学习的新闻个性化智能推荐方法与***
US11550856B2 (en) Artificial intelligence for product data extraction
US20020049685A1 (en) Prediction analysis apparatus and program storage medium therefor
CN110110233B (zh) 信息处理方法、装置、介质和计算设备
CN111737586B (zh) 信息推荐方法、装置、设备及计算机可读存储介质
CN112580346A (zh) 事件抽取方法、装置、计算机设备和存储介质
CN114077661A (zh) 信息处理装置、信息处理方法和计算机可读介质
AL-Bakri et al. Multi label restaurant classification using support vector machine
WO2022271528A1 (en) Explainable artificial intelligence in computing environment
KR102546328B1 (ko) 온라인 마케팅을 위한 콘텐츠 정보 모니터링 및 콘텐츠 기획 자동화 솔루션 제공 방법, 장치 및 시스템
Sujatha et al. A new efficient SIF-based FCIL (SIF–FCIL) mining algorithm in predicting the crime locations
KR20230148995A (ko) 개인화된 리뷰를 제공하는 방법 및 시스템
KR102284440B1 (ko) 딥러닝 모델 거래중개서버에 의해서 수행되는 딥러닝 모델 거래를 중개하는 방법
CN111782898B (zh) 数据源搜索方法、装置和电子设备
CN113961811A (zh) 基于事件图谱的话术推荐方法、装置、设备及介质
CN115129863A (zh) 意图识别方法、装置、设备、存储介质和计算机程序产品
CN114065763A (zh) 一种基于事件抽取的舆情分析方法、装置及相关组件
Uzun et al. Automatically discovering relevant images from web pages
JP2020061147A (ja) Cnn基盤イメージ検索方法および装置
KR20210023453A (ko) 리뷰 광고 매칭 장치 및 방법
CN116453702B (zh) 孤独症行为特征集的数据处理方法、设备、***及介质
KR102675644B1 (ko) 딥러닝 기반 사용자 맞춤형 수강 과목 추천 시스템 및 방법
KR102399833B1 (ko) 인공 신경망 기반의 로그 라인을 이용한 시놉시스 제작 서비스 제공 장치 및 그 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal