KR101088710B1 - 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체 - Google Patents

온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체 Download PDF

Info

Publication number
KR101088710B1
KR101088710B1 KR1020090034250A KR20090034250A KR101088710B1 KR 101088710 B1 KR101088710 B1 KR 101088710B1 KR 1020090034250 A KR1020090034250 A KR 1020090034250A KR 20090034250 A KR20090034250 A KR 20090034250A KR 101088710 B1 KR101088710 B1 KR 101088710B1
Authority
KR
South Korea
Prior art keywords
online community
score
users
post
user
Prior art date
Application number
KR1020090034250A
Other languages
English (en)
Other versions
KR20100115600A (ko
Inventor
신효섭
Original Assignee
건국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 건국대학교 산학협력단 filed Critical 건국대학교 산학협력단
Priority to KR1020090034250A priority Critical patent/KR101088710B1/ko
Priority to PCT/KR2010/002478 priority patent/WO2010123264A2/en
Publication of KR20100115600A publication Critical patent/KR20100115600A/ko
Application granted granted Critical
Publication of KR101088710B1 publication Critical patent/KR101088710B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

댓글, 추천, 링크 등 온라인 커뮤니티 사용자 간 상호작용을 수치화하여 정의한 온라인 커뮤니티 사용자의 전문성 또는 대중성 점수와, 검색어와 온라인 커뮤니티 포스트 간 의미 유사성 점수를 이용하여 특화된 결과를 제공하는 온라인 커뮤니티 포스트 검색 기술이 개시된다. 본 발명의 일 측면은 복수의 온라인 커뮤니티 사용자에 관한 제 1 정보 및 상기 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 관한 제 2 정보를 입력 받고, 상기 온라인 커뮤니티 사용자 중 특정 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 대하여 상기 온라인 커뮤니티 사용자 중 상기 특정 온라인 커뮤니티 사용자와 상이한 온라인 커뮤니티 사용자가 형성한 상호작용에 관한 제 3 정보를 상기 온라인 커뮤니티 사용자 각각에 대하여 획득하고, 상기 상이한 온라인 커뮤니티 사용자의 전문성에 관한 점수 및 상기 제 3 정보를 이용하여 상기 특정 온라인 커뮤니티 사용자의 전문성에 관한 제 1 점수를 상기 온라인 커뮤니티 사용자 각각에 대하여 산출하고, 입력 받은 검색어 및 상기 온라인 커뮤니티 포스트 간의 의미 유사성에 관한 제 2 점수를 산출하며, 상기 제 1 점수 및 상기 제 2 점수를 이용하여 상기 온라인 커뮤니티 사용자 또는 상기 온라인 커뮤니티 포스트를 검색하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법을 제공한다. 본 발명에 의하면, 간단한 검색어만으로도 온라인 커뮤니티 포스트 검색 사용자의 다양한 의도를 반영한 검색 결과를 제공할 수 있게 되는 효과가 있다.
온라인 커뮤니티, 포스트, 게시물, 블로거, 블로그, 상호작용, 댓글, 검색, 랭킹, 사회적 연결망, 데이터마이닝

Description

온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체{Method and Apparatus for Online Community Post Searching Based on Interactions between Online Community User and Computer Readable Recording Medium Storing Program thereof}
본 발명은 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다. 구체적으로 본 발명은, 댓글, 추천, 링크 등 온라인 커뮤니티 사용자 간 상호작용을 수치화하여 정의한 온라인 커뮤니티 사용자의 전문성 점수 또는 대중성 점수와, 검색어 및 온라인 커뮤니티 포스트 간의 의미 유사성 점수를 이용하여 사용자의 검색 의도에 특화된 결과를 제공하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 기술에 관한 것이다.
최근 블로그(blog)를 비롯하여 카페(cafe), 게시판(bulletin) 형태의 포럼(forum) 등 온라인(online)에서 다양한 형태로 표현되는 온라인 커뮤니티 포스 트(online community post)가 인터넷을 이용한 사회적 미디어(social media)로서 급속도로 확산되고 있다. 사진, 음악, 과학, 디지털 장비 등 특정한 취미나 학술적 주제에 관한 온라인 커뮤니티 웹 사이트는 인기가 많다. 이러한 온라인 커뮤니티 웹 사이트 중 일부는 수만 명의 등록 사용자와 수백만 개의 다양화된 사용자 제작 컨텐츠(User-Created Contents, UCC)를 보유하고 있다.
블로그는 이들 온라인 커뮤니티 포스트 중 대표적인 형태의 하나로, 통계 자료에 의하면 국내의 블로그 이용자 수는 수백만 명 내지 천만 명에 이른다고 알려져 있다. 인터넷과 더불어 사는 현대인의 삶에 있어서 블로그는 사회, 경제, 문화, 정치 등 인간사의 모든 측면에 닿아 있으며, 그 영향력 또한 증가하고 있는 추세이다. 블로그를 이용하는 사용자, 즉 블로거(blogger)들이 공유하는 사이버 공간을 블로그 공간(blogosphere)이라고 한다. 블로그 공간은 하이퍼링크(hyperlink)를 통해서 상대방과 연결관계를 유지한다는 점에서 일반적인 웹(web)과 공통점이 있다. 하지만, 블로그는 개인 지향적인 공간을 제공한다는 점에서 일반적인 웹과 다르다. 개인의 블로그는 글, 그림 등으로 꾸며진 포스트(post)라는 포스트를 통하여 정치, 경제, 문화, 예술, 스포츠, 취미 등 개인의 관심사를 자유롭게 외부에 표현한다.
블로그는 일반적인 웹 페이지(web page)들보다 더욱 더 정형화된 형식을 가지고 있고, 또한 내용적인 측면에서도 개인적인 관심사에 집중되어 있다. 이러한 점은 검색 엔진에게 블로그 만을 위한 더욱 정교하고 강력한 검색 기능을 제공할 가능성을 열어두고 있다. 실제로 최근 국내외에서 블로그 검색에 대한 많은 기술 개발이 이루어지고 있고, 연구 논문들 또한 많이 발표되고 있다.
현재 서비스되고 있는 국내외 블로그 사이트는 크게 세 가지 유형의 정보에 기반한 검색 결과를 제공하고 있다. 첫째, 블로그 포스트의 단순 통계 수치에 기반한 검색 순위 결정 기능이 있다. 이러한 예로는 댓글순, 트랙백(track back) 베스트, 주목도순, 공감순, 추천글, 인기글, 별점순, 눈길끄는 블로그, 화제의 Top 블로거 등이 있다. 둘째, 블로그 포스트가 작성된 시간을 기준으로 검색순위가 결정되는 검색 기능이 있다. 이러한 예로는 새글, Today’s Hot Blogs, Today’s Hot Posts, 등록순, 실시간 인기글, 실시간 새글, 최신순, 금주의 인기 Top 블로거 등이 있다. 셋째, 태그, 키워드, 정확도 순 등 질의 키워드(query keyword)와 블로그 포스트의 키워드 간의 언어적인 매칭(semantic matching)(TF*IDF)을 기준으로 검색 순위가 결정되는 검색 기능이 있다. 요컨대, 종래 기술에 의한 검색 순위 결정은 단순 통계 수치, 작성 시간, 언어적 매칭 등 3가지 요소에 기반하여 이루어져 왔다고 할 수 있다.
한편, 블로그 검색과 관련하여 발표되고 있는 연구 논문들은 영향력 있는 블로거 발견 기술과 블로그 랭킹 기술 등 크게 두 가지 주제로 분류될 수 있다. 이들 각각에 대한 종래의 연구를 간략히 소개하면 아래와 같다.
첫째, 주목할 만 한 블로거를 발견하는 기술에 대한 연구가 있다. Nitin Agarwal(2008) 등의 논문은 블로그 공간에서 영향력 있는 블로거를 찾는 문제를 다루고 있다. 이 논문은 블로거들의 사회적인 제스처(gesture)를 측정하기 위한 4가지 통계적 특징을 제안하였다. 인지도(recognition) 특징으로서 인용된 회수, 활동 유발(activity generation) 특징으로서 커멘트(comment)의 수, 독창성 특징으로서 타 블로그 인용 횟수, 유창함(eloquence) 특징으로서 포스트의 길이 등이 그것이다. 블로그 포스트의 영향력 점수를 계산하기 위하여 각 특징 값의 가중치 합을 계산하고, 각 블로거는 자신의 블로그 포스트 점수 중 가장 높은 값을 자신의 인지도 점수로 계산하게 된다. Bi Chen 등의 논문(2007)에서는 시간적인 차원과 사회적 차원 상에서 블로거의 행동 패턴을 분석함으로써 미래의 토픽을 예측하는 방법을 제안하였다. Xiaodan Song 등의 논문(2007)에서는 영향력 순위(Influence Rank)라는 개념을 도입하여 블로그 공간에서 영향력 있는 오피니언 리더(opinion leader)를 발견하는 기술을 제안하였다. Craig Macdonald 등의 논문(2008)은 자신이 관심있는 특정 토픽에 대한 전문가를 찾기 위해 검색의 단위를 블로그 전체 혹은 블로그 한 포스트로 구분하여 검색하는 문제를 다루고 있다. Akshay Java 등의 논문(2006)에서는 영향력 모델(influence model)을 제안하여 영향력있는 블로거를 찾는 문제를 제안하였다. 한편, P. Jurczyk 등의 논문(2007)에서는 네이버 지식 검색과 같은 질문/답변(Question/Answering) 형태의 시스템에서 권위 있는 사용자를 발견하는 문제를 제안하고 있다.
둘째, 블로그를 랭킹하는 기술에 대한 연구가 있다. A. Kritikopoulos 등의 논문(2006)에서는 암시적 하이퍼링크를 이용한 블로그 랭킹 기술을 제안하였다. 예를 들어, 동일한 토픽을 가진 두 개의 블로그 포스트는 암시적 하이퍼링크로 연결되어 있다고 가정한다. 이러한 암시적 하이퍼링크는 블로그 포스트 간에 희박하게(sparse) 존재하는 링크 관계를 보완할 수 있게 된다. 암시적 하이퍼링크는 동 일 토픽 이외에도 동일 소속의 블로거, 커멘터(commenter)에도 적용하였다. 해당 논문은 또한 L. Page 등의 논문(2008)에 개시된 PageRank 스타일의 이러한 계수들을 사용한 블로그 랭킹 알고리즘을 제안하였다. Xiaochuan Ni 등의 논문(2007)에서는 유용한 정보나 영향력 있는 정보를 담고 있는 블로그 포스트에 대한 검색 기술을 제안하였다. Kritsada Sriphaew 등의 논문(2008)은 블로그의 토픽에 관련된 특성을 고려하여 중요한 블로그(cool blog)를 검색하는 기술을 제안하였다. 예를 들어 중요한 블로그는 명확한 토픽을 가지고 있고, 충분한 개수의 포스트를 보유하고 있으며, 토픽 일관성이 존재한다는 점을 가정하고, 확률적 모델을 제시하였다.
이상을 종합해 볼 때, 기존의 블로거 및 블로그 포스트 검색 기술은 한가지 측면의 가치, 즉, 영향력 혹은 정보력 등에 초점이 맞추어져 있다는 것을 알 수 있다. 가장 영향력 내지 정보력 있는 블로거 또는 블로그 포스트는 무엇인가에 관한 문제 해결에 집중하고 있는 것이다. 이러한 종래의 블로그 포스트 및 블로거 검색 기술의 문제점은, 다른 형태의 온라인 커뮤니티 포스트 및 사용자 검색 기술에 있어서도 마찬가지로 문제점으로 인식되어 왔다.
하지만 블로그 등의 온라인 커뮤니티 포스트를 검색하는 사용자들의 검색 의도, 유행, 경향 등은 매우 다양하다. 여러 명의 온라인 커뮤니티 포스트 검색 사용자가 동일한 검색어를 입력한다고 해서 이들의 검색 목적까지 모두 동일하다고 볼 수는 없다. 이러한 관점에서 한 가지 척도에 의한 랭킹만을 적용하고 있는 종래 기술은 온라인 커뮤니티 포스트 검색 사용자들의 다양한 검색 요구에 부응해 왔다고 보기 어렵다.
본 발명은 상기 문제점을 해결하기 위한 것으로, 사회적 연결망(social network) 분석 및 데이터 마이닝(data mining) 기술을 이용하여 검색 사용자의 다양한 의도를 수용할 수 있는 온라인 커뮤니티 포스트 검색 기술을 개발하는 것을 목적으로 한다.
또한, 전문성과 대중성 등의 트렌드 개념을 도입하여 간단한 검색어만으로도 사용자의 다양한 의도를 반영한 검색 결과를 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위하여 본 발명의 제 1 측면은, 복수의 온라인 커뮤니티 사용자에 관한 제 1 정보 및 상기 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 관한 제 2 정보를 입력 받고, 상기 온라인 커뮤니티 사용자 중 특정 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 대하여 상기 온라인 커뮤니티 사용자 중 상기 특정 온라인 커뮤니티 사용자와 상이한 온라인 커뮤니티 사용자가 형성한 상호작용에 관한 제 3 정보를 상기 온라인 커뮤니티 사용자 각각에 대하여 획득하고, 상기 상이한 온라인 커뮤니티 사용자의 전문성에 관한 점수 및 상기 제 3 정보를 이용하여 상기 특정 온라인 커뮤니티 사용자의 전문성에 관한 제 1 점수를 상기 온라인 커뮤니티 사용자 각각에 대하여 산출하고, 입력 받은 검색어 및 상기 온라인 커뮤니티 포스트 간의 의미 유사성에 관한 제 2 점수를 산출하며, 상기 제 1 점수 및 상기 제 2 점수를 이용하여 상기 온라인 커뮤니티 사용자 또는 상기 온라인 커뮤니티 포스트를 검색하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법을 제공한다.
또한, 상기 제 3 정보는 상기 상호작용의 횟수이며, 상기 제 1 점수를 산출하는 과정은, 상기 상이한 온라인 커뮤니티 사용자의 전문성에 관한 점수 및 상기 제 3 정보의 곱셈을 포함하는 제 1 연산을 상기 상이한 온라인 커뮤니티 사용자 각각에 대하여 수행하며, 상기 상이한 온라인 커뮤니티 사용자에 대한 상기 제 1 연산의 결과의 합산을 포함하는 제 2 연산을 수행하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법을 제공한다.
또한, 상기 제 1 점수를 산출하는 과정은 아래 수학식
Figure 112009023768177-pat00001
에 기반하여 이루어지고, 여기서 ER(u)는 상기 특정 온라인 커뮤니티 사용자 u의 상기 제 1 점수, ER(v)는 상기 상이한 온라인 커뮤니티 사용자 v의 상기 전문성에 관한 점수, Au는 상기 특정 온라인 커뮤니티 사용자 u가 작성한 온라인 커뮤니티 포스트의 집합,
Figure 112009023768177-pat00002
는 상기 Au에 속하는 온라인 커뮤니티 포스트에 대하여 상기 온라인 커뮤니티 사용자 중 상기 상이한 온라인 커뮤니티 사용자 v가 형성한 상호작용의 횟수,
Figure 112009023768177-pat00003
는 상기 상이한 온라인 커뮤니티 사용자 v가 형성한 모든 상호작용의 횟수, d는 최소 영향력을 나타내는 감쇄 인자(damping factor)인 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법을 제공한다.
또한, 상기 제 1 점수의 순서대로 상기 온라인 커뮤니티 사용자를 정렬하고, 상기 정렬된 순위가 중간 순위에 가까울수록 높은 값을 갖는 매핑 함수를 사용하여 상기 특정 온라인 커뮤니티 사용자의 대중성에 관한 제 3 점수를 상기 온라인 커뮤니티 사용자 각각에 대하여 산출하며, 상기 검색에는 상기 제 1 점수 또는 상기 제 3 점수 중 어느 하나 이상과 상기 제 2 점수가 이용되는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법을 제공한다.
또한, 상기 매핑 함수는 가우시안 분포 함수(Gaussian distribution function)를 포함하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법을 제공한다.
또한, 상기 가우시안 분포 함수는 아래 수학식
Figure 112009023768177-pat00004
와 같이 표현되고, 여기서 PR(u)는 상기 특정 온라인 커뮤니티 사용자 u의 상기 제 3 점수, x는 상기 특정 온라인 커뮤니티 사용자 u의 상기 정렬된 순위, σ는 상기 정렬된 순위의 표준 편차, μ는 상기 정렬된 순위의 중간 값인 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법을 제공한다.
또한, 상기 제 1 점수 또는 상기 제 3 점수 중 상기 검색에 이용할 점수에 대한 선택을 검색어 입력 이전에 사용자로부터 입력 받는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법을 제공한다.
또한, 상기 온라인 커뮤니티 포스트를 복수의 카테고리로 구분하고, 상기 상이한 온라인 커뮤니티 사용자의 전문성에 관한 점수 및 상기 특정 온라인 커뮤니티 사용자의 전문성에 관한 제 1 점수를 상기 카테고리에 따라 각각 별도로 산출하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법을 제공한다.
또한, 상기 상호작용은 댓글, 코멘트, 공감, 추천, 트랙백, 스크랩, 링크 중 어느 하나 이상을 포함하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법을 제공한다.
상기 목적을 달성하기 위하여 본 발명의 제 2 측면은, 상기 어느 하나의 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
상기 목적을 달성하기 위하여 본 발명의 제 3 측면은, 복수의 온라인 커뮤니티 사용자에 관한 제 1 정보 및 상기 온라인 커뮤니티 사용자의 전문성에 관한 제 1 점수를 저장하는 온라인 커뮤니티 사용자 정보 저장부와, 상기 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 관한 제 2 정보 및 상기 온라인 커뮤니티 사용자 중 특정 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 대하여 상기 온라인 커뮤니티 사용자 중 상기 특정 온라인 커뮤니티 사용자와 상이한 온라인 커뮤니티 사용자가 형성한 상호작용에 관한 제 3 정보를 저장하는 온라인 커뮤니티 포스트 저장부와, 상기 상이한 온라인 커뮤니티 사용자의 전문성에 관한 점수 및 상기 제 3 정보를 이용하여 상기 특정 온라인 커뮤니티 사용자의 전문성에 관한 제 1 점수를 상기 온라인 커뮤니티 사용자 각각에 대하여 산출하는 전문성 연산부와, 입력 받은 검색어 및 상기 온라인 커뮤니티 포스트 간의 의미 유 사성에 관한 제 2 점수를 산출하는 의미 유사성 연산부, 및 상기 제 1 점수 및 상기 제 2 점수를 이용하여 상기 온라인 커뮤니티 사용자 또는 상기 온라인 커뮤니티 포스트를 검색하는 검색부를 포함하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 장치를 제공한다.
또한, 상기 제 3 정보는 상기 상호작용의 횟수이며, 상기 전문성 연산부는, 상기 상이한 온라인 커뮤니티 사용자의 전문성에 관한 점수 및 상기 제 3 정보의 곱셈을 포함하는 제 1 연산을 상기 상이한 온라인 커뮤니티 사용자 각각에 대하여 수행하는 곱셈기, 및 상기 상이한 온라인 커뮤니티 사용자에 대한 상기 제 1 연산의 결과의 합산을 포함하는 제 2 연산을 수행하는 덧셈기를 포함하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 장치를 제공한다.
또한, 상기 제 1 점수의 순서대로 상기 온라인 커뮤니티 사용자를 정렬하고 상기 정렬된 순위가 중간 순위에 가까울수록 높은 값을 갖는 함수를 매핑하여 상기 특정 온라인 커뮤니티 사용자의 대중성에 관한 제 3 점수를 상기 온라인 커뮤니티 사용자 각각에 대하여 산출하는 대중성 연산부를 포함하고, 상기 검색부는 상기 제 1점수 또는 상기 제 3 점수 중 어느 하나 이상과 상기 제 2 점수를 이용하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 장치를 제공한다.
본 발명에 의하면, 간단한 검색어만으로도 온라인 커뮤니티 포스트 검색 사 용자의 다양한 의도를 반영한 검색 결과를 제공할 수 있게 되는 효과가 있다.
또한, 온라인 커뮤니티 사용자 간 상호작용에 기반하여 전문성 및 대중성이라는 트렌드를 정의하고 검색에 이용함으로써 온라인 커뮤니티 포스트 환경의 변화를 실시간으로 반영할 수 있게 되는 효과가 있다.
이하 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명한다. 하기에서 본 발명을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명은 사용자의 다양한 검색 의도, 유행, 경향 등을 나타내는 척도로서 트렌드(trend)라는 개념을 도입한다. 이러한 트렌드 기반 검색 기술의 내용은 전문성(expertise)과 대중성(popularity)이라는 실시예를 통하여 자세히 설명될 것이다.
예를 들어 영화에 관련된 블로그를 검색한다고 할 때, 사용자는 한가지 척도에 의해서 영화를 검색하지는 않는다. “가장 중요한 영화를 검색하라.”와 같은 검색은 무의미 하다. 그러나, 영화 검색에 있어서 대중성 및 전문성 등 트렌드를 가미한 예를 보자. 영화 분야 블로그 공간에서 검색 사용자가 동일한 장르의 영 화 관련 블로그를 검색한다고 할 때에도, 가장 대중적인 영화를 선호하는 검색 사용자가 있는가 하면, 어떤 검색 사용자는 전문성이나 예술성이 뛰어난 영화를 선호할 것이다. 이러한 검색 사용자의 경향이나 선호를 트렌드로 정의한다. 따라서 트렌드 개념을 검색 기술에 도입하면, 단순히 영화제목이나 배우의 이름이 매칭되는 블로그 포스트를 검색하는 종래 기술과 달리, “전문성이 뛰어난 작품을 검색하라”, 또는 “대중성이 있는 작품을 검색하라” 라는 식의 검색 요구를 처리할 수 있는 것이다. 이러한 트렌드에 기반한 블로그 검색은 단순한 조회수, 추천수 등 블로그 포스트 수의 통계 수치 비교를 통해서는 이루어질 수 없다.
도 1은 복수의 온라인 커뮤니티 사용자가 서로의 온라인 커뮤니티 포스트에 형성하는 상호작용을 도시한 것이다. 여기서는 온라인 커뮤니티 사용자 A, B, C 등 3명의 온라인 커뮤니티 사용자들이 서로의 온라인 커뮤니티 포스트에 대하여 수행하는 상호작용 관계를 본다.
온라인 커뮤니티 사용자 A의 온라인 커뮤니티 포스트(110)는 포스트 A1(111), 포스트 A2(112), 포스트 A3(113) 등 3개의 포스트를 게시하고 있다. 포스트 A1(111)에는 온라인 커뮤니티 사용자 B가 남긴 댓글(171)이 달려 있고, 포스트 A2(112)에는 온라인 커뮤니티 사용자 B가 남긴 공감(172) 메시지와 온라인 커뮤니티 사용자 C가 포스트 C1(151)에 작성한 링크(174)가 연결되어 있으며, 포스트 A3(113)에는 온라인 커뮤니티 사용자 C가 남긴 추천(175)이 존재한다. 온라인 커뮤니티 사용자 B의 온라인 커뮤니티 포스트(130)는 포스트 B1(131), 포스트 B2(132) 등 2개의 온라인 커뮤니티 포스트를 게시하고 있다. 포스트 B1(131)에는 온라인 커뮤니티 사용자 A가 남긴 코멘트(173)가 달려 있고, 포스트 B2(132)는 온라인 커뮤니티 사용자 C가 포스트 C2(152)로 스크랩(172)해 갔음을 알 수 있다. 온라인 커뮤니티 사용자 C의 온라인 커뮤니티 포스트(150)는 포스트 C1(151), 포스트 C2(152) 등 2개의 온라인 커뮤니티 포스트를 게시하고 있다. 포스트 C1(151)에는 온라인 커뮤니티 사용자 A의 포스트 A2(112)를 연결한 링크(174)가 달려 있고, 온라인 커뮤니티 사용자 B의 포스트 B2(132)를 스크랩(177)한 게시물인 포스트 C2(152)는 온라인 커뮤니티 사용자 A의 포스트 A3(113)과 트랙백(176)으로 연결되어 있음을 알 수 있다. 여기서의 댓글(171), 공감(172), 코멘트(173), 링크(174), 추천(175), 트랙백(176), 스크랩(177) 등은 제공되는 온라인 커뮤니티 서비스에 따라 명칭과 형태는 다르지만 복수의 온라인 커뮤니티 사용자 간의 상호작용에 관한 것으로 수치화 가능한 요소라는 점에서 공통된다. 이러한 온라인 커뮤니티 사용자 간 상호작용으로 예시된 것 외에도 다양한 형태가 있을 수 있다.
도 2는 본 발명에 의한 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법의 일 실시예의 각 단계를 도시한 흐름도이다.
먼저, 복수의 온라인 커뮤니티 사용자에 관한 제 1 정보 및 상기 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 관한 제 2 정보를 입력 받거나 저장한다(S210). 그리고, 상기 온라인 커뮤니티 사용자 중 특정 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 대하여 상기 온라인 커뮤니티 사용자 중 상기 특정 온라인 커뮤니티 사용자와 상이한 온라인 커뮤니티 사용자가 형성한 상호작용에 관한 제 3 정보를 상기 온라인 커뮤니티 사용자 각각에 대하여 획득하 거나 저장한다(S220). 그리고, 상기 상이한 온라인 커뮤니티 사용자의 전문성에 관한 점수 및 상기 제 3 정보를 이용하여 상기 특정 온라인 커뮤니티 사용자의 전문성에 관한 제 1 점수를 상기 온라인 커뮤니티 사용자 각각에 대하여 산출한다(S230). 그리고, 입력 받은 검색어 및 상기 온라인 커뮤니티 포스트 간의 의미 유사성에 관한 제 2 점수를 산출한다(S240). 마지막으로, 상기 제 1 점수 및 상기 제 2 점수를 이용하여 상기 온라인 커뮤니티 사용자 또는 상기 온라인 커뮤니티 포스트를 검색한다(S250).
실시예에 따라 온라인 커뮤니티 공간 내의 사용자들 간에 내재되어 있는 사회적 연결망을 그래프 형태로 모델링하고, 서로 연관성이 높은 온라인 커뮤니티 사용자를 서브 커뮤니티(sub community)로 분류하는 온라인 커뮤니티 사용자 클러스터링(online community user clustering)을 수행할 수 있다. 이러한 온라인 커뮤니티 사용자 클러스터링 결과로서 나타나는 서브 커뮤니티는 해당 분야에 대표성을 띄는 온라인 커뮤니티 사용자들로 구성된다. 서브 커뮤니티 안에서 각 온라인 커뮤니티 사용자에 대하여 온라인 커뮤니티 사용자의 트렌드 랭킹 값을 계산한다. 트렌드 랭킹은 전문성, 대중성 등에 관한 일종의 점수로, 사회적 연결망 분석과 데이터마이닝 기술을 통해서 이루어질 수 있다. 검색어 등의 형태로 사용자 질의가 주어지면, 사용자 질의와 온라인 커뮤니티 포스트 간의 의미 유사성 스코어(semantic similarity score)와 온라인 커뮤니티 포스트의 트렌드 스코어(trend score) 값을 조합한 점수를 통하여 최종적으로 온라인 커뮤니티 포스트를 랭킹하여 검색 등의 결과를 반환하게 된다. 온라인 커뮤니티 포스트의 트렌드 스코어는 그 포스트에 상호작용을 형성하거나 연관성 있는 온라인 커뮤니티 사용자들의 트렌드 랭킹 값을 통해서 획득된다. 이러한 기술은 블로그를 비롯한 모든 형태의 온라인 커뮤니티에 동일하게 적용될 수 있다.
이하에서는 사회적 연결망(social network) 분석의 개념을 사용하여 본 발명의 일 실시예를 설명한다. 사진, 음악, 영화 등의 분야에서 온라인 커뮤니티 사용자들이 생성하는 온라인 커뮤니티 포스트는 대중성(popularity)과 전문성(expertise)의 두 가지 상반되는 관점에서 랭크될 수 있다. 어떤 검색 사용자는 일반 사용자들이 많이 선호하는 대중적인 사진을 검색하기를 원하는 반면, 다른 사용자는 전문가 관점에서의 작품성 등 전문성이 뛰어난 사진을 선호할 것이다. 이러한 검색 사용자의 경향이나 선호를 상술한 바와 같이 트렌드(trend)로 정의할 수 있다.
이러한 전문성 트렌드에 대한 온라인 커뮤니티 사용자 랭킹의 기본 아이디어는 다음과 같다. 어떤 온라인 커뮤니티 포스트가 고급 내지 전문가 수준의 컨텐츠를 포함하고 있다면, 그 온라인 커뮤니티 포스트는 비전문가보다는 전문가들로부터 더 많은 반응을 얻어낼 것이다. 반대로, 어떤 포스트가 저급 내지 초보자 수준의 컨텐츠라면, 전문가 사용자들은 그 포스트에 대해서 아무런 반응을 보이지 않을 것이다.
이러한 추론으로부터 우리는 온라인 커뮤니티 사용자 간의 상호작용 내지 관계성에 기반하여 온라인 커뮤니티 사용자의 전문성 점수인 ER(Expertise Rank)을 정의할 수 있다. 어떤 온라인 커뮤니티 사용자 u의 ER 값은 u가 작성한 포스트에 대하여 댓글, 코멘트, 공감, 추천, 트랙백, 스크랩, 링크 등의 응답 내지 상호작용을 한 다른 모든 온라인 커뮤니티 사용자들 v의 ER 값에 의해서 영향을 받게 된다. 여기서는 상호작용의 다양한 형태 중 코멘트를 예로 들어 설명한다. 온라인 커뮤니티 사용자 u에 의해서 작성된 포스트의 집합을 |Au|, 온라인 커뮤니티 사용자 v에 의해서 쓰여진 커멘트 전체를
Figure 112009023768177-pat00005
, 그리고 온라인 커뮤니티 사용자 u가 쓴 Au에 속한 포스트들에 대하여 온라인 커뮤니티 사용자 v에 의해서 쓰여진 커멘트 집합을
Figure 112009023768177-pat00006
라 할 때, 온라인 커뮤니티 사용자 u의 전문성 랭크값 ER(u)는 아래 수학식 1과 같이 공식화할 수 있다.
Figure 112009023768177-pat00007
여기서, ER(u)는 특정 온라인 커뮤니티 사용자 u의 전문성 점수, ER(v)는 다른 온라인 커뮤니티 사용자 v의 전문성 점수, Au는 특정 온라인 커뮤니티 사용자 u가 작성한 온라인 커뮤니티 포스트의 집합,
Figure 112009023768177-pat00008
Au에 속하는 온라인 커뮤니티 포스트에 대하여 다른 온라인 커뮤니티 사용자 v가 형성한 상호작용의 횟수,
Figure 112009023768177-pat00009
는 상이한 온라인 커뮤니티 사용자 v가 형성한 모든 상호작용의 횟수, d는 최소 영향력을 나타내는 감쇄 인자(damping factor).
수학식 1은 본 발명의 일 실시예에 불과하며, 전문성 점수의 계산에 있어서 수학식 1의 다양한 변형이 가능하다. 본 실시예에서는 특정 온라인 커뮤니티 사용 자의 전문성 점수를 산출하기 위하여 다른 온라인 커뮤니티 사용자의 전문성 점수를 재귀적으로 이용하였으나, 온라인 커뮤니티 사용자 간 상호작용을 이용한 다른 다양한 방법이 이용될 수도 있다. 전문성 점수의 산출에는 온라인 커뮤니티 사용자의 활동성(activity), 인지도(reputation), 사회성(sociability) 등에 대한 고려가 추가될 수 있다.
도 3은 온라인 커뮤니티 사용자의 전문성 순위에 따라 전문성 점수를 정렬한 결과를 도시한 것이다. 이것은 상기 수학식 1에 의하여 도출된 전체 온라인 커뮤니티 사용자의 ER 분포에 해당한다. 가로 축과 세로 축 각각은 로그 스케일(log scale)로 그려졌다. 온라인 커뮤니티 사용자 전문성 순위 내지 온라인 커뮤니티 사용자 랭크의 숫자가 커질수록, 즉 전문성 순위가 떨어질수록 전문성 점수 내지 ER 값이 작아지는 관계가 있음을 확인할 수 있다. 온라인 커뮤니티 사용자 전문성 순위 10등 안쪽에서는 전문성 점수가 1000점 내외 또는 그 이상의 값을 가지나, 온라인 커뮤니티 사용자 전문성 순위가 1000등 이상이 되면 전문성 점수가 10점 미만으로 떨어진다는 연구 결과가 도시되어 있다.
도 4는 온라인 커뮤니티 사용자의 전문성 순위에 따라 전문성 점수를 정렬한 결과에 가우시안 분포 함수를 매핑하여 대중성 점수를 산출하는 과정을 도시한 것이다. 먼저 대중성 트렌드의 개념에 대하여 설명한 후 매핑(mapping) 과정을 설명할 것이다.
온라인 커뮤니티 사용자의 대중성은 전문성과 밀접한 관계가 있는 개념이나, 그와 상반되는 개념은 아니다. 전문성과 대중성이 동시에 높은 온라인 커뮤니 티 사용자, 또는 전문성과 대중성이 동시에 낮은 온라인 커뮤니티 사용자들이 다수 존재할 수 있기 때문이다. 대중성이 있다는 것은 고급 내지 전문가 사용자나, 저급 내지 초보자 사용자 보다는 전문성이 중간 정도인 일반 온라인 커뮤니티 사용자가 선호하는 온라인 커뮤니티 사용자라고 판단할 수 있다.
이런 측면에서 온라인 커뮤니티 사용자의 대중성 점수를 앞서 기술한 전문성 점수인 ER 값을 통하여 정의할 수 있다. ER 값 순으로 온라인 커뮤니티 사용자를 정렬하고, 각 온라인 커뮤니티 사용자를 가우시안 분포 함수(Gaussian distribution function)에 매핑하여 가중치를 적용함으로써 얻을 수 있는 것이다. 이러한 방식을 사용할 경우, 온라인 커뮤니티 사용자의 대중성 점수 PR(Popularity Rank)은 아래 수학식 2와 같은 공식에 의해서 계산될 수 있다.
Figure 112009023768177-pat00010
여기서 PR(u)는 특정 온라인 커뮤니티 사용자 u의 대중성 점수, x는 특정 온라인 커뮤니티 사용자 u의 전문성 순으로 정렬된 순위, σ는 전문성 순으로 정렬된 순위의 표준 편차, μ는 전문성 순으로 정렬된 순위의 중간 값.
수학식 2는 본 발명의 일 실시예에 불과하며, 대중성 점수의 계산에 있어서 수학식 2의 다양한 변형이 가능하다. 본 실시예에서는 특정 온라인 커뮤니티 사용자의 전문성 점수 순으로 정렬된 순위로부터 가우시안 분포 함수의 매핑을 통하여 대중성을 산출하였으나, 중간 수준의 전문성을 가지는 온라인 커뮤니티 사용자에게 높은 대중성 점수를 부여하는 다른 다양한 방법이 이용될 수도 있다.
도 4를 참조하면, 온라인 커뮤니티 사용자의 전문성 순위에 따라 전문성 점수를 정렬한 결과(410)에 가우시안 분포 함수(420)가 매핑되어 있는 것을 확인할 수 있다. 가우시안 분포 함수(420)는 전문성 점수 정렬 결과(410)의 중간 값 부근에서 최대 값을 가지도록 매핑될 수 있다. 이렇게 매핑할 경우 전문성이 중간 정도인 온라인 커뮤니티 사용자들에게 최대 수준의 대중성 점수를 부여할 수 있다.
도 4에서는 가로 축과 세로 축이 모두 로그 스케일로 도시되었다. 따라서 전문성 점수의 정렬 결과(410)의 중간 값은 실질적으로 로그 스케일 환산 치의 중간 값으로, 전체 온라인 커뮤니티 사용자를 10,000명(log 10,000 = 4)이라고 했을 경우 전문성 점수 기준 100등(log 100 = 2) 정도의 온라인 커뮤니티 사용자에게 최대 수준의 대중성 점수가 부여된다. 예컨대 도 4에서는 전문성 순위 약 100등 정도의 온라인 커뮤니티 사용자의 전문성 점수(440)는 약 100점이지만, 약 100등 정도의 전문성 순위를 가우시안 분포 함수(420)에 매핑할 경우 환산되는 이 온라인 커뮤니티 사용자의 대중성 점수(445)는 약 3,000점 내외로 매우 높게 계산된다. 또한, 전문성 순위 약 10등 정도의 온라인 커뮤니티 사용자의 전문성 점수(430)는 약 1,000점이지만, 약 10등 정도의 전문성 순위를 가우시안 분포 함수(420)에 매핑할 경우 환산되는 이 온라인 커뮤니티 사용자의 대중성 점수(435)는 약 10점 내외로 매우 낮게 계산되는 것을 확인할 수 있다.
그러나, 실시예에 따라 이러한 매핑 함수 및 매핑 스케일은 다양한 형태로 적용될 수 있다. 예를 들어, 가로 축 또는 세로 축에 대하여 로그 스케일이 아닌 일반 스케일로 그래프를 그리고 가우시안 분포 함수를 그대로 매핑할 경우에는, 전체 온라인 커뮤니티 사용자를 10,000명이라고 했을 경우 전문성 점수 기준 5,000등 정도의 온라인 커뮤니티 사용자에게 최대 수준의 대중성 점수가 부여될 수 있는 것이다. 어느 정도 전문성 순위의 사용자에게 최대 수준의 대중성 점수를 부여할 것인지에 대해서는 온라인 커뮤니티가 처해 있는 다양한 환경에 따라 달리 판단되고 적용될 수 있다.
한편, 검색 과정에 사용되는 기술로서, 특정 트렌드에 기반한 온라인 커뮤니티 포스트 점수의 계산 방법의 하나로 아래 수학식 3을 제안할 수 있다.
Figure 112009023768177-pat00011
수학식 3에 의하면, 사용자의 질의인 쿼리(query)에 대하여, TF*IDF 등을 이용한 사용자 질의 및 온라인 커뮤니티 포스트 간의 의미 유사성 스코어와, 온라인 커뮤니티 포스트의 트렌드 스코어 값을 조합한 스코어를 통하여, 최종적으로 온라인 커뮤니티 포스트를 랭킹하여 결과를 반환하게 된다. 수학식 3은 일종의 가중 평균 개념을 사용한 것이지만, 의미 유사성 스코어 및 트렌드 스코어 값을 동시에 반영하는 다른 형태의 수학식도 사용 가능하다.
실시예에 따라, 사용자가 최초 검색어를 입력하기 전에 다양한 트렌드 중 어느 트렌드에 기반한 검색을 수행할 것인지 미리 선택하여 입력하도록 구현할 수도 있다. 이러한 경우 수학식 3에 대응하는 트렌드 기반 온라인 커뮤니티 포스트 점수 계산 공식을 선택 가능한 트렌드별로 여러 개 만들어 두고, 사용자의 선택에 따라 대응되는 계산 공식을 사용하도록 구현할 수 있다. 또한, 하나의 의미 유사성 점수 및 복수 개의 트렌드 점수 값을 조합하여 온라인 커뮤니티 포스트 점수를 계산하도록 적용하면, 하나 이상의 트렌드를 동시에 적용하는 방식의 검색도 가능하다.
특정 트렌드에 대한 온라인 커뮤니티 포스트 p의 스코어는 함수
Figure 112009023768177-pat00012
에 의해서 아래 수학식 4와 같이 계산될 수 있다.
Figure 112009023768177-pat00013
여기서 Up는 p와 연결 관계가 있는 온라인 커뮤니티 사용자 집합, Pp는 p와 연결 관계가 있는 포스트 집합.
즉, 특정 트렌드에 대한 온라인 커뮤니티 포스트의 점수는 그 포스트와 연결 관계가 있는 온라인 커뮤니티 사용자 및 포스트와의 상호작용에 의하여 정의될 수 있는 것이다. 여기서 함수
Figure 112009023768177-pat00014
는 트렌드에 따라서 다르게 설계될 수 있다. 본 발명의 일 실시예로서 설명된 전문성 및 대중성 이외의 다른 주요 트렌드의 경우 함수
Figure 112009023768177-pat00015
의 설계에는 다양한 데이터 마이닝 기술이 접목될 수 있다. 적용 가능한 데이터 마이닝 기술의 예로는 1-mode/2-mode 사회적 연결망 분석, Markov chain random walk 모델 분석, 연관 규칙 탐색(association rule mining), 분류화(classification) 등이 있다.
한편, 실시예에 따라 전문성 또는 대중성 등의 트렌드를 효율적으로 적용하기 위하여, 온라인 커뮤니티를 복수의 카테고리로 구분하고 전문성에 관한 정보들을 카테고리에 따라 각각 별도로 산출하도록 할 수 있다. 각 온라인 커뮤니티 사용자 및 포스트의 카테고리를 구분하지 않고 글로벌 트렌드 랭크 값, 즉 일괄적인 트렌드 점수를 적용하는 경우보다 더 정확한 결과물을 산출할 수 있다. 예를 들어, 풍경 사진에 대한 포스트를 풍경 사진 전문가들에 의해서 평가 받는 경우, 모델 사진 전문가들에 의하여 평가 받는 경우보다 더 정확한 평가가 내려질 수 있다. 이를 위하여 각 온라인 커뮤니티 사용자 및 포스트를 분야별로 클러스터링 내지 분류화하고 동일 분야에 속하는 트렌드 점수의 비중을 높게 반영하도록 구현할 수 있다.
도 5는 본 발명에 의한 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 장치의 일 실시예의 개략적인 구성을 도시한 블록도이다. 본 실시예는 온라인 커뮤니티 사용자 정보 저장부(510), 온라인 커뮤니티 포스트 저장부(520), 전문성 연산부(530), 의미 유사성 연산부(540), 검색부(550), 대중성 연산부(560) 등의 구성요소를 포함할 수 있다.
온라인 커뮤니티 사용자 정보 저장부(510)는 복수의 온라인 커뮤니티 사용자에 관한 제 1 정보 및 온라인 커뮤니티 사용자의 전문성에 관한 제 1 점수를 저장한다. 이 밖에도 온라인 커뮤니티 사용자에 대한 다양한 정보가 온라인 커뮤니 티 사용자 정보 저장부(510)에 저장될 수 있다. 온라인 커뮤니티 사용자 정보 저장부(510)는 전문성 연산부(530)에 제 1 점수인 온라인 커뮤니티 사용자의 전문성 정보(591) 및 제 1 정보를 전달할 수 있다.
온라인 커뮤니티 포스트 저장부(520)는 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 관한 제 2 정보 및 특정 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 대하여 특정 온라인 커뮤니티 사용자와 상이한 온라인 커뮤니티 사용자가 형성한 상호작용에 관한 제 3 정보를 저장한다. 이 밖에도 온라인 커뮤니티 포스트에 대한 다양한 정보가 온라인 커뮤니티 포스트 저장부(520)에 저장될 수 있다. 온라인 커뮤니티 포스트 저장부(520)는 전문성 연산부(530)에 제 3 정보인 상호작용 정보(592) 및 제 2 정보를 전달할 수 있다.
전문성 연산부(530)는 상이한 온라인 커뮤니티 사용자의 전문성에 관한 점수 및 제 3 정보를 이용하여 특정 온라인 커뮤니티 사용자의 전문성에 관한 제 1 점수를 온라인 커뮤니티 사용자 각각에 대하여 산출한다. 전문성 연산부(530)는, 상이한 온라인 커뮤니티 사용자의 전문성에 관한 점수 및 제 3 정보의 곱셈을 포함하는 제 1 연산을 상이한 온라인 커뮤니티 사용자 각각에 대하여 수행하는 곱셈기 및 상이한 온라인 커뮤니티 사용자에 대한 제 1 연산의 결과의 합산을 포함하는 제 2 연산을 수행하는 덧셈기를 포함하도록 구현될 수 있다. 전문성 연산부(530)는 검색부(550) 및 대중성 연산부(560)에 제 1 점수인 전문성 점수(593)를 전달할 수 있다.
의미 유사성 연산부(540)는 입력 받은 검색어 및 상기 온라인 커뮤니티 포 스트 간의 의미 유사성에 관한 제 2 점수를 산출한다. 의미 유사성 연산부(540)는 검색부(550)에 제 2 점수인 의미 유사성 점수(595)를 전달할 수 있다.
검색부(550)는 제 1 점수 또는 제 3 점수, 및 제 2 점수를 이용하여 온라인 커뮤니티 사용자 또는 온라인 커뮤니티 포스트를 검색한다. 검색부(550)는 제 1 점수인 전문성 점수(593), 제 2 점수인 의미 유사성 점수(595), 제 3 점수인 대중성 점수(596) 등을 이용하여 사용자에게 검색 결과물을 제공할 수 있다.
실시예에 따라 대중성 연산부(560)가 포함될 수도 있다. 대중성 연산부(560)는 제 1 점수의 순서대로 온라인 커뮤니티 사용자를 정렬하고 정렬된 순위가 중간 순위에 가까울수록 높은 값을 갖는 함수를 매핑하여 특정 온라인 커뮤니티 사용자의 대중성에 관한 제 3 점수를 온라인 커뮤니티 사용자 각각에 대하여 산출한다. 이 때 검색부(550)는 제 1점수 또는 제 3 점수 중 어느 하나 이상과 제 2 점수를 이용하도록 구현될 수 있다. 대중성 연산부(560)는 검색부(550)에 제 3 점수인 대중성 점수(596)를 전달할 수 있다.
본 발명의 기술적 사상은 블로그(blog), 카페(cafe), 게시판(bulletin) 형태의 포럼(forum) 등 복수의 사용자가 작성한 게시물인 포스트(post)를 온라인 상에서 공유할 수 있는 모든 형태의 온라인 커뮤니티 포스트(online community posting/post)에 적용 가능하며, 본 발명의 실시예에서 언급한 구체적인 실시 형태에 한정되지 아니한다.
본 실시형태의 모듈, 기능 블록들 또는 수단들은 전자 회로, 집적 회로, ASIC (Application Specific Integrated Circuit) 등 공지된 다양한 소자들로 구현 될 수 있으며, 각각 별개로 구현되거나 2 이상이 하나로 통합되어 구현될 수 있다.
이상과 같이 본 발명의 이해를 위하여 그 실시예를 기술하였으나, 당업자라면 알 수 있듯이, 본 발명은 본 명세서에서 기술된 특정 실시예에 한정되는 것이 아니라, 본 발명의 범주를 벗어나지 않는 범위 내에서 다양하게 변형, 변경 및 대체될 수 있다. 예를 들어, 문자 대신 기타 LCD 등 디스플레이에 의해 표시될 수 있는 그림, 영상 등에도 본 발명의 기술이 적용될 수 있다. 따라서, 본 발명의 진정한 사상 및 범주에 속하는 모든 변형 및 변경을 특허청구범위에 의하여 모두 포괄하고자 한다.
도 1은 복수의 온라인 커뮤니티 사용자가 서로의 온라인 커뮤니티 포스트에 형성하는 상호작용을 도시한 것이다.
도 2는 본 발명에 의한 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법의 일 실시예의 각 단계를 도시한 흐름도이다.
도 3은 온라인 커뮤니티 사용자의 전문성 순위에 따라 전문성 점수를 정렬한 결과를 도시한 것이다.
도 4는 온라인 커뮤니티 사용자의 전문성 순위에 따라 전문성 점수를 정렬한 결과에 가우시안 분포 함수를 매핑하여 대중성 점수를 산출하는 과정을 도시한 것이다.
도 5는 본 발명에 의한 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트검색 장치의 일 실시예의 개략적인 구성을 도시한 블록도이다.

Claims (13)

  1. 복수의 온라인 커뮤니티 사용자 중 특정 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 대하여 상기 특정 온라인 커뮤니티 사용자와는 상이한 온라인 커뮤니티 사용자의 상호작용 횟수를 획득하는 단계와,
    상기 상이한 온라인 커뮤니티 사용자에 대해 기 산출된 전문성 점수와 상기 상호작용 횟수에 비례하는 상기 특정 온라인 커뮤니티 사용자의 상기 전문성 점수를 산출하는 단계와,
    상기 전문성 점수에 따라 상기 온라인 커뮤니티 사용자를 정렬하여 정렬 순위에 따라 상기 온라인 커뮤니티 사용자의 상기 전문성 점수와는 상반된 대중성 점수를 산출하는 단계와,
    상기 전문성 점수와 상기 대중성 점수에 따라 상기 온라인 커뮤니티 포스트의 트렌드 랭킹 값을 계산하는 단계와,
    상기 트렌드 랭킹 값에 따라 상기 온라인 커뮤니티 포스트의 트렌드 점수를 획득하는 단계와,
    입력 받은 검색어와 상기 온라인 커뮤니티 포스트 간의 의미 유사성 점수를 산출하는 단계와,
    상기 온라인 커뮤니티 포스트의 트렌드 점수와 상기 의미 유사성 점수를 조합한 점수에 의거하여 상기 온라인 커뮤니티 포스트를 랭킹하는
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법.
  2. 제 1항에 있어서,
    상기 전문성 점수를 산출하는 단계는, 상기 상이한 온라인 커뮤니티 사용자의 전문성 점수 및 상기 상호작용 횟수의 곱셈을 포함하는 제 1 연산을 상기 상이한 온라인 커뮤니티 사용자 각각에 대하여 수행하며, 상기 상이한 온라인 커뮤니티 사용자에 대한 상기 제 1 연산의 결과의 합산을 포함하는 제 2 연산을 수행하는
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법.
  3. 제 2항에 있어서,
    상기 전문성 점수를 산출하는 단계는, 아래 수학식
    Figure 112011011918893-pat00025
    에 기반하여 이루어지고, 여기서
    ER(u)는 상기 특정 온라인 커뮤니티 사용자 u의 상기 전문성 점수,
    ER(v)는 상기 상이한 온라인 커뮤니티 사용자 v의 상기 전문성 점수,
    Au는 상기 특정 온라인 커뮤니티 사용자 u가 작성한 온라인 커뮤니티 포스트의 집합,
    Figure 112011011918893-pat00026
    는 상기 Au에 속하는 온라인 커뮤니티 포스트에 대하여 상기 온라인 커뮤니티 사용자 중 상기 상이한 온라인 커뮤니티 사용자 v가 형성한 상기 상호작용의 횟수,
    Figure 112011011918893-pat00027
    는 상기 상이한 온라인 커뮤니티 사용자 v가 형성한 모든 상기 상호작용의 횟수,
    d는 최소 영향력을 나타내는 감쇄 인자(damping factor)인
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법.
  4. 제 1항에 있어서,
    상기 대중성 점수를 산출하는 단계는,
    상기 전문성 점수의 순서대로 상기 온라인 커뮤니티 사용자를 정렬하고,
    정렬된 순위가 중간 순위에 가까울수록 높은 값을 갖는 매핑 함수를 사용하여 상기 특정 온라인 커뮤니티 사용자의 상기 대중성 점수를 상기 온라인 커뮤니티 사용자 각각에 대하여 산출하는
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법.
  5. 제 4항에 있어서,
    상기 매핑 함수는 가우시안 분포 함수(Gaussian distribution function)를 포함하는
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법.
  6. 제 5항에 있어서,
    상기 가우시안 분포 함수는, 아래 수학식
    Figure 112011011918893-pat00028
    와 같이 표현되고, 여기서
    PR(u)는 상기 특정 온라인 커뮤니티 사용자 u의 상기 상호작용 횟수,
    x는 상기 특정 온라인 커뮤니티 사용자 u의 상기 정렬된 순위,
    σ는 상기 정렬된 순위의 표준 편차,
    μ는 상기 정렬된 순위의 중간 값인
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법.
  7. 제 1항에 있어서,
    상기 검색어를 입력 받기 전에 복수의 트렌드 중 어느 트렌드에 기반한 검색을 수행할 것인지 선택 받는 단계를 더 포함하며,
    선택 받은 상기 트렌드에 대한 상기 온라인 커뮤니티 포스트(p)의 상기 트렌드 점수는 함수
    Figure 112011011918893-pat00029
    에 의해서 아래 수학식
    Figure 112011011918893-pat00030
    을 이용하여 계산하고, 여기서
    Up는 p와 연결 관계가 있는 온라인 커뮤니티 사용자 집합,
    Pp는 p와 연결 관계가 있는 포스트 집합인
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법.
  8. 제 1항에 있어서,
    상기 온라인 커뮤니티 포스트를 복수의 카테고리로 구분하고,
    상기 상이한 온라인 커뮤니티 사용자의 상기 전문성 점수 및 상기 특정 온라인 커뮤니티 사용자의 상기 전문성 점수를 상기 카테고리에 따라 각각 별도로 산출하는
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법.
  9. 제 1항에 있어서,
    상기 상호작용은 댓글, 코멘트, 공감, 추천, 트랙백, 스크랩, 링크 중 어느 하나 이상을 포함하는
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방 법.
  10. 제 1항 내지 제 9항 중 어느 한 항에 기재된 방법을 실행하는 프로그램이 기록된
    컴퓨터로 읽을 수 있는 기록매체.
  11. 복수의 온라인 커뮤니티 사용자에 대해 기 산출된 전문성 점수를 저장하는 온라인 커뮤니티 사용자 정보 저장부와,
    상기 온라인 커뮤니티 사용자 중 특정 온라인 커뮤니티 사용자가 작성한 온라인 커뮤니티 포스트에 대하여 상기 특정 온라인 커뮤니티 사용자와는 상이한 온라인 커뮤니티 사용자의 상호작용 횟수를 저장하는 온라인 커뮤니티 포스트 저장부와,
    상기 온라인 커뮤니티 사용자 정보 저장부에 기 저장된 상기 상이한 온라인 커뮤니티 사용자의 상기 전문성 점수 및 상기 상호작용 횟수에 비례하는 상기 특정 온라인 커뮤니티 사용자의 상기 전문성 점수를 상기 온라인 커뮤니티 포스트 사용자 각각에 대하여 산출하는 전문성 연산부와,
    상기 전문성 점수에 따라 상기 온라인 커뮤니티 사용자를 정렬하여 정렬 순위에 따라 상기 온라인 커뮤니티 사용자의 상기 전문성 점수와는 상반된 대중성 점수를 산출하는 대중성 연산부와,
    입력 받은 검색어와 상기 온라인 커뮤니티 포스트 간의 의미 유사성 점수를 산출하는 의미 유사성 연산부와,
    상기 전문성 점수와 상기 대중성 점수에 따라 상기 온라인 커뮤니티 포스트의 트렌드 랭킹 값을 계산하고, 상기 트렌드 랭킹 값에 따라 상기 온라인 커뮤니티 포스트의 트렌드 점수를 획득하며, 상기 온라인 커뮤니티 포스트의 트렌드 점수와 상기 의미 유사성 점수를 조합한 점수에 의거하여 상기 온라인 커뮤니티 포스트를 랭킹하는 검색부
    를 포함하는 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 장치.
  12. 제 11항에 있어서,
    상기 전문성 연산부는, 상기 상이한 온라인 커뮤니티 사용자의 상기 전문성 점수 및 상기 상호작용 횟수의 곱셈을 포함하는 제 1 연산을 상기 상이한 온라인 커뮤니티 사용자 각각에 대하여 수행하는 곱셈기, 및 상기 상이한 온라인 커뮤니티 사용자에 대한 상기 제 1 연산의 결과의 합산을 포함하는 제 2 연산을 수행하는 덧셈기를 포함하는
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 장치.
  13. 제 11항에 있어서,
    상기 대중성 연산부는, 상기 전문성 점수의 순서대로 상기 온라인 커뮤니티 사용자를 정렬하고 상기 정렬된 순위가 중간 순위에 가까울수록 높은 값을 갖는 함수를 매핑하여 상기 특정 온라인 커뮤니티 사용자의 상기 대중성 점수를 상기 온라인 커뮤니티 사용자 각각에 대하여 산출하는
    온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 장치.
KR1020090034250A 2009-04-20 2009-04-20 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체 KR101088710B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020090034250A KR101088710B1 (ko) 2009-04-20 2009-04-20 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체
PCT/KR2010/002478 WO2010123264A2 (en) 2009-04-20 2010-04-20 Online community post search method and apparatus based on interactions between online community users and computer readable storage medium storing program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090034250A KR101088710B1 (ko) 2009-04-20 2009-04-20 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체

Publications (2)

Publication Number Publication Date
KR20100115600A KR20100115600A (ko) 2010-10-28
KR101088710B1 true KR101088710B1 (ko) 2011-12-01

Family

ID=43011601

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090034250A KR101088710B1 (ko) 2009-04-20 2009-04-20 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체

Country Status (2)

Country Link
KR (1) KR101088710B1 (ko)
WO (1) WO2010123264A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11320973B1 (en) 2020-10-30 2022-05-03 Oxopolitics Inc. Method of providing user interface for social networking

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9870424B2 (en) * 2011-02-10 2018-01-16 Microsoft Technology Licensing, Llc Social network based contextual ranking
US10331785B2 (en) * 2012-02-17 2019-06-25 Tivo Solutions Inc. Identifying multimedia asset similarity using blended semantic and latent feature analysis
JP5895777B2 (ja) 2012-09-06 2016-03-30 富士ゼロックス株式会社 情報分類プログラム及び情報処理装置
US9628551B2 (en) 2014-06-18 2017-04-18 International Business Machines Corporation Enabling digital asset reuse through dynamically curated shared personal collections with eminence propagation
CN106776792B (zh) * 2016-11-23 2020-07-17 北京锐安科技有限公司 网络社区的挖掘方法及装置
CN106886561A (zh) * 2016-12-29 2017-06-23 中国科学院自动化研究所 基于时间关联交互融合的网络社区帖子影响排序方法
KR102010418B1 (ko) * 2017-04-03 2019-08-14 네이버 주식회사 생산자와 소비자의 상호 작용을 고려한 주제 기반 순위 결정 방법 및 시스템

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6845374B1 (en) * 2000-11-27 2005-01-18 Mailfrontier, Inc System and method for adaptive text recommendation
US8335785B2 (en) * 2004-09-28 2012-12-18 Hewlett-Packard Development Company, L.P. Ranking results for network search query

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
2008년 가을 학술발표논문집 Vol.35, No.2(A), 한국정보과학회, 김정훈 외, 「효율적인 블로그 검색을 위한 블로그-랭크 알고리즘」, pp93-94
한국콘텐츠학회논문지 2008 Vol.8 No.1, 한국콘텐츠학회, 송창우 외, 「시맨틱 웹에서 개인화 프로파일을 이용한 콘텐츠 추천 검색 시스템」, pp318-327

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11320973B1 (en) 2020-10-30 2022-05-03 Oxopolitics Inc. Method of providing user interface for social networking

Also Published As

Publication number Publication date
WO2010123264A3 (en) 2011-01-27
KR20100115600A (ko) 2010-10-28
WO2010123264A2 (en) 2010-10-28

Similar Documents

Publication Publication Date Title
Hu et al. Reviewer credibility and sentiment analysis based user profile modelling for online product recommendation
Khan et al. Modelling to identify influential bloggers in the blogosphere: A survey
Miao et al. AMAZING: A sentiment mining and retrieval system
US9576029B2 (en) Trust propagation through both explicit and implicit social networks
Sen et al. The quest for quality tags
KR101088710B1 (ko) 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체
Kanwal et al. A review of text-based recommendation systems
Zangerle et al. Using tag recommendations to homogenize folksonomies in microblogging environments
Shani et al. Mining recommendations from the web
Potthast et al. Information retrieval in the commentsphere
JP4569380B2 (ja) ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体
Zhao et al. Academic social network-based recommendation approach for knowledge sharing
Sun et al. A hybrid approach for article recommendation in research social networks
Xu et al. Do adjective features from user reviews address sparsity and transparency in recommender systems?
Rao et al. Product recommendation system from users reviews using sentiment analysis
Djuana et al. Personalization in tag ontology learning for recommendation making
Kim et al. C-Rank and its variants: A contribution-based ranking approach exploiting links and content
Venugopal et al. Web Recommendations Systems
JP2010282403A (ja) 文書検索方法
Lobo et al. A novel method for analyzing best pages generated by query term synonym combination
Weng et al. New information search model for online reviews with the perspective of user requirements
Karmaker Santu Influence mining from unstructured big data
Chaabna et al. Designing a ranking system for product search engine based on mining UGC
CN116186097A (zh) 数据资产的搜索方法、装置、设备及存储介质
Tan et al. Using Online Metadata to Enhance Religious Video Search

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee