KR101254362B1 - 공통 접사를 이용한 키워드 순위를 제공하는 방법 및시스템 - Google Patents

공통 접사를 이용한 키워드 순위를 제공하는 방법 및시스템 Download PDF

Info

Publication number
KR101254362B1
KR101254362B1 KR1020080031626A KR20080031626A KR101254362B1 KR 101254362 B1 KR101254362 B1 KR 101254362B1 KR 1020080031626 A KR1020080031626 A KR 1020080031626A KR 20080031626 A KR20080031626 A KR 20080031626A KR 101254362 B1 KR101254362 B1 KR 101254362B1
Authority
KR
South Korea
Prior art keywords
keyword
common
ranking
keywords
affix
Prior art date
Application number
KR1020080031626A
Other languages
English (en)
Other versions
KR20080101659A (ko
Inventor
김동욱
이윤식
이지연
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to US12/600,421 priority Critical patent/US8838580B2/en
Priority to JP2010508288A priority patent/JP5368430B2/ja
Priority to PCT/KR2008/002420 priority patent/WO2008143407A1/en
Publication of KR20080101659A publication Critical patent/KR20080101659A/ko
Application granted granted Critical
Publication of KR101254362B1 publication Critical patent/KR101254362B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템이 개시된다. 공통 접사를 이용한 키워드 순위를 제공하는 방법은 키워드 셋트를 이용하여 공통 접사를 추출하는 단계 및 상기 추출한 공통 접사를 포함하는 키워드 순위를 제공하는 단계를 포함한다.
접사, 접두사, 접미사, 키워드, 정규식, 총 검색 횟수, 키워드 종류

Description

공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템 {METHOD AND SYSTEM FOR PROVIDING KEYWORD RANKING USING COMMON AFFIX}
본 발명은 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템에 관한 것으로서, 보다 상세하게는 키워드 셋트에 유입된 키워드에 포함된 공통되는 특징을 가지는 접사 각각의 순위를 계산하여 공통 접사를 추출하고, 추출한 공통 접사를 포함하는 정규식을 설정하여 키워드 순위를 제공하는 방법 및 시스템에 관한 것이다.
종래에는 키워드 셋트에 유입된 단순히 키워드의 검색 횟수를 분석하여 결과를 제공하는데 그쳤다. 다양하고 수많은 키워드가 유입되는 현재 인터넷 검색에 있어 좀더 키워드를 체계적이고 새롭게 분석하여 키워드 통계 결과를 제공할 필요가 있었다.
그리고 이미 널리 알려진 키워드의 전체 키워드 순위나 지역별 순위, 특정 연령의 순위, 특정 시간 대의 순위를 제공하는 것은 현재에도 이루어지고 있으나, 수많은 키워드에 대해 특정한 기준 없이 검색 횟수만을 고려하여 키워드의 순위를 제공하는 것은 많은 시간과 노력이 필요하였다. 상기 문제점을 해결하기 위해서 키워드 순위를 제공하기 이전에 키워드를 분석하고 특징적인 요소를 추출하여 좀더 효율적인 키워드 순위를 제공하는 것이 요구되었다.
특히 유입된 수많은 키워드를 이루고 있는 공통적인 특징을 가지는 구성요소를 이용하여 다시 유입된 키워드 순위를 제공하는 피드백 방식을 필요로 하게 되었다. 그리고 어떤 공통적인 특징을 이용하여 키워드 순위를 제공할 것인지에 대해 많은 요구가 있었다.
본 발명은 상술한 바와 같은 종래기술의 문제점을 해결하기 위해 안출된 것으로서, 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템을 제공 한다.
본 발명은 키워드 셋트에서 공통적인 특징을 가지는 접사가 포함된 키워드를 카운팅하고, 그에 따라 접사 별로 순위를 정하여 공통 접사를 추출함으로써 미처 발견하지 못한 접사를 발굴하기 위한 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템을 제공한다.
본 발명은 추출한 공통 접사를 포함하는 키워드 순위를 제공함으로써 특정 순위에 해당하는 키워드들을 미리 한정하지 않으면서 해당 접사가 갖는 특성을 함유하는 키워드들의 순위를 계산할 수 있는 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템을 제공한다.
본 발명은 추출한 공통 접사를 이용한 정규식을 통해 시리즈 형태의 영상물의 다시보기 인기 순위를 얻을 수 있는 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템을 제공한다.
본 발명의 일실시예에 따른 공통 접사를 이용한 키워드 순위를 제공하는 방법은 키워드 셋트를 이용하여 공통 접사를 추출하는 단계 및 상기 추출한 공통 접사를 포함하는 키워드 순위를 제공하는 단계를 포함한다.
본 발명의 일측면에 따르면, 키워드 셋트를 이용하여 공통 접사를 추출하는 상기 단계는 상기 키워드 셋트에서 공통적인 특징을 가지는 복수 개의 접사 각각을 포함하는 키워드를 카운팅하는 단계 및 상기 키워드를 카운팅한 결과에 따라 상기 복수 개의 접사 각각의 순위를 계산하여 공통 접사를 추출하는 단계를 포함한다.
본 발명의 일측면에 따르면, 상기 추출한 공통 접사를 포함하는 키워드 순위를 제공하는 상기 단계는 상기 추출한 공통 접사 중 키워드 순위를 제공하는 대상이 되는 접사를 포함하는 정규식을 설정하는 단계 및 상기 정규식을 통해 결정된 복수 개의 키워드 각각의 총 검색 횟수에 따라 상기 키워드 순위를 제공하는 단계를 포함한다.
본 발명의 일실시예에 따른 공통 접사를 이용한 키워드 순위를 제공하는 시스템은 키워드 셋트를 이용하여 공통 접사를 추출하는 공통 접사 추출부 및 상기 추출한 공통 접사를 포함하는 키워드 순위를 제공하는 키워드 순위 제공부를 포함한다.
본 발명의 일측면에 따르면, 공통 접사 추출부는 키워드 셋트에서 공통적인 특징을 가지는 복수 개의 접사 각각을 포함하는 키워드를 카운팅하는 키워드 카운터 및 상기 키워드를 카운팅한 결과에 따라 상기 복수 개의 접사 각각의 순위를 계산하는 접사 순위 계산부를 포함한다.
본 발명의 일측면에 따르면, 키워드 순위 제공부는 상기 추출한 공통 접사 중 키워드 순위를 제공하는 대상이 되는 접사를 포함하는 정규식을 설정하는 정규식 설정부 및 상기 정규식을 통해 결정된 복수 개의 키워드 각각의 총 검색 횟수에 따라 상기 키워드 순위를 결정하는 키워드 순위 결정부를 포함한다.
본 발명에 따르면, 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템이 제공된다.
본 발명에 따르면, 키워드 셋트에서 공통적인 특징을 가지는 접사가 포함된 키워드를 카운팅하고, 그에 따라 접사 별로 순위를 정하여 공통 접사를 추출함으로써 미처 발견하지 못한 접사를 발굴하기 위한 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템이 제공된다.
본 발명에 따르면, 추출한 공통 접사를 포함하는 키워드 순위를 제공함으로써 특정 순위에 해당하는 키워드들을 미리 한정하지 않으면서 해당 접사가 갖는 특성을 함유하는 키워드들의 순위를 계산할 수 있는 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템이 제공된다.
본 발명에 따르면, 추출한 공통 접사를 이용한 정규식을 통해 시리즈 형태의 영상물의 다시보기 인기 순위를 얻을 수 있는 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템이 제공된다.
이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다. 다만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
본 발명의 일실시예에 따른 공통 접사를 이용한 검색 순위를 제공하는 방법은 공통 접사를 이용한 검색 순위를 제공하는 시스템에 의해 수행될 수 있다. 본 발명은 공통 접두사 및 공통 접미사 각각에 대해 독립적으로 검색 순위를 제공할 수 있다.
도 1은 본 발명의 일실시예에 있어서, 공통 접사를 이용한 키워드 순위를 제공하는 방법을 순서도로 도시한 도면이다.
단계(S101) 내지 단계(S103)는 키워드 셋트를 이용하여 공통 접사를 추출하는 단계를 구체적으로 나타낸 단계이고, 단계(S104)와 단계(S105)는 추출한 공통 접사를 포함하는 키워드의 순위를 제공하는 단계를 구체적으로 나타낸 것이다.
단계(S101)는 키워드 셋트에서 공통적인 특징을 가지는 복수 개의 접사 각각을 포함하는 키워드를 카운팅(counting)하는 단계이다. 여기서, 키워드 셋트는 복수의 키워드가 저장된 매체를 의미할 수 있다. 일례로, 복수의 키워드가 저장된 매체는 서버, 데이터베이스 또는 기록 장치 등을 포함할 수 있다.
일례로, 키워드 셋트는 복수의 검색어를 포함하는 검색어 로그 또는 적어도 하나의 문서와 연관된 단어들의 셋트일 수 있다. 이 때, 검색어 로그는 사용자가 입력한 검색어를 일정 기간 동안 수집한 것일 수 있다. 키워드 셋트는 적어도 하나의 문서(예를 들면, 뉴스 기사, 블로그, 까페 등의 게시물)의 본문 또는 제목 등에 포함된 단어들의 셋트를 의미할 수 있다. 본 발명의 일실시예에 있어서, 접사(affix)는 접두사(prefix) 또는 접미사(suffix)일 수 있다.
일실시예로 키워드 셋트는 미리 설정한 기간 동안 유입된 키워드를 포함할 수 있다. 이 때, 미리 설정한 기간 동안 유입된 키워드는 미리 설정한 특정 일별, 주간별, 월간별, 연별 기간 내에 유입된 키워드일 수 있다.
일실시예로 키워드 셋트에서 공통적인 특징을 가지는 복수 개의 접사 각각을 포함하는 키워드의 종류 개수 또는 복수 개의 접사 각각을 포함하는 키워드의 총 검색 횟수를 카운팅할 수 있다. 그리고 상기 키워드의 종류 개수와 총 검색 횟수 모두 카운팅할 수 있다. 예를 들면, 공통적인 특징을 가지는 접두사가 "A"라고 하면, 단어 첫부분에 A가 결합되는 키워드가 상기 접두사를 포함하는 키워드 종류에 속할 수 있다. 반대로, 공통적인 접미사가 "B"라고 하면, 단어 끝부분에 B가 결합되는 키워드가 상기 접미사를 포함하는 키워드 종류에 속할 수 있다.
예를 들면, 공통적인 특징을 가지는 접두사가 "신혼"인 경우, "신혼여행", "신혼부부", "신혼집", "신혼준비" 등이 상기 접두사를 포함하는 키워드 종류에 포함될 수 있다. 그리고, 본 발명은 일정 기간 동안 키워드 셋트에 유입된 키워드 중 접두사인 "신혼"이 포함된 키워드에 대한 총 검색 횟수를 카운팅할 수 있다.
예를 들면, 공통적인 특징을 가지는 접미사가 "대학교"라고 하면, "서울대학교", "연세대학교" 등이 상기 접미사를 포함하는 키워드 종류에 포함될 수 있다. 그리고, 본 발명은 일정 기간 동안 키워드 셋트에 유입된 키워드 중 접미사인 "대학교"가 포함된 키워드에 대한 총 검색 횟수를 카운팅할 수 있다.
일례로 공통적인 특징은 동일한 글자 개수를 가지는 접사가 이에 해당할 수 있고, 키워드 순위를 제공하는 경우에 따라 달라질 수 있다. 예를 들면, 키워드 셋트에 있는 키워드 중에서 "2글자"인 접사를 공통적으로 포함하는 복수 개의 키워드를 카운팅할 수 있다. 이 때, 본 발명에서 추출되는 공통 접사는 접사 자체로 의미가 있는지 여부와는 무관하다. 따라서, 추출되는 공통 접사는 그 자체로 의미 가 있는 것뿐만 아니라 그 자체로 의미가 없는 것도 이에 해당할 수 있다.
또한, 일례로 공통적인 특징은 접미사 중에서 숫자 뒷부분에 결합하는 것으로 상기 숫자는 검색 대상의 횟수를 의미할 수 있다. 즉, 보통 키워드가 시리즈(series) 형태의 컨텐츠를 의미하는 단어를 포함하는 경우 상기 숫자는 시리즈 형태의 컨텐츠에 대한 횟수를 의미할 수 있다. 예를 들면, 키워드가 "CSI 시즌 3 1회 다시보기"와 같이 시리즈 형태의 컨텐츠인 "CSI 시즌 3"의 방영 횟수를 나타내는 숫자 "1" 뒤에 결합된 접미사 "회"가 상기 숫자 뒷부분에 결합하는 접미사에 해당할 수 있다.
본 발명의 일실시예에 따르면, 숫자 뒤에 결합하는 접미사를 포함하는 키워드를 카운팅하여 시리즈 형태의 컨텐츠에 대해 다시보기를 원하는 검색 요청자에게 상기 컨텐츠의 순위를 제공할 수 있다. 여기서 시리즈 형태의 컨텐츠는 음악, 영화, 서적, 소프트웨어 프로그램 등을 포함할 수 있다.
단계(S102)는 키워드를 카운팅한 결과에 따라 복수 개의 접사 각각의 순위를 계산하여 공통 접사를 추출하는 단계이다.
단계(S101)에서 카운팅한 결과를 이용하여 복수 개의 접사 각각의 순위를 계산하는데, 상기 카운팅한 결과는 앞에서 살펴보았듯이 공통적인 특징을 가지는 복수 개의 접사 각각을 포함하는 키워드의 종류 개수 또는 키워드의 총 검색 횟수를 이용하여 복수 개의 접사 각각의 순위를 계산할 수 있다. 이 때, 각각 카운팅한 키워드의 종류 개수가 많은 순으로 정렬하여 순위를 계산하거나 또는 키워드의 총 검색 횟수가 많은 순으로 정렬하여 순위를 계산할 수 있다.
단계(S101)에서, 키워드의 종류 개수와 키워드의 총 검색 횟수 각각 에 가중치를 적용하여 순위를 계산할 수 있다. 이 때, 키워드의 종류 개수와 키워드의 총 검색 횟수 각각에 가중치를 곱한 값을 합산하여 순위를 계산할 수 있다. 일례로, 복수 개의 접사 중 어느 하나의 접사에 대해 키워드의 종류 개수가 3000개이고, 총 검색 횟수가 50000개라고 할 때 환산한 점수가 100점 만점에 각각 30과 50이라고 하면 설정한 가중치가 검색의 종류 개수의 경우 0.6이고 총 검색 횟수가 0.4이면 30*0.6+50*0.4=38이 되며, 이 점수를 높은 순으로 정렬하여 복수 개의 접사 각각에 대하여 순위를 계산할 수 있다.
상기 방법은 자리수가 다르거나 양자간 큰 차이가 나는 경우에 카운팅한 결과값을 비교하기 위해 스케일링하는 방법일 수 있다. 이 때, 상기 환산한 점수는 키워드의 종류 개수와 키워드의 총 검색 횟수에 따라 달라질 수 있다. 그리고, 가중치도 키워드 순위 제공자의 설정에 따라 달라질 수 있다.
일실시예로 복수 개의 접사 각각의 순위를 계산하는 경우, 복수 개의 접사 각각의 속성에 따른 가중치를 적용한 결과를 이용하여 순위를 정할 수 있다. 이 때, 접사가 자체로 의미가 있고, 키워드로 쓰이는 빈도가 많을수록 가중치가 높게 설정될 수 있다.
단계(S103)는 계산된 복수 개의 접사 각각의 순위에 따라 상기 복수 개의 접사 중 미리 설정한 공통 접사 추출 순위 내에 해당하는 접사를 공통 접사로 추출하는 단계이다. 예를 들면, 복수 개의 접사 각각의 순위를 1위에서 100위까지 계산하고, 공통 접사 추출 순위를 1~10위로 설정한 경우에 해당 추출 순위 내의 접사 가 공통 접사로 추출될 수 있다.
또 다른 예로, 공통 접사는 카운팅한 결과값인 키워드의 종류 개수와 키워드의 총 검색 횟수가 미리 설정한 특정 기준치 이상인 경우 추출될 수 있다.
단계(S104)는 추출한 공통 접사를 이용하여 정규식을 설정하는 단계이다. 일례로, 단계(S104)는 추출한 공통 접사 그 자체로 검색식을 설정하거나 또는 추출한 공통 접사와 단어가 결합하여 검색식을 설정할 수 있다.
예를 들면, 추출한 공통 접두사가 "2글자"를 공통적인 특징을 가지는 "부산"으로 키워드 순위를 제공하는 경우 정규식을 [부산*여행]으로 표현할 수 있다. 즉, 본 발명은 추출된 공통 접사 그대로 정규식을 설정하거나, 또는 추출된 공통 접사와 다른 단어를 결합하여 정규식을 설정할 수 있다.
여기서 정규식이란, 산술 기호 등 검색 조합 기호를 통해 공통 접사를 이용하여 생성된 검색식일 수 있다. 즉, 본 발명은 추출된 공통 접사를 이용하여 상기 공통 접사와 관련된 정규식을 생성하고, 생성된 정규식을 통해 재검색을 수행하여 검색 결과에 따른 키워드 순위를 제공할 수 있다. 이 때, 일반적으로, 정규식에 사용되는 검색 조합 기호 중 "+"는 "or"의 의미로 "*"는 "and"로 정의할 수 있다.
상기 예와 같이 정규식을 설정하는 경우, 상기 설정된 정규식을 통해 검색되는 키워드는 "부산 여행 지도", "부산 여행 맛집", "부산 여행 추천 장소", "부산 여행 일정" 등이 될 수 있다.
단계(S105)는 정규식을 통해 결정된 복수 개의 키워드 각각의 총 검색 횟수에 따라 키워드 순위를 제공하는 단계이다.
즉, 단계(S104)에서 검색 결과로 얻은 복수 개의 키워드 각각에 대해 총 검색 횟수를 카운팅하여 키워드 순위를 제공할 수 있다. 단계(S104)의 예를 이용하면, 키워드 각각에 대해 총 검색 횟수를 비교한 결과 "부산"을 포함하는 키워드 중 검색 횟수에 따라 정렬하여 순위를 제공할 수 있다.
일례로, 정규식을 이용하는 경우, 다른 형태의 순위를 얻을 수 있다. 예를 들어, 추출된 공통 접두사가 "메이져"인 경우, 정규식은 [메이져*리그]로 설정될 수 있다. 설정된 정규식을 통해 "메이져리그"와 관련된 검색 결과가 도출될 수 있다. 즉, "메이져리그 인기선수", "메이져리그 경기 다시보기", "메이져리그 예상순위" "메이져리그 캐릭터 판매"등의 검색 결과가 도출될 수 있다.
이 때, 도출된 검색 결과를 검색 횟수에 따라 정렬하는 경우, "메이져리그"를 포함하는 키워드에 대한 순위를 결정할 수 있다. 이를 통해 "메이져리그"와 관련된 키워드 중 인기있는 키워드를 추출할 수 있다.
이하의 도 2 내지 도 4는 도 1에서 언급한 방법에 따라 공통 접사를 이용한 키워드 순위를 제공하는 구체적인 일례를 나타낸 것이다.
도 2는 본 발명의 일실시예에 있어서, 키워드 셋트에서 동일한 글자 개수를 가지는 접미사의 순위를 이용하여 공통 접미사를 추출하는 과정을 도시한 도면이다.
키워드 셋트(201)는 수많은 검색 요청자로부터 입력된 키워드 들이 저장된 매체를 의미할 수 있으며, 비슷한 기능을 수행하는 검색 서버, 검색 데이터베이스, 기록 장치 등을 포함할 수 있다.
키워드 셋트(201)는 미리 설정한 기간 동안 유입된 키워드를 포함할 수 있다. 이는 미리 설정한 특정 일별, 주간별, 월간별, 연별 기간 내에 유입된 키워드를 이용하여 보다 정확한 순위 결과를 제공하고, 상기 기간 내의 키워드들의 인기 순위를 제공하기 위함이라고 할 수 있다.
접미사 순위 결과표(202)는 공통적인 특징을 가지는 접미사 각각을 포함하는 키워드를 카운팅하고, 카운팅한 결과에 따라 복수 개의 접미사 각각의 순위를 계산한 결과일 수 있다.
접미사 순위 결과표(202)는 키워드 셋트(201)에서 공통적인 특징을 가지는 접미사를 포함하는 키워드를 카운팅한 결과를 이용한 것으로 도 2에서는 "한글 3글자" 짜리로 글자 개수가 3개로 동일한 접미사를 포함하는 키워드를 이용한 것이다.
키워드 셋트(201)에서 한글 3글자로 구성되는 접미사를 포함하는 키워드를 카운팅한 결과는 접미사 순위 결과표(202)에서 볼 수 있는데, 앞에서 설명한 듯이 카운팅 결과는 키워드의 종류 개수 또는 키워드 총 검색 횟수(QC:query count)가 될 수 있다.
예를 들어 접미사 순위 결과표(202)에서 접미사가 "이야기"인 경우에 접미사 "이야기"를 포함하는 키워드의 종류인 "사진이야기", "여행이야기", "사랑이야기" 등으로 키워드 종류 개수를 카운팅할 수 있고, 접미사 "이야기"를 포함하는 "홍길동의 사진이야기", "마시멜로우의 사랑이야기", "별 이야기" 등 키워드의 총 검색 횟수를 카운팅할 수 있다. 접미사 순위 결과표(202)에서 볼 수 있듯이, "이야기"를 포함하는 키워드에 대해 카운팅한 키워드의 종류 개수 및 키워드의 총 검 색 횟수는 각각 827과 90511임을 알 수 있다.
카운팅한 결과 중 도 2에서는 키워드의 종류 개수가 높은 순서로 한글 3글자 짜리의 복수 개의 접미사 각각의 순위를 계산하여 접미사 순위 결과표(202)에 나타내었다. 이 때, 키워드 총 검색 횟수가 높은 순서로 정렬하여 접미사 순위를 계산하여 접미사의 순서를 결정할 수 있다. 또한, 키워드 종류와 키워드 총 검색 횟수 각각을 환산한 점수에 미리 설정된 가중치를 적용하여 합산한 점수가 높은 순서로 정렬하여 접미사 순위를 계산할 수 있다.
그리고 접미사 각각의 고유한 속성에 따른 가중치를 키워드의 종류 개수 또는 키워드의 총 검색 횟수 또는 키워드의 종류와 키워드의 총 검색 횟수 각각에 적용하여 합산한 값을 높은 순서로 정렬하여 접미사 순위를 계산할 수도 있다. 이 때 도 1에서 이미 언급하였듯이 접미사가 그 자체로 의미가 있는 경우는 그 자체로 의미가 없는 경우보다 더 높은 가중치가 적용될 수 있다. 도 2의 접미사 순위 결과표(202)에서 "동영상", "만들기", "중학교" 등이 "의순위" 보다 높은 가중치가 설정될 수 있다. 언급한 접미사 순위를 결정하는 방법은 일실시예에 불과하고, 키워드에 대해 카운팅한 다른 데이터를 이용할 수도 있다.
공통 접미사 추출 목록(203)은 접미사 순위 결과표(202)에서 키워드 순위 제공자가 미리 설정한 순위 내의 접미사만 공통 접미사로 추출한 것을 나열한 것이다. 도 2에서는 1위에서 10위까지의 접미사를 공통 접미사를 추출한 것을 알 수 있다.
도 2에 도시된 접미사 순위 결과표(202)는 일실시예에 불과하고, 다른 형태 로 결정될 수 있다. 그리고, 본 발명의 일실시예에 따른 공통 접미사를 추출하는 방법은 상기 방법 이외에 다른 방법도 포함될 수 있다.
도 3은 본 발명의 일실시예에 있어서, 키워드 셋트에서 숫자 뒷부분에 결합하는 접미사의 순위를 이용하여 공통 접미사를 추출하는 과정을 도시한 도면이다.
키워드 셋트(301)에서 숫자 뒷부분에 결합하는 접미사에 대한 순위를 제공하는 것으로 전체적인 과정은 도 2와 비슷하다고 할 수 있다. 숫자 뒷부분에 나타난 접미사들의 카운팅한 결과의 분포는 접미사 순위 결과표(302)에서 볼 수 있다. 특히 키워드가 시리즈 형태의 영상물의 제목을 포함하는 경우가 보통 이에 속한다고 할 수 있는데, 영상물에 한정되지 않고 서적, 책, 소프트웨어 등의 미디어 컨텐츠 전반을 포함할 수 있다.
숫자 뒷부분에 결합하는 접미사는 접미사 순위 결과표(302)에서 볼 수 있듯이, 시리즈의 횟수를 의미하는 "회", "쪽", "화" 등이 포함되는 것을 알 수 있다. 상기 접미사를 포함하는 키워드에 대해 카운팅하여 순위를 결정하는 방법은 도 2와 동일하다고 할 수 있으므로 상기 해당 부분을 참고할 수 있다.
그리고 검색 대상의 횟수를 의미하는 숫자 뒷부분에 결합하는 접미사의 순위 중 미리 설정한 순위 내의 접미사만을 공통 접미사로 추출한 것을 공통 접미사 추출 목록(303)을 통해 알 수가 있다.
공통 접미사를 추출하는 방법은 상기 방법 이외에 다른 방법도 포함될 수 있고, 미리 설정한 순위에 포함된 접미사만을 공통 접미사로 추출하는 것에 한정되지 않는다.
도 4는 본 발명의 일실시예에 있어서, 키워드 셋트에서 동일한 글자 개수를 가지는 접두사의 순위를 이용하여 공통 접두사를 추출하는 과정을 도시한 도면이다.
키워드 셋트(401)는 수많은 검색 요청자로부터 입력된 키워드 들이 저장된 매체를 의미할 수 있으며, 비슷한 기능을 수행하는 검색 서버, 검색 데이터베이스, 기록 장치 등을 포함할 수 있다.
키워드 셋트(401)는 미리 설정한 기간동안 유입된 키워드를 포함할 수 있다. 이는 미리 설정한 특정 일별, 주간별, 월간별, 연별 기간 내에 유입된 키워드를 이용하여 보다 정확한 순위 결과를 제공하고, 상기 기간 내의 키워드들의 인기 순위를 제공하기 위함이라고 할 수 있다.
접두사 순위 결과표(402)는 공통적인 특징을 가지는 접두사 각각을 포함하는 키워드를 카운팅하고, 카운팅한 결과에 따라 복수 개의 접두사 각각의 순위를 계산한 결과일 수 있다.
접두사 순위 결과표(402)는 키워드 셋트(401)에서 공통적인 특징을 가지는 접두사를 포함하는 키워드를 카운팅한 결과를 이용한 것이다. 도 4은 글자 개수가 2개로 동일한 접두사를 포함하는 키워드를 이용한 예를 나타낸다.
키워드 셋트(401)에서 2글자로 구성되는 접두사를 포함하는 키워드를 카운팅한 결과는 접두사 순위 결과표(402)에서 볼 수 있다. 카운팅 결과는 키워드의 종류 개수 또는 키워드 총 검색 횟수(QC:query count)가 될 수 있다.
예를 들어 접두사 순위 결과표(402)에서 접두사가 "서울"인 경우에 접두사 "서울"을 포함하는 키워드의 종류인 "서울 지하철", "서울 대학교", "서울역", "서울타워" 등으로 키워드 종류 개수를 카운팅할 수 있다. 그리고, "서울 지하철 노선도", "서울 대학교 입학", "서울역 시간표" 등 키워드의 총 검색 횟수를 카운팅할 수 있다. 접두사 순위 결과표(402)에서 볼 수 있듯이, "서울"을 포함하는 키워드에 대해 카운팅한 키워드의 종류 개수 및 키워드의 총 검색 횟수는 각각 8124와 762054임을 알 수 있다.
접두사 순위 결과표(402)는 카운팅한 결과 중 키워드의 종류 개수가 높은 순서로 2글자의 접두사 순위를 나타낸다. 이 때, 키워드 총 검색 횟수가 높은 순서로 정렬하여 접두사 순위를 계산하여 접두사의 순서를 결정할 수 있다. 또한, 접두사 순위 결과표(402)는 키워드 종류와 키워드 총 검색 횟수 각각을 환산한 점수에 미리 설정된 가중치를 적용하여 합산한 점수가 높은 순서로 정렬하여 접두사 순위를 의미할 수 있다.
그리고 접두사 각각의 고유한 속성에 따른 가중치를 키워드의 종류 개수 또는 키워드의 총 검색 횟수 또는 키워드의 종류와 키워드의 총 검색 횟수 각각에 적용하여 합산한 값을 높은 순서로 정렬하여 접두사 순위를 계산할 수도 있다.
공통 접두사 추출 목록(404)은 접두사 순위 결과표(402)에서 키워드 순위 제공자가 미리 설정한 순위 내의 접두사만 공통 접두사로 추출한 것을 나열한 것이다. 도 4에서, 공통 접두사 추출 목록(404)은 접두사 순위에 대해 1위에서 10위까지의 접두사가 추출된 결과를 의미한다.
도 5는 본 발명의 일실시예에 있어서, 추출한 공통 접미사를 이용하여 키워 드의 순위를 제공하는 과정을 도시한 도면이다. 도 2에서 추출한 공통 접미사를 이용하여 키워드 순위를 제공하는 과정을 나타내었다. 도 4에서 설명된 것은 접두사에도 동일하게 적용될 수 있다.
공통 접미사 추출 목록(501)에서 추출된 접미사가 "시보기" 라고 가정하면, 정규식(502)은 [(회+쪽+편)*다*시보기]로 설정될 수 있다. 여기서 언급된 접미사 "회", "쪽", "편"는 키워드 순위를 제공하는 자가 미리 알고 있는 접미사이거나, 도 3에서 언급한 숫자 뒷부분에 결합하는 횟수를 의미하는 접미사 중 추출한 공통 접미사일 수 있다.
결국 정규식(502)을 통해 결정된 복수 개의 키워드 각각의 총 검색 횟수를 카운팅하고, 총 검색 횟수의 높은 순서로 정렬된 키워드 순위는 키워드 순위표(503)를 통해 알 수 있다. 정규식(502)에 시리즈 형태의 영상물의 횟수를 의미하는 "회", "쪽", "편'이 포함되었기 때문에 상위 30위 내의 키워드에 영상물의 다시보기가 대부분인 것을 알 수 있다.
여기서, 또 다른 형태의 키워드 순위를 제공할 수 있는데 도 4에 나타난 정규식(502)과 같이 숫자와 접미사가 결합된 형태인 경우, 복수 개의 키워드 중 숫자 앞부분에 결합된 단어를 포함하는 키워드의 총 검색 횟수에 따라 키워드 순위를 제공할 수 있다. 숫자 앞부분에 결합된 단어가 일반적으로 시리즈 형태의 영상물에 관한 것으로 동일한 영상물에 대해 다시보기를 원하는 순위를 제공하기 위함이라고 할 수 있다.
예를 들면 영상물이 "프리즌 브레이크"인 경우 키워드 순위표(503)에서 2 위, 3위, 11위에 나타난 "프리즌 브레이크"를 포함하는 키워드 각각의 총 검색 횟수에 따라 별도로 순위로 나타낼 수 있다. 그러면 "프리즌 브레이크"의 다시보기 순위는 키워드 순위표(503)에 나타난 결과를 이용하면, "프리즌 브레이크" 10편, 9편, 5회 순으로 될 것이다. 여기서 "편"과 "회"는 경우에 따라 검색 요청자마다 달리 표현되는 것이고, 동일할 수도 있다.
도 6은 본 발명의 다른 일실시예에 있어서, 공통 접사를 이용한 키워드 순위를 제공하는 시스템의 구성을 도시한 도면이다. 공통 접사를 이용한 키워드 순위를 제공하는 방법에 관한 도 1 내지 도 4에서 설명한 것과 대응할 수 있다.
키워드 순위 제공 시스템(601)은 크게 공통 접사 추출부(602)와 키워드 순위 제공부(505)로 구성될 수 있다. 그리고 공통 접사 추출부(602)는 키워드 카운터(603)와 접사 순위 계산부(604)를 포함할 수 있고, 키워드 순위 제공부(605)는 정규식 설정부(606)와 키워드 순위 결정부(607)를 포함할 수 있다.
공통 접사 추출부(602)는 키워드 셋트를 이용하여 공통 접사를 추출할 수 있다. 다시 말해서, 키워드 셋트에 저장된 키워드 중에서 특정 조건에 맞는 접사에 대한 순위를 계산하여 공통 접사를 추출할 수 있다.
키워드 카운터(603)는 키워드 셋트에서 공통적인 특징을 가지는 복수 개의 접사 각각을 포함하는 키워드를 카운팅할 수 있다. 구체적으로 공통적인 특징을 가지는 복수 개의 접사 각각을 포함하는 키워드의 종류 개수 또는 키워드의 총 검색 횟수를 카운팅할 수 있다. 그리고 복수 개의 접사 각각을 포함하는 키워드의 종류 개수와 키워드의 총 검색 횟수 모두를 동시에 카운팅할 수 있다. 일례로, 공 통적인 특징은 접사의 글자 개수가 동일한 것을 의미할 수 있다.
접사 순위 계산부(604)는 키워드 카운터(603)에서 카운팅한 결과에 따라 복수 개의 접사 각각의 순위를 계산할 수 있다. 즉 카운팅한 결과인 키워드의 종류 개수와 키워드의 총 검색 횟수를 이용하여 복수 개의 접사 각각의 순위를 계산할 수 있다.
이 때, 순위를 계산하는 방법은 카운팅한 키워드의 종류 개수와 키워드의 총 검색 횟수를 각각 고려하는지 또는 전부 고려하는지에 따라 크게 2가지로 분류할 수 있다.
첫 번째는 키워드의 종류 개수를 높은 순서대로 정렬하거나 키워드의 총 검색 횟수를 높은 순서대로 정렬하여 순위를 계산하는 것이다. 또는 키워드 종류 개수와 키워드의 총 검색 횟수 각각에 접사의 속성에 따른 가중치를 적용하여 순위를 계산할 수 있다.
두 번째는 키워드의 종류 개수를 환산한 제1 점수 및 상기 키워드의 총 검색 횟수를 환산한 제2 점수 각각에 가중치를 적용하여 복수 개의 접사 각각의 순위를 계산하는 것이다. 이 때, 키워드의 종류 개수와 키워드의 총 검색 횟수 각각에 접사의 속성에 따른 가중치를 곱한 결과를 합산한 값을 높은 순서대로 정렬하여 순위를 계산할 수 있다.
여기서 환산한 점수에 곱하는 가중치는 다른 범위의 점수 분포를 일정하게 스케일링하여 키워드 순위 제공자가 비중에 따라 부여하는 값이라고 할 수 있다. 그리고 접사 속성에 따른 가중치는 접사 고유의 속성을 고려하여 접사 자체로 의미가 있거나 키워드로 쓰이는 경우 높은 가중치를 가지는 것으로 볼 수 있다.
결국 공통 접사 추출부(602)는 접사 순위 계산부(604)에서 계산된 복수 개의 접사 각각의 순위에 따라 복수 개의 접사 중 미리 설정한 공통 접사 추출 순위 내에 해당하는 접사를 공통 접사로 추출할 수 있다. 공통 접사 추출 순위는 시스템의 구성에 따라 다르게 결정될 수 있다.
정규식 설정부(606)는 추출한 공통 접사를 이용하여 정규식을 설정할 수 있다. 이 때, 정규식은 상기 추출한 공통 접사로 구성되거나 또는 상기 추출한 공통 접사와 단어가 결합되어 구성된 검색식을 의미할 수 있다.
키워드 순위 결정부(607)는 설정한 정규식을 통해 결정된 복수 개의 키워드 각각의 총 검색 횟수를 카운팅하고, 키워드의 총 검색 횟수가 높은 순서대로 정렬하여 해당 키워드 순위를 결정할 수 있다.
또한 본 발명의 일실시예에 따른 공통 접사를 이용한 키워드 순위를 제공하는 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.
도 1은 본 발명의 일실시예에 있어서, 공통 접사를 이용한 키워드 순위를 제공하는 방법을 순서도로 도시한 도면이다.
도 2는 본 발명의 일실시예에 있어서, 키워드 셋트에서 동일한 글자 개수를 가지는 접사의 순위를 이용하여 공통 접미사를 추출하는 과정을 도시한 도면이다.
도 3은 본 발명의 일실시예에 있어서, 키워드 셋트에서 숫자 뒷부분에 결합하는 접사의 순위를 이용하여 공통 접미사를 추출하는 과정을 도시한 도면이다.
도 4는 본 발명의 일실시예에 있어서, 키워드 셋트에서 동일한 글자 개수를 가지는 접두사의 순위를 이용하여 공통 접두사를 추출하는 과정을 도시한 도면이다.
도 5는 본 발명의 일실시예에 있어서, 추출한 공통 접사를 이용하여 키워드의 순위를 제공하는 과정을 도시한 도면이다.
도 6은 본 발명의 다른 일실시예에 있어서, 공통 접사를 이용한 키워드 순위를 제공하는 시스템의 구성을 도시한 도면이다.
<도면의 주요 부분에 대한 설명>
602: 공통 접사 추출부
603: 키워드 카운터
604: 접사 순위 계산부
605: 키워드 순위 제공부
606: 정규식 설정부
607: 키워드 순위 결정부

Claims (24)

  1. 키워드 셋트에서 공통적인 특징을 가지는 복수 개의 접사 각각을 포함하는 키워드를 카운팅하는 단계;
    상기 키워드를 카운팅한 결과에 따라 상기 복수 개의 접사 각각의 순위를 계산하는 단계; 및
    상기 계산된 복수 개의 접사 각각의 순위를 사용하여 미리 설정한 공통 접사 추출 순위 내에 해당하는 접사를 포함하는 공통 접사를 추출하는 단계
    를 포함하고,
    상기 공통적인 특징은,
    상기 접사의 글자 개수가 동일하거나, 또는 숫자 뒷부분에 결합하는 것을 의미하며, 상기 글자 개수는 키워드 순위를 제공하는 경우마다 달라지는 공통 접사를 이용한 키워드 순위를 제공하는 방법.
  2. 제1항에 있어서,
    상기 키워드 셋트는,
    복수의 검색어를 포함하는 검색어 로그 또는 적어도 하나의 문서와 연관된 단어들의 셋트인 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 방법.
  3. 제1항에 있어서,
    상기 키워드 셋트에서 공통적인 특징을 가지는 복수 개의 접사 각각을 포함하는 키워드를 카운팅하는 상기 단계는,
    상기 복수 개의 접사 각각을 포함하는 키워드의 종류 개수 또는 키워드의 총 검색 횟수를 카운팅하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 방법.
  4. 삭제
  5. 제3항에 있어서,
    상기 키워드를 카운팅한 결과에 따라 상기 복수 개의 접사 각각의 순위를 계산하는 상기 단계는,
    상기 키워드의 종류 개수 또는 상기 총 검색 횟수에 따라 상기 복수 개의 접사 각각의 순위를 계산하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 방법.
  6. 제3항에 있어서,
    상기 키워드를 카운팅한 결과에 따라 상기 복수 개의 접사 각각의 순위를 계산하는 상기 단계는,
    상기 키워드의 종류 개수를 환산한 제1 점수 및 상기 키워드의 총 검색 횟수를 환산한 제2 점수 각각에 가중치를 적용하여 상기 복수 개의 접사 각각의 순위를 계산하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 방법.
  7. 제1항에 있어서,
    상기 키워드를 카운팅한 결과에 따라 상기 복수 개의 접사 각각의 순위를 계산하는 상기 단계는,
    상기 카운팅한 결과에 상기 복수 개의 접사 각각의 속성에 따른 가중치를 적용하여 상기 복수 개의 접사 각각의 순위를 계산하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 방법.
  8. 제7항에 있어서,
    상기 복수 개의 접사 각각의 속성에 따른 상기 가중치는,
    상기 복수 개의 접사 각각이 그 자체로 키워드가 되는 빈도가 높을수록 높은 가중치를 가지는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 방법.
  9. 삭제
  10. 제2항에 있어서,
    상기 추출한 공통 접사를 포함하는 키워드 순위를 제공하는 단계를 더 포함하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 방법.
  11. 제10항에 있어서,
    상기 추출한 공통 접사를 포함하는 키워드 순위를 제공하는 상기 단계는,
    상기 추출한 공통 접사를 이용하여 정규식을 설정하는 단계; 및
    상기 정규식을 통해 결정된 복수 개의 키워드 각각의 총 검색 횟수에 따라 상기 키워드 순위를 제공하는 단계
    를 포함하는 공통 접사를 이용한 키워드 순위를 제공하는 방법.
  12. 제11항에 있어서,
    상기 정규식을 설정하는 단계는,
    상기 추출한 공통 접사로 구성되거나 또는 상기 추출한 공통 접사와 단어가 결합되어 구성된 검색식을 설정하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 방법.
  13. 제1항 내지 제3항, 제5항 내지 제8항 및 제10항 내지 제12항 중 어느 한 항의 방법을 실행하는 프로그램을 기록한 컴퓨터 판독 가능 기록매체.
  14. 키워드 셋트를 이용하여 미리 설정한 공통 접사 추출 순위 내에 해당하는 접사를 포함하는 공통 접사를 추출하는 공통 접사 추출부; 및
    상기 추출한 공통 접사를 포함하는 키워드 순위를 제공하는 키워드 순위 제공부
    를 포함하고,
    상기 공통 접사 추출부는,
    상기 키워드 셋트에서 공통적인 특징을 가지는 복수 개의 접사 각각을 포함하는 키워드를 카운팅하는 키워드 카운터; 및
    상기 키워드를 카운팅한 결과에 따라 상기 복수 개의 접사 각각의 순위를 계산하는 접사 순위 계산부
    를 포함하고,
    상기 공통적인 특징은,
    상기 접사의 글자 개수가 동일하거나, 또는 숫자 뒷부분에 결합하는 것을 의미하며, 상기 글자 개수는 키워드 순위를 제공하는 경우마다 달라지는 공통 접사를 이용한 키워드 순위를 제공하는 시스템.
  15. 삭제
  16. 제14항에 있어서,
    상기 키워드 카운터는,
    상기 복수 개의 접사 각각을 포함하는 키워드의 종류 개수 또는 상기 키워드의 총 검색 횟수를 카운팅하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 시스템.
  17. 삭제
  18. 제14항에 있어서,
    상기 접사 순위 계산부는,
    상기 키워드의 종류 개수 또는 총 검색 횟수에 따라 상기 복수 개의 접사 각각의 순위를 계산하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 시스템.
  19. 제16항에 있어서,
    상기 접사 순위 계산부는,
    상기 키워드의 종류 개수를 환산한 제1 점수 및 상기 키워드의 총 검색 횟수를 환산한 제2 점수 각각에 가중치를 적용하여 상기 복수 개의 접사 각각의 순위를 계산하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 시스템.
  20. 제14항에 있어서,
    상기 접사 순위 계산부는,
    상기 카운팅한 결과에 상기 복수 개의 접사 각각의 속성에 따른 가중치를 적용하여 상기 복수 개의 접사 각각의 순위를 계산하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 시스템.
  21. 제20항에 있어서,
    상기 복수 개의 접사 각각의 속성에 따른 상기 가중치는,
    상기 복수 개의 접사 각각이 그 자체로 키워드가 되는 빈도가 높을수록 높은 가중치를 가지는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 시스템.
  22. 삭제
  23. 제14항에 있어서,
    상기 키워드 순위 제공부는,
    상기 추출한 공통 접사를 이용하여 정규식을 설정하는 정규식 설정부; 및
    상기 정규식을 통해 결정된 복수 개의 키워드 각각의 총 검색 횟수에 따라 상기 키워드 순위를 결정하는 키워드 순위 결정부
    를 포함하는 공통 접사를 이용한 키워드 순위를 제공하는 시스템.
  24. 제23항에 있어서,
    상기 정규식 설정부는,
    상기 추출한 공통 접사로 구성되거나 또는 상기 추출한 공통 접사와 단어가 결합되어 구성된 검색식을 설정하는 것을 특징으로 하는 공통 접사를 이용한 키워드 순위를 제공하는 시스템.
KR1020080031626A 2007-05-18 2008-04-04 공통 접사를 이용한 키워드 순위를 제공하는 방법 및시스템 KR101254362B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US12/600,421 US8838580B2 (en) 2007-05-18 2008-04-29 Method and system for providing keyword ranking using common affix
JP2010508288A JP5368430B2 (ja) 2007-05-18 2008-04-29 共通接辞を用いたキーワード順位を提供する方法およびシステム
PCT/KR2008/002420 WO2008143407A1 (en) 2007-05-18 2008-04-29 Method and system for providing keyword ranking using common affix

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070048829 2007-05-18
KR20070048829 2007-05-18

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020110127811A Division KR20120009412A (ko) 2007-05-18 2011-12-01 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20080101659A KR20080101659A (ko) 2008-11-21
KR101254362B1 true KR101254362B1 (ko) 2013-04-12

Family

ID=40287871

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020080031626A KR101254362B1 (ko) 2007-05-18 2008-04-04 공통 접사를 이용한 키워드 순위를 제공하는 방법 및시스템
KR1020110127811A KR20120009412A (ko) 2007-05-18 2011-12-01 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020110127811A KR20120009412A (ko) 2007-05-18 2011-12-01 공통 접사를 이용한 키워드 순위를 제공하는 방법 및 시스템

Country Status (3)

Country Link
US (1) US8838580B2 (ko)
JP (1) JP5368430B2 (ko)
KR (2) KR101254362B1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101597247B1 (ko) * 2010-03-29 2016-02-25 네이버 주식회사 실시간 키워드 연동형 광고 노출 시스템 및 방법
KR101231438B1 (ko) * 2011-05-25 2013-02-07 엔에이치엔(주) 외래어 발음 검색 서비스를 제공하는 검색결과 제공 시스템 및 방법
WO2013162263A1 (ko) * 2012-04-23 2013-10-31 줌인터넷 주식회사 패킷미러링을 이용한 검색대상 랭크 결정 방법 및 시스템
WO2013162265A1 (ko) * 2012-04-23 2013-10-31 줌인터넷 주식회사 패킷미러링을 이용한 순위 정보 제공 방법 및 시스템
US9230013B1 (en) * 2013-03-07 2016-01-05 International Business Machines Corporation Suffix searching on documents
US9430573B2 (en) * 2014-01-14 2016-08-30 Microsoft Technology Licensing, Llc Coherent question answering in search results
KR101787248B1 (ko) * 2016-04-14 2017-10-18 라인 가부시키가이샤 메신저 서비스를 이용한 키워드 검색 방법 및 시스템
CN109582744B (zh) * 2017-09-29 2021-08-10 阿里巴巴(中国)有限公司 一种用户满意度评分方法及装置
CN111460095B (zh) * 2020-03-17 2023-06-27 北京百度网讯科技有限公司 问答处理方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0740275B2 (ja) * 1987-10-26 1995-05-01 日本電信電話株式会社 キーワード重要度自動評価装置
US20040093321A1 (en) 2002-11-13 2004-05-13 Xerox Corporation Search engine with structured contextual clustering
US20050234879A1 (en) 2004-04-15 2005-10-20 Hua-Jun Zeng Term suggestion for multi-sense query

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4358824A (en) 1979-12-28 1982-11-09 International Business Machines Corporation Office correspondence storage and retrieval system
JPH067385B2 (ja) * 1983-08-03 1994-01-26 株式会社日立製作所 キ−ワ−ド自動抽出方式
JP2783558B2 (ja) 1988-09-30 1998-08-06 株式会社東芝 要約生成方法および要約生成装置
JPH0756948A (ja) 1993-08-09 1995-03-03 Fuji Xerox Co Ltd 情報検索装置
JP3908831B2 (ja) * 1997-07-31 2007-04-25 株式会社リコー 関連語検索装置
US6078917A (en) * 1997-12-18 2000-06-20 International Business Machines Corporation System for searching internet using automatic relevance feedback
US6430557B1 (en) * 1998-12-16 2002-08-06 Xerox Corporation Identifying a group of words using modified query words obtained from successive suffix relationships
US20020103809A1 (en) * 2000-02-02 2002-08-01 Searchlogic.Com Corporation Combinatorial query generating system and method
JP2001249947A (ja) * 2000-03-06 2001-09-14 Nippon Telegr & Teleph Corp <Ntt> 文書検索方法、装置、および文書検索プログラムを記録した記録媒体
US7424467B2 (en) * 2004-01-26 2008-09-09 International Business Machines Corporation Architecture for an indexer with fixed width sort and variable width sort
US7533088B2 (en) * 2005-05-04 2009-05-12 Microsoft Corporation Database reverse query matching
US20070288602A1 (en) * 2006-06-09 2007-12-13 Ebay Inc. Interest-based communities

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0740275B2 (ja) * 1987-10-26 1995-05-01 日本電信電話株式会社 キーワード重要度自動評価装置
US20040093321A1 (en) 2002-11-13 2004-05-13 Xerox Corporation Search engine with structured contextual clustering
US20050234879A1 (en) 2004-04-15 2005-10-20 Hua-Jun Zeng Term suggestion for multi-sense query

Also Published As

Publication number Publication date
US20100161618A1 (en) 2010-06-24
US8838580B2 (en) 2014-09-16
KR20120009412A (ko) 2012-01-31
JP2010528351A (ja) 2010-08-19
KR20080101659A (ko) 2008-11-21
JP5368430B2 (ja) 2013-12-18

Similar Documents

Publication Publication Date Title
KR101254362B1 (ko) 공통 접사를 이용한 키워드 순위를 제공하는 방법 및시스템
EP2798540B1 (en) Extracting search-focused key n-grams and/or phrases for relevance rankings in searches
US8793259B2 (en) Information retrieval device, information retrieval method, and program
US20110258212A1 (en) Automatic query suggestion generation using sub-queries
CN106095949A (zh) 一种基于混合推荐的数字化图书馆资源个性化推荐方法与***
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
US8812504B2 (en) Keyword presentation apparatus and method
US9529847B2 (en) Information processing apparatus, information processing method, and program for extracting co-occurrence character strings
KR100892842B1 (ko) 사용자 중심 정보탐색 방법 및 시스템
CN103020049A (zh) 搜索方法及搜索***
JP5269938B2 (ja) 急上昇ワード関連付け装置及び方法
JP5952711B2 (ja) 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
JP5406794B2 (ja) 検索クエリ推薦装置及び検索クエリ推薦プログラム
US20120330986A1 (en) Information processing apparatus, information processing method, and program
JP5302614B2 (ja) 施設関連情報の検索データベース形成方法および施設関連情報検索システム
JP5179564B2 (ja) クエリセグメント位置決定装置
CN111259136A (zh) 一种基于用户偏好自动生成主题评价摘要的方法
KR101347884B1 (ko) 사이트 특성 단어를 이용한 연관 사이트 제공 방법 및 시스템
JP5513929B2 (ja) 経験情報の再利用性評価装置及び方法及びプログラム
WO2008143407A1 (en) Method and system for providing keyword ranking using common affix
Balaji et al. Finding related research papers using semantic and co-citation proximity analysis
JP4462014B2 (ja) 話題語結合方法及び装置及びプログラム
KR101402339B1 (ko) 문서 관리 시스템 및 문서 관리 방법
Samah et al. TF-IDF and Data Visualization For Syafie Madhhab Hadith Scriptures Authenticity
KR20120057786A (ko) 검색 결과 내에 첨부된 정보 데이터베이스에 기초한 검색 리스트 및 검색어 순위 제공 방법 및 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
E601 Decision to refuse application
J201 Request for trial against refusal decision
A107 Divisional application of patent
AMND Amendment
B90T Transfer of trial file for re-examination
B601 Maintenance of original decision after re-examination before a trial
S901 Examination by remand of revocation
E902 Notification of reason for refusal
AMND Amendment
S601 Decision to reject again after remand of revocation
J201 Request for trial against refusal decision
AMND Amendment
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 5